有没有比较懂 OCR 的

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

大概需求是客户上传点餐菜单的图片，然后系统去识别其中信息。还涉及一些特殊的逻辑，比如用户可以画一个框，只识别其中部分内容。详细需求可以加我发： https://ruilian-test.oss-cn-beijing.aliyuncs.com/%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20241213100913.jpg 涉及技术栈：图像文字识别、图像分析与对象检测、文字组合与结构分析、字体大小、定位与属性分析、模型训练

OCR

图像文字识别

特殊逻辑

4 条回复 • 2025-02-11 20:44:08 +08:00