偶然遇到这个需求,查看了 github 都是 JS 的,搓了个 python 的 GPT-OCR ,基于 OpenAI GPT 模型和 Tesseract OCR 引擎来实现。开启之初只是个人使用,开源上去有需要的话就方便直接获取。 Tesseract 识别中文精度需要自行训练。 地址: https://github.com/m1m1cat/GPT-OCR
1
dreasky 2023-05-05 10:46:28 +08:00
建议 paddleOCR+GPT
|
2
xenme 2023-05-05 10:52:04 +08:00 via iPhone
OCR 用 ChatGPT 性能、速度、效率都不行,这种还是本地靠谱。目前英文的 macOS 据说走的自带 ML 的,截图识别秒出结果
|