开源 AI OCR 工具 Zerox OCR

Zerox OCR 是一款开源、可本地部署的 AI OCR 工具,支持 PDF、DOCX 和图片等格式。它将文件转为图像序列后,调用 GPT 逐页识别并输出结构化 Markdown,最终合并为高保真文档,适合需隐私保护或批量处理非扫描类文档的用户。

发布于2024年10月19日 06:19
作者零重力瓦力
评论0
阅读2

推荐大家一款开源 AI Ocr 工具 Zerox OCR,可本地运行。

工作流程

  1. 提交一个文件(PDF、DOCX、图片等)
  2. 将该文件转换为一系列图像
  3. 将每个图像发送给GPT,让它转化成 Markdown 格式
  4. 汇总 Markdown 文档
Zerox 项目地址 Zerox 试用地址

相关文章

互动讨论

评论区

围绕《开源 AI OCR 工具 Zerox OCR》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。