推荐大家一款开源 AI Ocr 工具 Zerox OCR,可本地运行。
工作流程
- 提交一个文件(PDF、DOCX、图片等)
- 将该文件转换为一系列图像
- 将每个图像发送给GPT,让它转化成 Markdown 格式
- 汇总 Markdown 文档
推荐大家一款开源 AI Ocr 工具 Zerox OCR,可本地运行。
拆成可复用角色;hermes-agent 主打任务后自动沉淀技能、让智能体越用越聪明;Superpowers 以测试驱动流程串起开发全链路;Paperclip 则尝试用多智能体编排“零人工公司”。
Notion AI工程负责人Ryan Nystrom仅用三小时,借助Codex将移动端语音输入功能一次性迁移至网页与桌面端,全程单人操作、提示即生成可上线的生产级代码,印证AI辅助开发已能支撑真实产品迭代。
Adobe Firefly上线自定义图像模型功能,用户上传10张以上图片即可训练专属艺术风格模型,聚焦AI美学方向;但该能力比Midjourney晚半年推出,AI视频部分未采用自研模型,转而接入可灵2.6,引发对其技术节奏与生态策略的质疑。
围绕《开源 AI OCR 工具 Zerox OCR》展开交流,未登录用户可浏览评论,登录后可参与讨论。