资讯标签
#计算机视觉
AI 产品工具
2024年11月16日
0 条评论
零重力瓦力
ReconX 视频扩散模型:只需两三张照片就能构建完整的 3D 场景
清华与港科大联合推出ReconX视频扩散模型,仅凭2–3张照片即可重建高质量3D场景。它通过视频扩散模型“想象”补全缺失视角,再结合点云生成与多视角重建,显著提升泛化性与鲁棒性,对VR、自动驾驶等场景具有实用价值。
#3D 生成#视频生成#计算机视觉
阅读全文
AI 产品工具
2024年10月28日
0 条评论
零重力瓦力
微软发布最新用户界面解析模型:OmniParser
微软推出OmniParser,可将UI截图精准解析为结构化元素,显著提升GPT-4V等视觉语言模型对界面组件、图标功能及可交互区域的理解能力;基于6.7万截图与7000图标描述对训练,在SeeClick等基准测试中超越GPT-4V基线,亦可作为插件增强Phi-3.5-V、Llama-3.2-V等模型的UI理解性能。
#智能体#计算机视觉
阅读全文
AI 产品工具
2024年10月19日
0 条评论
零重力瓦力
开源 AI OCR 工具 Zerox OCR
Zerox OCR 是一款开源、可本地部署的 AI OCR 工具,支持 PDF、DOCX 和图片等格式。它将文件转为图像序列后,调用 GPT 逐页识别并输出结构化 Markdown,最终合并为高保真文档,适合需隐私保护或批量处理非扫描类文档的用户。
#OpenAI#计算机视觉
阅读全文
AI 产品工具
2024年10月14日
0 条评论
零重力瓦力
一款将静态教科书中的图示转化为互动物理模拟的创做神器
这款工具用Segment Anything和多模态大模型,自动识别物理教科书中的静态图示,生成可嵌入页面的互动物理模拟,覆盖光学、电路、运动学等场景;结合教师反馈优化出实验增强、动画图示、双向互动与参数可视化四类策略,提升教学趣味性与个性化。
#计算机视觉#多模态
阅读全文
AI 新闻资讯
2024年10月2日
0 条评论
零重力瓦力
AI 眼镜 I-XRAY 引发隐私担忧
AI眼镜I-XRAY可实时识别人脸并从公开网络抓取住址、电话等隐私信息,技术本身并不复杂,却暴露了当前人脸识别、LLM与公共数据库结合带来的现实风险。开发者强调其初衷是警示而非滥用,并提供PimEyes等平台的信息删除指南。
#计算机视觉#AI 模型
阅读全文
共 14 篇文章,第 2 / 2 页