创艺提示符

帮你写出更好的提示词

登录注册免费开始

资讯标签

资讯首页/#计算机视觉

#计算机视觉

AI 产品工具

2024年11月16日

零重力瓦力

ReconX 视频扩散模型：只需两三张照片就能构建完整的 3D 场景

清华与港科大联合推出ReconX视频扩散模型，仅凭2–3张照片即可重建高质量3D场景。它通过视频扩散模型“想象”补全缺失视角，再结合点云生成与多视角重建，显著提升泛化性与鲁棒性，对VR、自动驾驶等场景具有实用价值。

#3D 生成#视频生成#计算机视觉

AI 产品工具

2024年10月28日

零重力瓦力

微软发布最新用户界面解析模型：OmniParser

微软推出OmniParser，可将UI截图精准解析为结构化元素，显著提升GPT-4V等视觉语言模型对界面组件、图标功能及可交互区域的理解能力；基于6.7万截图与7000图标描述对训练，在SeeClick等基准测试中超越GPT-4V基线，亦可作为插件增强Phi-3.5-V、Llama-3.2-V等模型的UI理解性能。

#智能体#计算机视觉

AI 产品工具

2024年10月19日

零重力瓦力

开源 AI OCR 工具 Zerox OCR

Zerox OCR 是一款开源、可本地部署的 AI OCR 工具，支持 PDF、DOCX 和图片等格式。它将文件转为图像序列后，调用 GPT 逐页识别并输出结构化 Markdown，最终合并为高保真文档，适合需隐私保护或批量处理非扫描类文档的用户。

#OpenAI#计算机视觉

AI 产品工具

2024年10月14日

零重力瓦力

一款将静态教科书中的图示转化为互动物理模拟的创做神器

这款工具用Segment Anything和多模态大模型，自动识别物理教科书中的静态图示，生成可嵌入页面的互动物理模拟，覆盖光学、电路、运动学等场景；结合教师反馈优化出实验增强、动画图示、双向互动与参数可视化四类策略，提升教学趣味性与个性化。

#计算机视觉#多模态

AI 新闻资讯

2024年10月2日

零重力瓦力

AI 眼镜 I-XRAY 引发隐私担忧

AI眼镜I-XRAY可实时识别人脸并从公开网络抓取住址、电话等隐私信息，技术本身并不复杂，却暴露了当前人脸识别、LLM与公共数据库结合带来的现实风险。开发者强调其初衷是警示而非滥用，并提供PimEyes等平台的信息删除指南。

#计算机视觉#AI 模型

共 14 篇文章，第 2 / 2 页