开源通用智能体:Suna
Suna 是 Kortix AI 推出的开源通用智能体,支持浏览器自动化、文件操作、网络爬虫、命令行执行、网站部署及多 API 集成,能通过自然对话完成竞品分析、报告撰写、数据抓取、邮件起草等数十种实际任务,提供本地部署与在线试用两种方式。
FramePack:实现单图一次性生成 60 秒视频
FramePack 是斯坦福大学提出的新型视频生成方法,通过动态帧重要性分配与定制化 patchifying kernel,将计算复杂度降至常数级,显著缓解长视频生成中的质量衰减与“漂移”问题;仅需6GB显存即可在笔记本上一次性生成30fps、最长60秒的高质量视频。
Midjourney v7 + 可灵 2 视频特效
AI创作者MayorkingAI用Midjourney v7生成图像、可灵2生成视频,协同完成10段高质感特效短片:翼装穿越险峰、摩托腾空扬尘、林间飞驰滑雪、巨鲸跃出金海……融合FPV、慢动作、360°环绕等电影级运镜,细节锐利,光影真实,展现AIGC视频新高度。
可灵2、Runway Gen-4、Sora、Veo 2 四款 AI 生成模型对比
对比可灵2、Runway Gen-4、Sora与Veo 2四款AI视频模型,通过狮子驾吉普、雪人与大脚怪合奏、空间站漂浮、东京雨夜超跑等高难度提示词实测,考察其在物理逻辑、动态细节、光影质感、长程一致性和电影级表现力上的真实能力差异。
突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2
SkyReels-V2 是首个支持无限长度视频生成的开源模型,首创 Diffusion Forcing 机制实现任意时长无缝续写;在 T2V/I2V 任务中综合性能达开源领先水平,指令遵循性与一致性显著优于同类模型,部分指标媲美 Runway、Kling 等商业系统。
3 分钟讲清 什么是 MCP
MCP(模型上下文协议)是当前热门的AI连接标准,像“USB接口”一样统一模型与工具、数据的交互方式。它让大模型能动态调用外部能力,如抓取YouTube字幕、生成摘要并写入文件,显著降低开发门槛,提升智能体实用性。
什么是垂直智能体
垂直智能体是深耕医疗、法律、金融等垂直领域的AI助手,深度融合行业知识、数据与工作流程,支持自然语言交互,可自主完成合同起草、诊断辅助、客户服务等专业任务。相比传统SaaS,它以结果为导向,降低操作门槛,提升效率,并能无缝集成现有API系统。
微软发布万能 Office 文档转换 MCP 服务器:markitdown-mcp
微软推出 markitdown-mcp 工具,专注从 Office 文档、PDF、音视频、网页等数十种格式中提取语义化内容,输出结构清晰的 Markdown;不追求样式还原,专为大模型输入、文本分析与知识挖掘优化,支持 CLI、Python API、插件扩展及 Azure 文档智能集成。
微软推出 BitNet 推理框架,实现 1-bit 大模型本地部署
微软开源 BitNet 推理框架,支持 1-bit/1.58-bit 极致量化,可在单 CPU 上本地运行 100B 级大模型,x86/ARM 平台加速 1.37–6.17 倍,能耗降超 70%,兼容 Llama3、Falcon3 等主流模型,显著降低大模型部署门槛。