Pixverse 4.5 来了,支持20种运镜,多主体参考和更好的运动效果
Pixverse 4.5 上线,新增20种运镜与多主体参考融合功能,人物与背景合成更自然,角色一致性与运动表现明显提升,已支持电影级视频生成;定价亲民,100积分/$1,每日登录赠60积分,可生成3段360p视频。
π0.5:迈向开放世界泛化机器人的基础模型
π0.5是Physical Intelligence推出的视觉-语言-行动(VLA)基础模型,通过多源异质数据协同训练,显著提升机器人在全新家庭环境中的泛化能力。它能理解物理操作与任务语义,完成清洁、整理等复杂长程任务,仅需约100个训练环境即可接近定制化训练效果,降低对海量场景数据的依赖。
阿里通义千问3(Qwen3):全球开源大模型的新王者
阿里发布通义千问3(Qwen3)全系列开源大模型,含235B MoE旗舰与0.6B–32B稠密模型,支持混合推理、119种语言及128K上下文。235B模型仅需4张H20即可部署,AIME25、LiveCodeBench等基准全面领先国际开源模型,Apache 2.0协议免费商用。
突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2
SkyReels-V2 是首个支持无限长度视频生成的开源模型,首创 Diffusion Forcing 机制实现任意时长无缝续写;在 T2V/I2V 任务中综合性能达开源领先水平,指令遵循性与一致性显著优于同类模型,部分指标媲美 Runway、Kling 等商业系统。
工业智能化转型:AI 与数字孪生引领制造业未来
AI与数字孪生正推动制造业从“试错”转向“预见”:工业元宇宙实现设备互联与实时预测;虚拟工程师辅助设计,仿真技术加速研发;机器人通过sim-to-real双向学习提升自主性,降低对人工编程依赖。
OpenAI 开源命令行编码助手 Codex
OpenAI 开源命令行编码助手 Codex,支持终端直连、文件读写、安全命令执行及 GitHub 代码库结构分析,帮助开发者快速理解项目并启动调试。提供交互式与全自动模式,具备沙盒隔离、多任务并行及多模态能力(如解析应用截图生成 HTML),提升效率与安全性。
OpenAI 发布 o3 和 o4-mini,模型推理与多模态能力迈入全新阶段
OpenAI发布o3与o4-mini,首次将工具调用深度融入思维链,支持数百次自动多轮操作;在编程(SWE-bench最优)、科研、法律等垂直领域表现突出;强化多模态推理,可处理低质图像并调用Python工具;配套Codex CLI提升本地自动化能力,兼顾性能、成本与实用性。
OpenAI 发布 GPT-4.1 系列,实现百万级上下文
OpenAI推出GPT-4.1系列,支持最高100万token上下文,显著提升长文档理解与复杂任务处理能力;新增mini、nano轻量版本,其中nano专为边缘计算优化,成本低、响应快;全系列支持微调,指令遵循更精准,百万token调用不额外收费。
谷歌发布 Agent2Agent 协议(A2A),实现智能体互动操作
谷歌发布开源Agent2Agent(A2A)协议,为异构AI智能体提供统一通信标准,支持跨厂商、跨框架协作,具备安全认证、长任务处理与多模态能力;通过“Agent Card”实现动态能力发现,已获超50家技术及咨询公司支持。