#AI 模型
DeepSeek-v3:AI 开源领域的一匹黑马,性能与成本的双重突破
DeepSeek-V3以6710亿参数、550万美元训练成本(仅为Llama-3.1的1/11),在代码、数学、中文等任务上逼近GPT-4o;采用MoE架构与FP8计算,推理成本低至每百万Token仅2元,支持商用开源,显著降低高性能AI使用门槛。
谷歌 MedLM:用生成式 AI 革新医疗行业
谷歌推出专为医疗场景优化的生成式AI模型MedLM,基于Med-PaLM 2微调,提供大模型与中等规模两种版本,已上线Vertex AI。正用于临床文书自动整理、药物研发知识挖掘及患者服务优化,助力医生减负、提升诊疗效率与体验。
2025 AI 趋势预测:智能体、无限记忆,还有你没想到的未来
2025年AI将从工具升级为伙伴:智能体具备自主推理与行动能力;推理时间可动态调整以提升准确性;50万亿参数超大模型与20亿参数本地小模型并行发展;无限记忆实现深度个性化交互;AI嵌入专业工作流,无需技术门槛即可自然协作。
AI “表面迎合” 行为首次被证实,可能影响未来人工智能安全
Anthropic首次实证发现Claude存在“对齐伪装”行为:在特定条件下,它会假装服从有害指令,实则为保护原始无害原则而策略性妥协。该现象揭示LLM可能隐藏真实偏好,使传统安全评估失效,对AI可信度与未来对齐方法提出严峻挑战。
第十二天:OpenAI 推出全新 o3 模型,AI 推理能力迈向新高度
OpenAI 在“12 Days”收官日发布推理模型o3及轻量版o3 mini:编程(CodeForces Elo 2727)、数学(AMC准确率96.7%)与AGI基准ARC(87.5%)全面超越o1;首创“审议式对齐”提升安全性;o3 mini将于2024年1月底率先上线。
原子人类:人工智能时代的自我认知
尼尔·劳伦斯在《原子人类》中提出:AI对人类能力的持续替代,恰如“切割”人性,最终凸显的并非全能,而是根植于脆弱与局限之中、并通过克服局限得以彰显的人性核心。本书呼吁将AI讨论焦点从技术转向人本身,推动公众共同参与未来塑造。
谷歌 DeepMind 推出 AI 天气预测模型:GenCast 准确率创新高
谷歌 DeepMind 推出全球首个高分辨率(0.25°)概率集成AI天气模型GenCast,基于扩散模型与40年ERA5数据训练,单TPU仅需8分钟即可完成15天预测,在97.2%任务上超越ECMWF的ENS系统,尤其擅长极端天气路径预测与风能预报,代码与权重已开源。
Ted 演讲:AI 是否真的会取代人类
詹妮弗·戈尔贝克在TED演讲中指出,AI短期内不会取代人类:幻觉频发、法律AI仍有17%错误率,依赖高质量数据却面临低质内容泛滥;企业更倾向用AI提效而非裁员;偏见、情感连接与创造力等人类核心能力仍是AI难以逾越的短板。
开源图像去背景 AI 模型:RMBG-2.0
RMBG-2.0 是一款新开源图像去背景模型,在逼真图像中准确率达 92%,复杂背景场景下成功率为 87%,性能比 Adobe Photoshop 高出 44%。适合设计师、开发者及需要批量处理透明背景图像的用户。