DeepSeek-v3:AI 开源领域的一匹黑马,性能与成本的双重突破
DeepSeek-V3以6710亿参数、550万美元训练成本(仅为Llama-3.1的1/11),在代码、数学、中文等任务上逼近GPT-4o;采用MoE架构与FP8计算,推理成本低至每百万Token仅2元,支持商用开源,显著降低高性能AI使用门槛。
90 秒速通 OpenAI 12 天发布会
OpenAI 在12天密集发布中推出o1推理模型、文生视频Sora、ChatGPT Pro订阅(200美元),并深度整合苹果生态;新增多模态语音交互(含圣诞老人模式)、实时网络搜索、800电话语音接入及Mac端增强功能;API全面升级,CEO已预告下一代o3模型。
谷歌 MedLM:用生成式 AI 革新医疗行业
谷歌推出专为医疗场景优化的生成式AI模型MedLM,基于Med-PaLM 2微调,提供大模型与中等规模两种版本,已上线Vertex AI。正用于临床文书自动整理、药物研发知识挖掘及患者服务优化,助力医生减负、提升诊疗效率与体验。
如何将动漫视频转换成真人视频
DomoAI上线“现实模型(Real V1)”,支持一键将动漫视频转为真人或3D动画效果。用户上传视频后选择该模型,可选添加文字描述优化风格与人物表现;不输入提示词时系统自动智能处理。平台目前已集成超40款动漫风格转换模型。
如何通过 Krea.ai 和 Sora 制作潮流广告
Krea.ai 新增图像训练功能,上传3张商品图即可生成专属LoRA模型;结合ChatGPT生成提示词与Sora视频生成,电商团队无需模特和实拍,就能高效产出高质量潮流广告图与视频,大幅降低制作成本。
如何用 RenderNet 快速生成音乐视频
RenderNet 是一款 AI 音乐视频生成工具,用户上传慢节奏音频(如蓝调、抒情类)、输入画面描述(可含歌词或风格提示)并指定角色人像,几分钟即可生成高质量剪辑视频。支持多场景创意表达,操作极简,无需剪辑基础。
如何通过 Pixverse 3.5 制作格斗视频
Pixverse 3.5 显著提升格斗动作的流畅度与细节表现力。AIGC 达人 AZIZ 展示纯手机工作流:Midjourney 生成高精度格斗参考图,Pixverse 3.5 制作带紫色气劲特效的打斗视频,MMAudio 配音效,Suno 生成功夫风配乐,CapCut 完成剪辑。
Gemini 2.0:从聊天机器人到智能体的进化
Gemini 2.0 实现从对话到行动的跨越:原生支持自主调用搜索、代码解释器、地图等工具,完成多步协同任务;多模态能力更懂文化语境,可生成地域化图像与情境化语音;Flash 版性能反超前代 Pro;专注增强人类能力,为开发者提供构建实用智能体的新基座。
硅谷新贵:Pika 创始人郭文景访谈
硅谷成长、哈佛求学、斯坦福AI博士的郭文景创立Pika,坚持“艺术家主导、AI辅助”理念,团队三分之一为创意背景。产品聚焦AI视频生成工具而非全自动平台,已获融资超1.4亿美元,用户数百万。她认为AI视频正加速商业化,并强调创业者应做真正热爱的事。