英伟达发布全开源物理AI大模型Cosmos3,支持多模态生成并显著缩短训练周期
英伟达于6月1日发布Cosmos3,一款面向物理人工智能的开放世界基础大模型。该模型采用混合Transformer架构,结合推理Transformer与专精生成类Transformer,基于包含数十亿条文本、图像、视频、音效及动作轨迹样本的多模态物理AI数据集训练而成。 Cosmos3原生支持文本、图像、视频、环境音效和动作内容的理解与生成,具备业界领先的物理仿真精度,可将物理AI的训练与评估周期从数月缩短至数日。在主流物理AI评测基准中,其世界生成精度、动作策略能力和视觉理解能力均位列第一。 该模型提供多个版本:Cosmos3Super适用于机器人与自动驾驶模型的二次训练;Cosmos3Nano可在数秒内完成高质量视频解析与动作推理;主打边缘端实时推理的Cosmos3Edge即将上线。 英伟达同时发起宇宙联盟(CosmosCoalition),联合全球世界模型研发团队与AI开发者,共同推进下一代世界模型技术发展。开发者可将Cosmos3作为多模态图文大模型、世界模型/视频基础模型或世界动作模型的主干网络使用。
评论0
最新资讯
相关资讯
请扫码下载网通社客户端
iPhone/iPad客户端
Andriod客户端
手机版 网通社汽车
- 经营许可证:京B-220170585号
- 京ICP备13031706号-2
- 广播电视节目制作许可证06725号
- 京公网安备 11010502058773号
- Copyright© 2012-2026聚众网通(北京)科技有限公司版权所有 未经许可不得转载


奇莉



