小米发布并开源自动驾驶模型 Xiaomi OneVL,统一 VLA 与世界模型框架
小米于5月13日正式发布并开源自动驾驶模型XiaomiOneVL,该模型采用一步式潜空间语言视觉推理框架。小米创始人、董事长兼CEO雷军表示,XiaomiOneVL在业内首次通过潜空间推理,将视觉语言动作模型(VLA)与世界模型整合至同一套框架中。该模型在推理、规划等多个主流基准测试中,刷新了潜空间推理方法的性能上限。 据官方介绍,XiaomiOneVL在融合XLA模型强大推理能力的基础上,显著提升了推理速度与精度。其潜空间推理方案在精度上优于显式思维链(CoT)方法,在速度上与“仅答案”预测的潜空间CoT方案相当。小米已全面开源XiaomiOneVL的模型权重及训练、推理代码,并开放技术报告、项目主页和代码仓库供全球开发者与研究人员使用。
评论0
热门资讯
最新资讯
相关资讯
请扫码下载网通社客户端
iPhone/iPad客户端
Andriod客户端
手机版 网通社汽车
- 经营许可证:京B-220170585号
- 京ICP备13031706号-2
- 广播电视节目制作许可证06725号
- 京公网安备 11010502058773号
- Copyright© 2012-2026聚众网通(北京)科技有限公司版权所有 未经许可不得转载


奇莉
刘帅


