当前位置: 网通社快报 > 小米发布XiaomiOneVL自动驾驶框架并开源代码
小米发布XiaomiOneVL自动驾驶框架并开源代码
小米近日发布XiaomiOneVL,该框架为一步式潜空间语言视觉推理系统,首次在行业内统一了视觉语言动作模型(VLA)、世界模型和潜空间推理等技术路线。XiaomiOneVL通过“语言推理+视觉未来预测”的双重监督机制,将可解释性与对未来场景的预测能力整合进潜空间推理过程,在推理精度上超越显式思维链(CoT)方法,同时在推理速度上与仅输出答案的潜空间CoT方案相当。 该框架基于三项关键技术:模型使用“内部语言”进行思考、具备预测未来画面的能力、并将整个推理过程压缩至单步完成,旨在提升自动驾驶系统对当前场景及未来时空因果关系的理解能力,以支持更高质量的决策。 小米已全面开源XiaomiOneVL的模型权重及训练、推理代码,向全球开发者和研究人员开放,以促进自动驾驶大模型的技术迭代与发展。
最新资讯
相关资讯
请扫码下载网通社客户端
iPhone/iPad客户端
Andriod客户端
手机版 网通社汽车
- 经营许可证:京B-220170585号
- 京ICP备13031706号-2
- 广播电视节目制作许可证06725号
- 京公网安备 11010502058773号
- Copyright© 2012-2026聚众网通(北京)科技有限公司版权所有 未经许可不得转载


刘帅



卓陆