下载APP

扫码下载 网通社APP

扫码下载网通社APP

港大团队发布World Engine:自动驾驶后训练范式让碰撞暴降45.5%

智驾前沿 2026-06-25 09:25

香港大学李弘扬团队联合华为、上海创智学院及清华大学,正式发布World Engine论文,提出自动驾驶系统的“后训练”范式。这套框架将真实驾驶失败场景转化为可闭环交互的仿真世界,并利用强化学习对端到端模型进行针对性训练,在华为ADS的闭环验证中实现碰撞事件降低45.5%。

World Engine的技术核心由三部分构成:SimEngine基于3DGS将多趟真实驾驶日志重建为可交互的3D世界,并加入深度与法向监督提升几何稳定性;Behaviour World Model利用扩散模型,围绕已有失败案例泛化生成多样化的交通交互场景,而非仅做日志回放;Reinforcement Post-training则通过行为约束的强化学习,在提升长尾安全表现的同时避免灾难性遗忘。

港大团队发布World Engine:自动驾驶后训练范式让碰撞暴降45.5%-图1

在软件架构层面,World Engine将自动驾驶任务建模为POMDP,模型根据传感器观测输出驾驶动作,世界模型推演周围交通参与者的行为,SimEngine生成对应传感器观测,三者构成闭环训练环境。奖励函数覆盖碰撞避免、可行驶区域合规、行程进度、碰撞时间裕度和乘坐舒适性等维度,直接约束模型在闭环中的真实驾驶表现。

闭环验证显示,在643个rare cut-in测试案例中,碰撞事件从167次降至91次,降幅达45.5%。实车验证覆盖上海市区约200km道路,涵盖白天/夜晚、晴天/雨天等多种条件,全程0接管。论文指出,这一结果验证了后训练路线在工业级系统中的可行性。

港大团队发布World Engine:自动驾驶后训练范式让碰撞暴降45.5%-图2

李弘扬团队在论文中明确提出观点:“自动驾驶不能只被动等待真实世界碰巧采到危险场景,而应主动发现失败模式,合成安全关键交互,并在高保真世界中进行后训练。”这一思路与大语言模型从预训练到后训练(如RLHF)的演进逻辑高度一致。

从行业对比来看,World Engine的后训练路线与Wayve的端到端AI Driver、特斯拉FSD的数据驱动闭环形成差异化互补。当前行业共识正在从“更大规模预训练”转向“更高价值后训练”,World Engine为这一趋势提供了可验证、可扩展的技术框架。

港大团队发布World Engine:自动驾驶后训练范式让碰撞暴降45.5%-图3

论文同时指出,当前闭环交互的物理保真度与真实世界仍有差距,仿真环境中的传感器噪声模型、极端天气条件渲染等环节仍需持续优化。团队已开源代码与数据集,后续将推动更大规模、多场景的后训练验证。

World Engine的发布标志着自动驾驶研发正在经历类似DeepSeek R1的范式革命:预训练获得通用驾驶能力,后训练对齐安全边界。这一框架不只是一套仿真工具,而是将“Post-Training for Autonomous Driving”确立为一条可进入量产研发闭环的技术路线。

本内容来自网通社号创作者,不代表网通社的观点和立场。
分享到
微博
空间
网通社快报

2025-10-14 14:16 星期一

长按识别二维码
下载网通社客户端