当开车遭受变谈、加塞等场景时,驾驶员相同会下领路地激活我方的"安全驾驶念念维"体育游戏app平台,从而作念出激进的侧目举止。
与之近似,自动驾驶汽车在上述场景中,更会发挥得像个讷言敏行的"生手司机",这是因为模子的有操办相同依赖于工程师预设的固定例则,进而导致"不求无功,但求无过"的驾驶格调,但过多的无故急刹、过度消散反而会激发格外的安全隐患。
针对上述问题,来自香港大学、英伟达和德国图宾根大学的和洽团队建议 Centaur(Cluster Entropy for Test-time trAining using UnceRtainty)步地,省略动态地改善驾驶战术,通过在线的数据起程点,开脱了对预设端正的依赖,大幅提高了自动驾驶汽车在不笃定性场景中的相宜性与安全性。
Centaur 在测试推理流程中动态地拯救模子权重,相宜 OOD 场景,提高泛化武艺。模子哄骗 Cluster Entropy 动作自监督信号,并初度将 Test-Time Training(TTT)应用于端到端自动驾驶,幸免手动端正和老本函数,及时减少不笃定性并校阅瞻望,借由在线数据起程点结束了轨迹瞻望的可扩张性。
论文已上传 arXiv,代码、checkpoint 等行将开源。
控制不笃定性
相同来说,模子是奈何掂量我方输出不笃定性的?一种直不雅的步地是不雅察模子输出的划分情状,并基于"固定采样下,模子的输出标的越连合,越靠近模子的最高置信度"的假定,来计较模子输出的聚类进度,从而侧面掂量出模子输出的不笃定性。
Cluster Entropy 通过轨迹采样、聚类和熵计较来评估自动驾驶模子的不笃定性。比拟传统的步地,它统一了直行、渺小右转、剧烈右转、渺小左转和剧烈右转的举止聚类,使得不笃定性料想更具可解说性。举例,当模子靠近复杂的交叉路口时,Cluster Entropy 能直不雅反馈不同驾驶有操办的不笃定性,从而匡助优化自动驾驶系统的安全性。
边行驶边进化
TTT 在推理流程中哄骗 Cluster Entropy 动作自监督观念,通过梯度优化让模子自相宜地拯救特征表征,从而提高对 OOD 场景的相宜武艺。
具体而言,模子通过计较 Cluster Entropy,判断现时环境的 OOD 级别。要是模子对现时环境的领路较差,则触发 TTT 检修流程,通过梯度下跌对特征索求网罗进行小幅度更新,使其更相宜现时环境特征划分。这一步地使得 Centaur省略在推理时自相宜地优化本身,在 OOD 场景中保捏厚实的感知和驾驶武艺,而无需依赖固定例则或东谈主工联想的老本函数。
实测接近东谈主类驾驶水平,安全性能全面提高
在 navtest 基准测试中,Centaur 的空洞贪图与驾驶方针得分(PDMS)获得了92.6%的得益,远远杰出了基于回退的步地,并接近东谈主类驾驶水平 。此外,Centaur 在碰撞幸免和碰撞时辰等要道方针上亦发挥出不凡的性能。
为了更好地评估自动驾驶系统在安全要道场景中的发挥,咱们建议了navsafe 数据集,挑升用于测试端到端驾驶步地的安全性和鲁棒性。它基于 navtest,并统一了真正的事故数据,通过细粒度的评分机制,量化了自动驾驶模子的不同驾驶武艺,而不像 navtest 只提供全体分数。
此外,Cluster Entropy 动作不笃定性度量器具,结束了 PDMS 的显赫提高,并在失败检测任务中, 获得了最好着力。
论文地址: https://arxiv.org/abs/2503.11650体育游戏app平台