毫末智行自动驾驶大模型亮相2023北京智源大会-Auto Thinker汽车智库平台

毫末智行自动驾驶大模型亮相2023北京智源大会

来源：毫末智行编辑：杨云鹤发布时间：2023-06-14 17:02

　　2023年4月的第八届 HAOMO AI DAY 上，基于 GPT 大模型所具有的生成式预训练、人类反馈强化学习(RLHF)等技术优势，毫末发布了行业首个自动驾驶生成式大模型 DriveGPT 雪湖·海若。

　　毫末 DriveGPT 底层模型同样是采用 GPT 这种生成式预训练大模型技术，首先会通过引入大规模驾驶数据进行预训练，再通过使用奖励模型(Reward Model)与RLHF(人类反馈强化学习)技术对人驾数据进行强化学习，对自动驾驶认知决策模型进行持续优化。

　　目前，毫末 DriveGPT 采用了 Decoder-only 模型架构，参数规模达到1200亿，预训练阶段引入4700多万公里量产车驾驶数据，RLHF 阶段引入5万段人工精选的困难场景接管 Clips。同时，毫末正在将感知能力融入到 DriveGPT 大模型训练当中，形成一整套的端到端自动驾驶能力模型。DriveGPT 也将具备道路驾驶场景的理解和识别、道路驾驶场景的重建与生成，以及智能驾驶辅助、驾驶能力测评等能力。

　　在场景理解能力上， DriveGPT 可基于多模态理解能力，具备对话式文搜图能力。在场景识别能力上，可实现对单帧图片、环视 Bundle、4D Clips 自动化标注。基于毫末 DriveGPT 所建立的 4D Clips 驾驶场景识别方案，可以使得单张图片的标注成本降到0.5元，是目前行业平均成本的1/10。在场景重建能力上，可实现对单趟或多趟视频的纯视觉 NeRF 三维重建。DriveGPT 在感知数据生成方面，可实现不同场景的感知数据生成和障碍物、交通元素编辑，同时在认知数据生成上，可以生成各类接管场景的驾驶决策真值。

　　在云端驾驶决策测评上，DriveGPT 本身的驾驶水平非常高，可以在云端通过大模型输出驾驶决策真值，来对比车端小模型的驾驶效果，实现大规模云端自动化测评，形成一种“Teacher-Student”模式。在多智能体仿真能力上，由于 DriveGPT 具备很强的自主化能力，相当于一个独立智能体，通过在驾驶仿真场景中布置多个智能体，可以模拟非常复杂的真实交通场景，针对复杂场景的多车交互与博弈，能给出更真实、更有效的测评结论。

　　在毫末看来，毫末 DriveGPT 大模型技术将使得自动驾驶技术产生质的飞跃，成为实现真正无人驾驶的全新技术路线。顾维灏表示，DriveGPT 的训练成果距离最终的产品体验还有差距，但是进步飞快，自动驾驶大模型最终在终端的落地也会加速到来。

　　毫末 DriveGPT 雪湖·海若大模型的相关技术成果将逐步落地在搭载毫末 HPilot3.0 的新摩卡 DHT-PHEV、魏牌蓝山 DHT-PHEV 以及末端物流自动配送车小魔驼3.0上。同时，毫末也正在与多个行业生态伙伴共同探索 DriveGPT 的四大应用能力，包括智能驾驶、驾驶场景识别、驾驶行为验证和困难场景脱困。DriveGPT 大模型也正在将云端的能力对外开放，包括大规模数据的自动化标注，自动驾驶场景仿真测试等能力。

相关企业：【毫末智行】【毫末智行】【毫末智行】

下一篇:玲珑轮胎与吉利汽车研究院成立数字化轮胎联合实验室

上一篇:采埃孚在华又一全新电驱动工厂开工

企业相关信息

【毫末智行】【毫末智行】【毫末智行】

毫末智行与映驰科技达成战略合作

查看详细 >

2月3日，毫末智行与映驰科技达成战略合作。

  2023-02-09 17:28  |智能网联|

科瑞客服

毫末智行自动驾驶大模型亮相2023北京智源大会

【毫末智行】 【毫末智行】 【毫末智行】

【毫末智行】【毫末智行】【毫末智行】