首页 > 汽车舆情 > 企业监测-零部件 > 毫末智行自动驾驶大模型亮相2023北京智源大会
毫末智行自动驾驶大模型亮相2023北京智源大会

来源:毫末智行 编辑:杨云鹤 发布时间:2023-06-14 17:02

  2023年4月的第八届 HAOMO AI DAY 上,基于 GPT 大模型所具有的生成式预训练、人类反馈强化学习(RLHF)等技术优势,毫末发布了行业首个自动驾驶生成式大模型 DriveGPT 雪湖·海若。

  毫末 DriveGPT 底层模型同样是采用 GPT 这种生成式预训练大模型技术,首先会通过引入大规模驾驶数据进行预训练,再通过使用奖励模型(Reward Model)与RLHF(人类反馈强化学习)技术对人驾数据进行强化学习,对自动驾驶认知决策模型进行持续优化。

  目前,毫末 DriveGPT 采用了 Decoder-only 模型架构,参数规模达到1200亿,预训练阶段引入4700多万公里量产车驾驶数据,RLHF 阶段引入5万段人工精选的困难场景接管 Clips。同时,毫末正在将感知能力融入到 DriveGPT 大模型训练当中,形成一整套的端到端自动驾驶能力模型。DriveGPT 也将具备道路驾驶场景的理解和识别、道路驾驶场景的重建与生成,以及智能驾驶辅助、驾驶能力测评等能力。

  在场景理解能力上, DriveGPT 可基于多模态理解能力,具备对话式文搜图能力。在场景识别能力上,可实现对单帧图片、环视 Bundle、4D Clips 自动化标注。基于毫末 DriveGPT 所建立的 4D Clips 驾驶场景识别方案,可以使得单张图片的标注成本降到0.5元,是目前行业平均成本的1/10。在场景重建能力上,可实现对单趟或多趟视频的纯视觉 NeRF 三维重建。DriveGPT 在感知数据生成方面,可实现不同场景的感知数据生成和障碍物、交通元素编辑,同时在认知数据生成上,可以生成各类接管场景的驾驶决策真值。

  在云端驾驶决策测评上,DriveGPT 本身的驾驶水平非常高,可以在云端通过大模型输出驾驶决策真值,来对比车端小模型的驾驶效果,实现大规模云端自动化测评,形成一种“Teacher-Student”模式。在多智能体仿真能力上,由于 DriveGPT 具备很强的自主化能力,相当于一个独立智能体,通过在驾驶仿真场景中布置多个智能体,可以模拟非常复杂的真实交通场景,针对复杂场景的多车交互与博弈,能给出更真实、更有效的测评结论。

  在毫末看来,毫末 DriveGPT 大模型技术将使得自动驾驶技术产生质的飞跃,成为实现真正无人驾驶的全新技术路线。顾维灏表示,DriveGPT 的训练成果距离最终的产品体验还有差距,但是进步飞快,自动驾驶大模型最终在终端的落地也会加速到来。

  毫末 DriveGPT 雪湖·海若大模型的相关技术成果将逐步落地在搭载毫末 HPilot3.0 的新摩卡 DHT-PHEV、魏牌蓝山 DHT-PHEV 以及末端物流自动配送车小魔驼3.0上。同时,毫末也正在与多个行业生态伙伴共同探索 DriveGPT 的四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证和困难场景脱困。DriveGPT 大模型也正在将云端的能力对外开放,包括大规模数据的自动化标注,自动驾驶场景仿真测试等能力。

企业相关信息
【毫末智行】 【毫末智行】 【毫末智行】

毫末智行与映驰科技达成战略合作

2月3日,毫末智行与映驰科技达成战略合作。

  2023-02-09 17:28  |智能网联|

热门

本周

本月