haomo ai day：重磅发布三款千元级无图noh drivegpt具备世界知识可“识别万物”-ag娱乐平台官方网站

2023年10月11日，北京金秋时节，第九届haomo ai day如期而至。本届haomo ai day以 "better ai，better haomo"为主题。毫末重磅发布三款“极致性价比”千元级无图noh，全面满足高中低价位智驾车型量产需求；毫末发布的行业首个自动驾驶生成式大模型drivegpt雪湖·海若公布最新成果：共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4d clips数据；进一步升级引入多模态大模型，获得识别万物的能力；与nerf技术进一步整合，渲染重建4d空间；借助llm（大语言模型），让自动驾驶认知决策具备了世界知识。产品层面，搭载毫末城市noh功能的魏牌蓝山将在2024年第一季度正式量产上市；小魔驼即将在2023年第四季度在商超履约配送场景实现盈利。

(资料图片)

（毫末董事长张凯重磅发布三款“极致性价比”千元级hpilot产品）

成立近四年时间，毫末始终引领中国自动驾驶技术风向标，haomo ai day更成为中国自动驾驶技术的一面旗帜。毫末率先在行业布局大模型、大数据、大算力技术发展方向，冲刺自动驾驶3.0时代。

（毫末ceo顾维灏公布drivegpt发布200天重要成果）

毫末董事长张凯表示：“毫末一直在全力以赴投入到ai自动驾驶的技术浪潮中，毫末坚持的渐进式路线与对技术投入的长期主义，让毫末模式成为中国自动驾驶发展的新范式。”

（从左至右：毫末智行coo侯军、董事长张凯、ceo顾维灏、cio甄龙豹）

“2023年我国高阶智能辅助驾驶市场迎来大爆发。”活动现场，张凯以《better ai，better haomo》为主题，分享了对2023年智驾市场竞争局势的判断，以及毫末四大战役的最新进展。

（张凯介绍2023年中国高阶智能辅助驾驶市场迎来大爆发）

张凯介绍，目前乘用车销量和智能化指数都在稳步提升，同时智能驾驶渗透率与价格却呈反向增长，乘用车市场l2及以上智能驾驶渗透率达42.4%，2025年将达70%，并普及到10-20万的主销车型上；城市noa迎来量产上车潮，目前占l2及以上辅助驾驶份额的17%，2025年将达70%；行泊分体的硬件设计、一体机逐步退出市场，更具性价比的行泊一体的域控方案将成为主流。

为了迎战智驾市场的变化，现场，毫末重磅发布了hp170、hp370、hp570三款“极致性价比”智能辅助驾驶产品，预计将在2023年和2024年先后上车。

（重磅发布三款千元级hpilot产品）

张凯表示：“毫末全新发布的第二代hpilot乘用车辅助驾驶三款产品，价格打下来的同时性能都打了上去，让中阶智驾便宜更好用，让高阶智驾好用更便宜。”这也是2023年，毫末给中国如此“卷”的智驾市场交出的答卷。

毫末hp170是3000元级“极致性价比”的高速无图noh，可以实现行泊一体智驾。硬件配置上，算力5tops，传感器方案标配1个前视相机、4个鱼眼相机、2个后角雷达、12个超声波雷达，灵活选装1个前视雷达和2个前角雷达。场景上，可实现高速、城市快速路上的无图noh，短距离记忆泊车等功能，并获e-ncap 5星aeb的高安全标准认证。

（毫末hp170）

毫末hp370是5000元级“极致性价比”的城市记忆行车与记忆泊车，可以实现行泊一体智驾。硬件配置上，算力32tops，传感器方案标配2个前视相机、2个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、2个后角雷达、12个超声波雷达，灵活选装2个前角雷达。场景上，可实现高速、城快，以及城市内的记忆行车，免教学记忆泊车、智能绕障等功能。张凯表示：“毫末的记忆行车可看作毫末城市noh的最小集，是城市noh的强有力补充。”

（毫末hp370）

毫末hp570是8000元级“极致性价比”的城市全场景无图noh产品，未来将在100 城落地。硬件配置上，算力可选72tops和100tops两款芯片，传感器方案标配2个前视相机、4个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、12个超声波雷达，还支持选配1颗激光雷达。场景上，可实现城市无图noh、全场景辅助泊车、全场景智能绕障、跨层免教学记忆泊车等功能。张凯强调：“hp570平台的历史使命是打造行业内最具性价比的高阶城市智驾产品。”

（毫末hp570）

发布新产品的同时，张凯介绍了毫末2023年四大战役的最新成果。首先是“智能驾驶装机量王者之战”，在中国的自动驾驶公司中，毫末稳居中国量产自动驾驶第一名，辅助驾驶产品hpilot整体已搭载至超过20款车型，用户辅助驾驶行驶里程突破8700万公里。其中，最新搭载毫末hpilot的车型为山海炮hev版、新摩卡hi-4s等。

（毫末hpilot整体已搭载超过20款车型）

其次是“mana大模型巅峰之战”，drivegpt发布200天左右的时间里，累积480万段clips高质量测试。目前已有生态伙伴17家，助力生态伙伴提效90%。2023年drivegpt成功入选“北京市通用人工智能产业创新伙伴计划”成为首批模型伙伴观察员及入选北京市首批人工智能10个行业大模型应用案例。此外，drivegpt还助力毫末荣获2023中国ai基础大模型创新企业的称号。

（drivegpt发布200天的蝶变生长）

第三是“城市noh百城大战”，具备城市noh导航辅助驾驶功能的毫末hp550（原hpilot3.0），将搭载魏牌蓝山在2024年第一季度正式量产上市。现场，张凯和顾维灏首次公开测试搭载hp550的城市noh的魏牌蓝山视频曝光，在保定闹市区全程12公里的行驶中，历时35分钟，手动接管3次。其中包含21个红绿灯，7个路口转向……重感知路线的毫末城市noh展现出出色性能，尤其是面对拥堵道路、红绿灯交替以及非机混行等复杂场景，处理得非常自然，产品力行业领先。

（hp550将搭载魏牌蓝山在2024年第一季度正式量产上市）

最后是“末端物流自动配送商业之战”，末端物流自动配送车小魔驼3.0，售价89999元，是全球首款9万元内中型末端物流自动配送车，可以满足在物流、商超、零售等9大场景的需求，小魔驼3.0产品推出在中国无人车规模化商用的行业进程中具有里程碑式的意义。目前，小魔驼已配送超过22万单。小魔驼即将在2023年第四季度在商超履约配送场景实现盈利。从商业意义上，毫末具备了成为全球范围内首家拥有规模化盈利 l4业务公司的能力。

（毫末小魔驼3.0亮相）

演讲中张凯还介绍毫末总部已落户北京市顺义区，毫末将充分发挥在自动驾驶领域的技术和产业优势，助力顺义打造中国新能源智能汽车产业高地。

历届haomo ai day的核心主题都是聚焦最硬核的自动驾驶ai技术。此次，顾维灏带来了主题为《自动驾驶3.0时代：大模型将重塑汽车智能化的技术路线》的演讲，分享了毫末对于自动驾驶3.0时代ai开发模式的思考以及毫末drivegpt大模型的最新进展和实践。

顾维灏认为，自动驾驶3.0时代与2.0时代相比，其开发模式和技术框架都将发生颠覆性的变革。在自动驾驶2.0时代，以小数据、小模型为特征，以case任务驱动为开发模式。而自动驾驶3.0时代，以大数据、大模型为特征，以数据驱动为开发模式。

（毫末提出的自动驾驶3.0时代的技术架构演进趋势）

相比2.0时代主要采用传统模块化框架，3.0时代的技术框架会发生颠覆性变化。首先，自动驾驶会在云端实现感知大模型和认知大模型的能力突破，并将车端各类小模型逐步统一为感知模型和认知模型，同时将控制模块也ai模型化。随后，车端智驾系统的演进路线也是一方面会逐步全链路模型化，另一方面是逐步大模型化，即小模型逐渐统一到大模型内。然后，云端大模型也可以通过剪枝、蒸馏等方式逐步提升车端的感知能力，甚至在通讯环境比较好的地方，大模型甚至可以通过车云协同的方式实现远程控车。最后，在未来车端、云端都是端到端的自动驾驶大模型。

顾维灏还详细介绍了毫末drivegpt大模型在推出200天后的整体进展。首先是drivegpt训练数据规模提升。截止2023年10月drivegpt雪湖·海若共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4d clips数据。其次是通用感知能力提升，drivegpt通过引入多模态大模型，实现文、图、视频多模态信息的整合，获得识别万物的能力；同时，通过与nerf技术整合，drivegpt实现更强的4d空间重建能力，获得对三维空间和时序的全面建模能力；最后是通用认知能力提升，借助大语言模型，drivegpt将世界知识引入到驾驶策略中。

顾维灏认为，未来的自动驾驶系统一定是跟人类驾驶员一样，不但具备对三维空间的精确感知测量能力，而且能够像人类一样理解万物之间的联系、事件发生的逻辑和背后的常识，并且能基于这些人类社会的经验来做出更好的驾驶策略，真正实现完全无人驾驶。

毫末drivegpt是如何具备识别万物的通用感知能力，以及拥有世界知识的通用认知能力？顾维灏也给出了详尽解释。

（毫末drivegpt升级：大模型让自动驾驶拥有世界知识）

在感知阶段，drivegpt首先通过构建视觉感知大模型来实现对真实物理世界的学习，将真实世界建模到三维空间，再加上时序形成4d向量空间；然后，在构建对真实物理世界的4d感知基础上，毫末进一步引入开源的图文多模态大模型，构建更为通用的语义感知大模型，实现文、图、视频多模态信息的整合，从而完成4d向量空间到语义空间的对齐，实现跟人类一样的“识别万物”的能力。

（毫末drivegpt通用感知大模型：让自动驾驶认识万物）

毫末通用感知能力的进化升级包含两个方面。首先是视觉大模型的cv backbone的持续进化，当前基于大规模数据的自监督学习训练范式，采用transformer大模型架构，实现视频生成的方式来进行训练，构建包含三维的几何结构、图片纹理、时序信息等信息的4d表征空间，实现对全面的物理世界的感知和预测。其次是构建起更基础的通用语义感知大模型，在视觉大模型基础上引入图文多模态模型来提升感知效果，图文多模态模型可以对齐自然语言信息和图片的视觉信息，在自动驾驶场景中就可以对齐视觉和语言的特征空间，从而具备识别万物的能力，也由此可以更好完成目标检测、目标跟踪、深度预测等各类任务。

在认知阶段，基于通用语义感知大模型提供的“万物识别”能力，drivegpt通过构建驾驶语言（drive language）来描述驾驶环境和驾驶意图，再结合导航引导信息以及自车历史动作，并借助外部大语言模型llm的海量知识来辅助给出驾驶决策。

（毫末drivegpt认知大模型：让自动驾驶具备常识）

由于大语言模型已经学习到并压缩了人类社会的全部知识，因而也就包含了驾驶相关的知识。经过毫末对大语言模型的专门训练和微调，从而让大语言模型更好地适配自动驾驶任务，使得大语言模型能真正看懂驾驶环境、解释驾驶行为，做出驾驶决策。认知大模型通过与大语言模型结合，使得自动驾驶认知决策获得了人类社会的常识和推理能力，也就是获得了世界知识，从而提升自动驾驶策略的可解释性和泛化性。

（毫末drivegpt应用的七大实践）

在分享了最新drivegpt大模型技术框架后，顾维灏随后也给出了毫末基于drivegpt大模型开发模式的七大应用实践，包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

其中，在驾驶行为解释方面，毫末drivegpt在原有结合场景库及人工标注方式来对驾驶行为进行解释的基础上，升级为引入大语言模型来解释驾驶环境，让ai自己解释自己的驾驶决策。接下来，毫末会持续通过构建自动驾驶描述数据，来对大语言模型进行微调，让大语言模型能够像驾校教练或者陪练一样，对驾驶行为做出更详细的解释。

（驾驶行为解释：透视ai的思考过程）

驾驶环境预测方面，毫末drivegpt原来基于海量人驾数据预训练和接管数据的反馈强化学习来完成未来bev场景的预测生成，现在则在此基础上，进一步通过引入大语言模型，在使用驾驶行为数据的同时，让大语言模型对当前的驾驶环境给出解释和驾驶建议，然后再将驾驶解释和驾驶建议作为prompt输入到生成式大模型，来让自动驾驶大模型获得外部大语言模型内的人类知识，从而具备常识，才能理解人类社会的各种明规则、潜规则，才能跟老司机一样，预测未来最有可能出现的驾驶场景，从而与各类障碍物进行更好地交互。

（驾驶环境预测：生成未来世界）

车端模型开发模式变革方面，毫末正在尝试用蒸馏的方法，也就是用大模型输出的伪标签作为监督信号，让车端小模型来学习云端大模型的预测结果，或者通过对齐feature map的方式，让车端小模型直接学习并对齐云端的feature map，从而提升车端小模型的能力。基于蒸馏的方式，可以让车端的感知效果提升五个百分点。

（车端模型开发新模式：把大模型蒸馏成小模型）

此外，毫末drivegpt的驾驶场景理解可以对海量驾驶场景数据进行秒级特征搜索，从而实现更高效的数据筛选，为大模型挖掘海量高质量训练数据；驾驶场景标注是采用了开集（open-set）场景下的zero-shot自动标注，可实现对任意物体既快速又精准的标注，不仅可实现针对新品类的zero-shot快速标注，而且精度还非常高，预标注准召达到80%以上；驾驶场景生成，可以基于驾驶场景的文生图模型，通过文字描述批量生成平时难以获取的hardcase数据，实现无中生有的可控生成；对于驾驶场景迁移，基于aigc生成能力，可实现多目标场景生成，能将采集到的一个场景，迁移到该场景的不同时间、不同天气、不同光照等各类新场景下，可同时获取全天候驾驶数据，实现瞬息万变的高效场景迁移。

现场，顾维灏还给出了drivegpt赋能车端的三大测试成果：

第一个是毫末纯视觉自动泊车测试成果。毫末利用视觉感知模型，使用鱼眼相机可以识别墙、柱子、车辆等各类型的边界轮廓，形成360度的全视野动态感知，可以做到在15米范围内达到30cm的测量精度，2米内精度可以高于10cm。这样的精度可实现用视觉取代uss超声波雷达，从而进一步降低整体智驾方案成本。

（毫末纯视觉泊车）

第二个是毫末对交通场景全要素识别测试成果。drivegpt基于通用感知的万物识别的能力，从原有感知模型只能识别少数几类障碍物和车道线，到现在可以识别各类交通标志、地面箭头、甚至井盖等交通场景的全要素数据。大量高质量的道路场景全要素标注数据，可以有效帮助毫末重感知的车端感知模型实现效果的提升，助力城市noh的加速进城。

（城市noh全要素覆盖）

第三个是毫末城市noh对小目标障碍物检测的测试成果。毫末在当前城市noh的测试中，可以在城市道路场景中，在时速最高70公里的50米距离外，就能检测到大概高度为35cm的小目标障碍物，可以做到100%的成功绕障或刹停，这样可以对道路上穿行的小动物等移动障碍物起到很好地检测保护作用。

（毫末城市noh小目标障碍物检测）

顾维灏也提到，毫末drivegpt大模型的应用，在自动驾驶系统开发过程中带来了巨大技术提升，使得毫末的自动驾驶系统开发彻底进入了全新模式，新开发模式和技术架构将大大加速汽车智能化的进化进程。

本届haomo ai day再度齐聚自动驾驶领域超豪华嘉宾阵容。中国工程院院士、清华大学教授、清华智能产业研究院（air）院长张亚勤；清华大学车辆与运载学院副院长、长聘教授、博士生导师李升波发表主题演讲；合众新能源汽车cto戴大力；中汽创智智能驾驶cto张振林；美团自动车研发总监穆北鹏；达达快送产品与规划负责人郭瑜；火山引擎汽车行业总经理杨立伟；车云网&电动邦创始人、ceo程里等产业领军人物出席第九届haomo ai day尖峰对话环节，围绕“2023自动驾驶：乘风大模型，创造新范式”展开讨论。

（尖峰对话——2023自动驾驶：乘风大模型，创造新范式）

张亚勤发表了题为《big model, generative al and intelligent driving》的主题演讲，他表示：“ai大模型带来了从判别式ai到生成式ai的新技术范式变革，清华air正在利用生成式ai来构建自动驾驶仿真平台以及real2sim2real基础模型平台。同时，清华air与毫末智行在数据驱动决策优化方向展开深入探索，共同推动全方位、多层次的产学研深度合作，加速ai技术在自动驾驶领域的落地应用。”

（张亚勤出席第九届毫末ai day）

李升波表示：“自动驾驶是人工智能的皇冠明珠，算法的突破与数据的累积使得汽车驾驶智能性呈现快速发展的态势，这也是自动驾驶技术的重点发展方向。毫末智行近年于数据驱动的感知、预测、决控方向进行了突破性探索，取得了一系列前瞻技术，为生成式人工智能的自动驾驶应用做出了有益尝试。”

（李升波出席第九届毫末ai day）

演讲结尾，顾维灏提到：“毫末即将成立四周年，一约既定，万山无阻。毫末人将继续用ai连接更广阔的世界，用技术叩问更浩远的未来。”

张凯表示：“风好正扬帆，毫末人将始终秉持初心，保持创业者的激昂斗志，共同实现自动驾驶的梦想。”

推荐内容

haomo ai day：重磅发布三款千元级无图noh drivegpt具备世界知识可“识别万物”

海底捞邵志东谈餐企创新：组织创新是根源，制度创新是保障

广州酒家潘建国：“五个一”数字化模式，推动食品安全管理

文德南、人民南、海珠中……广州多个历史文化街区保护规划公布

广州入选全国首批国家知识产权保护示范区建设城市

“不发文章、不急职称”，他回国10年追赶世界先进水平

太二的风头要被这些平价酸菜鱼快餐抢走了

工信领域数据安全风险评估细则公开征求意见，细化标准或持续落地

海信新风空调的场景驱动，联手用户撬开产业向上生长的大门

《2023年中国餐饮数智化发展报告》：餐饮数智化规模将达117.63亿

墨比优创董事长何流：五大赋能，成就千店、万店品牌

淘宝想用ai打败小红书｜产品观察

泡泡玛特打造强大护城河，国内ip做乐园胜算几何？

“过度炒作”的生成式ai将在2024年遇冷？微软正在亏钱

氢燃料电池技术实现零的突破：这艘“氢舟”完成首航

绍兴：加大个人住房按揭贷款支持 调整首套住房最低首付比例至20%

2023世界体育名城发展峰会在南京举办

什么是定位托盘，定位托盘租赁又是什么？

亚运热点频出背后，看快手体育内容运营之道

仁东控股受损股民有望获赔 律师：投资者仍可报名参加索赔

智慧家庭这艘大船，亟待领航者的出现

业绩预告亮眼，rio母公司百润股份为何会失宠?

大城名园 万物和谐｜想走进真菌世界？周末到“蘑菇课堂”了解一下

9月汽车产销量均创历史新高，全年销量有望冲刺2900万辆

近三年来受理处理调解申请1.7万余件 北京保险业致力打造调解工作样板、助力金融消保高质量发展

北京检察机关依法对李玉君涉嫌受贿案提起公诉

汉源东方董事长陈新時：产品战略就是餐饮元战略

要做新能源越野suv普及者，哈弗猛龙有这个实力吗？

国货依赖直播带货的路子，是不是“走偏了”？

慧运营黄建军：连锁门店运营究竟难在何处？

文库赚养老金，方法简单，做半年养十年，一文养三代，全是干货！

整治收走学生电动车，华农最新回应

广州公交警方：行拘！一男子地铁上猥亵女子

明天云量进一步减少，空调又要开起来

科学家建立全球大气光学湍流预测模型

中国创新方法大赛8年助力7万余企业科技人才

600余位代表将参加世界女科学家大会

广东丹霞山发现新物种“黄色丹霞杆菌”

我国学者构建出深度脉冲神经网络学习框架“惊蜇”

广州开展第二批资本市场金融科技创新试点工作 打造数字金融标杆城市

以色列国防军炮击黎巴嫩南部

动漫游戏产业现状未来 谋定研究·中国智库：规模热门题材

动漫游戏现状 谋定论道·国研智库：供给端已实现全面复苏

湖南动漫游戏产业 谋定研究·中国智库：驶入生态体系发展快轨

2023年动漫产业 谋定研究中国智库：行业区域格局分析布局

文化产业园702家 谋定研究·中国智库：广州市迈向动漫游戏之都

广州北站东侧成片连片改造正式开工 126个老旧小区及周边将迎来崭新面貌

广南联络线开工！今后广州出发1小时可达香港

美国科学机构的资助将达到25年来最低水平

2023（第八届）世界物联网大会即将在北京召开

薛红卫已任华南农业大学党委副书记、校长

古典音乐使听众的心跳和出汗同步

守门员有与众不同的感官能力

招商蛇口摇号斩获上海今年第三批次土拍浦东三林环外区域地块

双节假期循环经济消费如何？二手经典设计受追捧 江浙购买力领先

对话中国科学技术信息研究所所长赵志耘：国内大模型与世界最先进水平存在3点差距

不止有音乐会，原神宣布将与雅马哈联动，钢琴也要成周边了？

曾经做出火爆休闲男鞋的品牌，承包了“年轻人的第一件冲锋衣”

更敏捷的供应链-供应链未来趋势

厂一代的时代抉择：在跨境电商开启新故事

沙利文联合头豹研究院发布《2023年中国消费类企业融资发展与展望白皮书》

今日起调图，广州南站至重庆、成都、贵阳、桂林时间缩短

肆意生长！古风“潮人” 动漫“潮人”为何在广州积聚？

5.35亿年前的肌肉化石揭秘环神经动物的翻吻行为

科学家揭示城市街区微观尺度“碳中和”潜力

科学家揭示精神分裂症跨尺度环路机制

我国将迈入“多信使天文学新时代”

单分子电化学研究获新进展

云仓酒庄的2023丰富产品线与加大市场拓展力度

泰康人寿财富闭环布局再落一子 公司已获经营证券期货业务许可证

2023年第三季度北京零售物业新增86.5万平方米

暴跌35%！巴菲特紧急“撤退”，1900亿巨头暴雷

奶蓟草、朝鲜蓟、姜黄素...热门“护肝成分”大揭秘，后悔没早知道！

【资讯】 | 【藏界资讯】解密：敦煌壁画里神秘花树的含义

马斯克为新型减肥药“站台”，概念股大涨！食品饮料行业或受冲击

市值缩水超8000亿！产能过剩危机隐现，“宁王”高增长还能持续？

阴雨天气暂停天气立马显得有点热，下一股冷空气周末来

长白山40米口径射电望远镜建设项目启动

葡萄渣也能做饲料？

绍兴：加大个人住房按揭贷款支持调整首套住房最低首付比例至20%

仁东控股受损股民有望获赔律师：投资者仍可报名参加索赔

大城名园万物和谐｜想走进真菌世界？周末到“蘑菇课堂”了解一下

近三年来受理处理调解申请1.7万余件北京保险业致力打造调解工作样板、助力金融消保高质量发展

广州开展第二批资本市场金融科技创新试点工作打造数字金融标杆城市

动漫游戏产业现状未来谋定研究·中国智库：规模热门题材

动漫游戏现状谋定论道·国研智库：供给端已实现全面复苏

湖南动漫游戏产业谋定研究·中国智库：驶入生态体系发展快轨

2023年动漫产业谋定研究中国智库：行业区域格局分析布局

文化产业园702家谋定研究·中国智库：广州市迈向动漫游戏之都

双节假期循环经济消费如何？二手经典设计受追捧江浙购买力领先

泰康人寿财富闭环布局再落一子公司已获经营证券期货业务许可证