百度王亮:智能汽车时代的自动驾驶技术共生

2022年11月8日-10日,由中国汽车工业协会主办的第12届中国汽车论坛在上海嘉定举办。作为党的“二十大”召开后的汽车行业首场盛会,本届论坛以“聚力行稳 蓄势新程”为主题,共设置“1场闭门峰会+1个大会论坛+16个主题论坛”,以汽车产业的高质量发展为主线,与行业精英一起贯彻新精神,研判新形势,共商新举措。其中,在11月9日下午举办的“主题论坛1:第四届全球汽车技术发展领袖峰会”上,百度智能驾驶事业群组技术委员会主席王亮发表精彩演讲。以下内容为现场演讲实录:

百度王亮:智能汽车时代的自动驾驶技术共生

各位专家,各位行业同仁,大家下午好!我叫王亮,来自百度。

很荣幸受到组委会的邀请,参加2022年中国汽车论坛,有机会与各位行业技术领袖一起进行一场关于技术创新的面对面交流,机会非常难得。我今天分享的主题是智能汽车时代的自动驾驶技术共生。

“共生”一词大家可能会有些陌生,百度这个词条,字典给出的定义是:“不同生物生活在一起,相依生存,对彼此都有利的一种生存方式”。

今天,与各位做分享的汽车行业专家相比,我是来自科技公司、互联网公司,大家的技术背景、经历各异,我个人是算法背景的工程师出身。我们同处汽车智能化的大赛道下,如何贡献自己的技术强项,与大家互利,为用户创造更大价值,是今天我想与大家重点探讨的问题。

大会上很多分享都提到汽车行业正在经历百年一遇的变革,电动化、智能化正在以超出我们预估的速度到来。我们认为,本轮变革分为三个阶段:电动化、智能化、智能电动车(Smart EV),每个阶段都遵循创新扩散理论。理论认为人类社会中5%的人是创新者,什么新鲜的科技都想尝试一下,10%的人是早期用户,愿意尝鲜,同时关注一定的实用性。最后是早期大众,十分观众实用性,大量的创新没有办法从早期用户跨越到早期大众,称之为“鸿沟”。

阶段一:电动化。凭借国家政策的支持,比如特斯拉Model 3、比亚迪和新势力成功车型的引领作用,三电技术的巨大进步,2019年开始有“跨沟”的迹象,2021年完成了“跨沟”。

阶段二:智能化。紧随其后是汽车的智能化,通过内部分析认为2023、2024年终端将有50%左右的使用者在充分尝试了高阶智能驾驶,这里的“高阶”指的是定义为具备在复杂城市道路下进行领航辅助驾驶能力的自动驾驶优秀供给会出现,并通过几年的迭代最终在2025年实现智能化自动驾驶功能的跨沟。

跨沟意味着什么呢?现在大家买车的时候,头部的考虑因素包括车的颜值、车内空间、车的屏幕大小、屏幕多少等,但很少有用户把自动驾驶囊括在最顶层的选车考虑因素中。

到了2025年,用户去一家4S店买智能汽车的时候会问这辆车有没有城市道路领航辅助驾驶功能,如果说没有大家会觉得很奇怪。想象一下今天去买手机,如果发现手机只有一个后视摄像头,大概率你会觉得这肯定不是最新一代的领先智能机。

进入第三阶段,智能电动车开始综合竞争的时候,功能电动车竞争力将加速衰退,用户对智能化的诉求将会接近完全自动驾驶。虽然从用户的视角不一定是完全的L4、L5,但是在主动干预的频次大幅降低以后,也让用户每天的使用有非常高的获得感,觉得车非常智能,认可自动驾驶能力和价值。

从第二阶段开始,电动化逐渐被行业所消化,高级别的智能驾驶开始成为赢得智能化竞争中真正的game changer。

最近我看了一段马斯克采访的视频,他很诚恳地说造车是很难的,大部分造车公司都倒闭了,特斯拉也曾多次在倒闭的边缘。今天我也想感叹做自动驾驶这样的大规模复杂软件系统也是非常困难的,大浪淘沙,许多明星级的初创公司,人才储备、启动资本都非常充足的情况下,也在自动驾驶激烈的竞争中陆续倒下了。

自动驾驶的研发门槛非常高,需要AI人才的储备,更重要的是需要长期且坚定的投入。前不久刚刚有人采访时问我,百度为什么坚持自动驾驶做了这么久?这么难的一件事情短期都还看不到赚钱的机会。

我说,百度的使命是用科技让复杂的世界更简单,出行和交通绝对是一件复杂的事情。很多年轻人在北上广深大城市打拼,每天要花2-3个小时的时间驾车拥堵在路上,同时每年有那么多人因为交通事故遭受财产甚至是生命的损失。利用科技是最直接、最本质的优化这个问题的手段,这就是百度使命指引下应该做的事情,我们责无旁贷。在百度有一句话叫“看准了就奔赴”,自动驾驶这件事我们一奔跑起来就是十年。

下面,我跟大家简单回顾一下这十年的研发历程,从2013年小团队启动自动驾驶研发计算,目前经历了五个阶段:

第一个阶段:固定路线的演示(单路)。当时只用一辆车,选一条路,本质上还是做一个demo,但这在2015年已经是当时国内最先进的自动驾驶表现。

第二个阶段:固定路线的演示(多路)。车辆数量和车辆品牌增多之后,进行固定路线的测试,这张图是2016年在乌镇互联网大会上,我们用十几二十辆车,在一条3公里的固定路线接待了300多名的群众和当地的媒体记者。这个过程我亲历其中,和团队在乌镇待了一个多月。

第三个阶段:区域大路网测试。这个阶段把测试路线扩大到大的路网中,在区域里设置很多站点,点到点之间都能互达进行大路网规模的测试,车的数量也从几十辆扩大到上百辆。

第四个阶段:小规模试运营。技术成熟到一定阶段,我们真正让广大用户能从手机APP上打到百度的无人车并体验点到点自动驾驶,虽然绝大部分时间安全员在过程中不触碰方向盘和刹车油门,大家最好奇的一点还是既然叫了无人车,为什么车里还要坐个安全员?

第五个阶段:商业化试运营。在这个阶段百度实现了两个突破:

一是泛化层面的突破,在12个城市面向公众完成全开放运营,虽不能说彻底解决了规模化问题,这么多城市的落地还是一个很积极的信号。规模上百度在Robotaxi领域全球领先,无人驾驶服务累积运营订单数突破100万,也是全球第一。

二是在安全性层面的突破,实现了真正的无人化,也就是driverless,在部分运营区域把安全员彻底去掉了。在此之前积累的L4自动驾驶测试里程超过3600万公里。今年8月,在武汉、重庆两地首先实现了中国的全无人商业化运营。对工程师来说可能没什么感觉,只是研发进展中的一小步,但这个里程碑是中国自动驾驶历史上的一大步。

L4的坚持和坚实可靠的技术积累,给了我们进入汽车智能化赛道的信心和底气。有一个团队正在依托L4技术降维研发L2+领航辅助驾驶产品,这款百度智驾的旗舰产品包括“三域融通”(高速、泊车、城市路段)的智驾功能。

配置上我们不堆料,是务实的领先。上午华为的王军先生的演讲也提到,堆料换不来好的用户体验。硬件选型上比较理性,有双Orin-x 500T AI算力的计算芯片和百度自研的ACU硬件。传感器方面,搭配半固态激光雷达,每秒产生300万点以上的点云,来保障前向安全,前FOV(field of view)能做到180度无遮挡。最后,部分摄像头是采用8百万像素的摄像头,视距可以达到400米。

软件层面,有两个技术优势能赋予产品足够的差异化竞争力。首先我们的安全基因是从L4继承来的,L4的技术证明已经能在中国部分区域实现全无人,3600万公里的道路测试,每一公里都是由持考核资质的测试人员验证完成,对系统的能力有充分专业的验证。

第二点,百度属于非常稀缺的的在汽车智能化供应商中同时做自动驾驶和地图两项业务并且都做得非常专业的。导航有国民级的百度地图,能帮我们在领航辅助驾驶时选择最优的路线。此外自动驾驶使用的高精地图,百度在行业内的市场占有率是第一名。每条道路都提前经过专业化的测绘丈量,在中国保证做到“最熟路”。

目前产品百分之百核心功能研发已经完成,进入在北上广深多地泛化测试阶段。大家可能会好奇,复杂城市道路什么概念?北京有一条网红路叫后厂村路,路况非常复杂,拥堵严重,网友开玩笑地说这条路的拥堵直接影响了中国互联网发展的速度,这条路就是我们每天测试的必经之路之一。我们的产品会在2023年随着第一个客户车型的量产推向市场和用户见面。

刚才讲了百度软硬件层面的进展和布局,今天是技术论坛,作为工程师想分享一下自己在做自动驾驶过程中沉淀的对技术层面的“数据思维”。

思维是动词,是thinking,是根据不同阶段持续变化的。我画了三个柱状图,每个柱状条的长度不同,长度大家可以抽象地认为反映不同方向上的压强力度、投入的资源、研发精力、产生相关技术回报,这些都是跟长度正相关的。

阶段一:Rule-centric。

大家可以看到,最早的阶段在Rules base规则层面的占比是最高的,机器学习的占比很小,数据会更少。还是是我刚才举的例子,2016年做乌镇演示时,团队提前到位忙活了一个月,把一条路适配出来。当时我负责感知方向,全盘的感知几乎都可以用规则方法来解决,有激光雷达写传统的算法可以应对很多情况,哪不行的话就加规则打补丁。

唯一解不了的就是红绿灯识别,所以当时车上唯一基于机器学习方法做的就是红绿灯识别,当时有一个机器学习模型在车上,数据也是针对当时的演示路线进行了红绿灯数据的采集标注,量非常小。乌镇这种方法做demo没有问题,只要投入足够的精力和时间也可以work,但是绝对没有办法规模泛化。除此之外能力也非常有限,因为人依靠观察和经验假设编写的code完全无法超越通过大量数据学习得来的能力。

阶段二:Model-centric。

对规则方法进行了压缩,也不是完全没有rule,有些经典算法的留存还是合理的,但要把大量的任务以机器学习的办法来取代,这不是自然发生的过程。举个例子,同样的问题用激光雷达来实现道路路面,我当时自己写了自认为还不错的算法快速上车了,假设地面是平的,把它分成若干个栅格做平面拟合,效果还是不错的,用了一两年的时间,没有出大问题,唯一问题是在坡路的时候平面假设被破坏,会有一些误检,导致刹车。

后来推动大家用机器学习的方法去做,去标注道路路面的点云数据,用deep learning取代规则。最后,因为道路检测遇到的问题几乎就没有再出现。这样的问题还有非常多,大家可以感觉到第一阶段从红绿灯一个任务开始,到今天到多任务,像地面检测、障碍物分类识别、静止车辆判断,90%的任务开始用机器学习的方法来解决,这样才能更有效地消化数据。过程中大家对数据的需求也大幅提升,大量标注需求开始上来了。

阶段三:Data-centric。

如果不给工程师做限制,技术爱好者还是非常愿意关注最流行的前沿技术,乐衷在论文里面挑选最新的网络结构去实现、调优。过程中投入产出不是非常合理高效,重视模型迭代同时,大家往往忽视了数据能带来的技术增值。网络模型调了很多版,但数据的质量和数量可能都没增加,这是我们比较苦恼的。所以第三个阶段是从Model centric到Data-centric的大转变。

大家的思想要转成以数据为驱动,网络结构基本稳固以后不要太高频的改动,更多地关注数据。当前模型在道路上应对不了的情景,要把数据高纯度地提纯挖回来,加入到训练数据里。这时候团队的注意力从模型转移到对数据的研究。

这么做的收益我也可以举个例子,刚才提到去乌镇的时候花了一个多月,几十号人在那儿吃住,一个多月为了把一条路调通;后期多地城市落地,要有数个工程师到本地调试支持;随着learning化的占比提升,对数据的关注提升,数据挖掘体系的完善。现在再去落地一个城市,工程师是根本无感的,把车运过去,把地图生产出来,没有自动驾驶背景的运维人员就可以把车调通,到了新城市很快车可以顺利跑起来。这点是我们比较骄傲的,是数据驱动带来的核心价值体现。

讲接下来这页之前,先说一下智能生物和非智能生物的区别,比如说植物是非智能生物,和动物的区别是什么?我认为有两点:一是智能生物可以自己移动,可以行动,可以避障,这个能力植物是没有的。二是适应环境的能力,智能生物在见过、经历过之后,认知上能够成长,这两点能力是我们对以后第三阶段智能电动汽车的要求。

我们认为,软/硬件是智能汽车的躯体,提供的是“自移动”的能力。那什么是灵魂?数据是灵魂,数据是系统成长演进的燃料。躯体会趋于标准化,由好的AI背景团队、专业的智驾供应商来提供所谓“交钥匙”(turn-key solution)方案”。因为这里面有大量前期投入、巨大的代码量,背后有上千人团队多年的累积,不是每个厂商都能从头开始做就能在短时间复制出来的,做也不经济,但这部分软件的实现也会随着时间逐渐趋于标准化(各家的实现趋同,差异化减少)。

数据驱动的差异化是由智驾供应商向车企提供数据增值供应链和配套的服务来达成的。这里对比一下可以看到,躯体是非常复杂的软硬一体系统,软件复杂的架构,海量的代码,极高的性能要求,算法有大量的专家经验,复杂的AI模型,硬件要高可靠性,要有冗余,最后高难度的大规模复杂系统集成,都需要极高的专业度和大团队长期的积累。

但是想实现右边这页“数据掌控灵魂”其实是很轻的,利用SaaS云服务工作台可以做到,MLOps是要遵循机器学习工程文化和流程机制,把一套研发流程机制嵌入到平台里,在训练出AI模型质量和稳定性都能得到保障。

数据挖掘,要把数据trigger点预埋,精准想挖什么就挖什么,车云交互可以让车企动态管理,你对什么数据感兴趣,你就把它打开,数据会在遇到困难case的时候传回来。

模型训练、评测,流水线模型生产和测试的一体化,对我们使用的模型非常清楚,对模型的弱点也非常清楚,对需要的数据非常清晰之后,这件事情是完全可以做到的。评测包括了模型的评测,硬件性能的评测,甚至还有仿真端到端的评测,保证每次发版都信心满满。最后云原生:弹性计算、服务安全可靠。当然,这一切都是在数据合法合规前提下完成的。

说到技术,放了一张自动驾驶“数据闭环”,也就是把数据转化为驾驶能力的技术栈架构,图看起来比较复杂,点也特别多,确实是慢工出细活的工作。经过数年迭代,目前已经把这里面几乎所有细的子模块全都实现完成。从最初的传感器数据输入,到动态数据上传、结构化数据管理存储、高价值数据挖掘、数据标注变成有效模型可用的数据资产,到机器学习的模型迭代、评测,最后整个模型持续集成、持续部署到车端这一闭环链路都实现了,L4在这套模型迭代获得了泛化上的成功,也证明了这套技术方案的有效性。

大家看架构可能觉得太技术了,这是内部自动驾驶工程师每天使用的一套工具链,我们希望把这套能力赋能给合作伙伴,赋能给客户,这时候需要好的产品化、好的用户体验才能做到让车企可以基于数据做差异化的创新。

基于“驾云一体”的理念,百度结合在AI、云计算、自动驾驶的深厚积累,已经着手为客户量身打造了一款创新的SaaS产品,内部简单叫Apollo智驾云,一同助力车企在量产车规模级别上通过对数据从挖掘、标注、训练、仿真的全生命周期管理,实现数据驱动的智驾能力进化,进而让终端消费者获得更好的智驾体验。

一是车云实时通讯和大规模车队云端管理,车企通过智驾云能在量产车的模型上对补充模型AI能力所需要的数据片段,进行精准、高效、动态、低成本的挖掘,实现高纯度、高价值数据资产的快速积累。不是泛泛的数据量的回收,而是有的放矢,针对当下模型缺陷的挖掘和回收。

二是结合业界领先的MLOps理念,以AutoML、云原生、AI为技术主干,将复杂多样的模型训练步骤进行标准化封装,车企可通过智驾云高度自动化地针对自己车型的AI模型训练迭代AI模型,整个过程更标准,产出模型更稳定,可实现模型周级别迭代,高忧问题甚至支持数天内完成。

三是产品以SaaS的形式提供服务,即开即用,为用户带来互联网产品级的体验和一站式完成数据管理、模型迭代等发版操作,减少跨平台低效操作,提高组织运转效率。

“工欲善其事,必先利其器”车端精准的数据挖掘、云端高效的数据流转,SaaS平台优秀极简的用户体验,是百度智驾云为车企客户精心准备的“三把利器”,搭载了MP智驾软硬件的客户,内部研发团队可以通过智驾云快速获取数据驱动智驾成长能力,在量产大数据时代下占领先机,掌握对体验差异化的把控。

很多车企觉得我们不缺数据,存了很多数据,百度也有这样的经历,我们存了很多数据,但是数据没有有效地用起来。就好像你有很多现金,没有选择投资而是把现金放在家里,钱是贬值的,并且占用大量的空间。无疑应该让数据流转起来,让它有效的做增值,增值不一定是现金,也有可能是用户体验的提升,产品功能的增加,这些都是变相对用户的价值创造在增值。百度希望通过这样的平台为客户管理好数据,做好数据的增值服务,这是我们的初衷。

对我今天汇报中的核心观点进行总结:

第一,2025年汽车智能化实现“跨沟”,届时“高阶”,特别是城市领航辅助驾驶、自动驾驶能力将成为用户购车头部考虑因素之一,产品研发窗口期短暂,如果这两年拿不出有竞争力的产品,很有可能2025年阶段会有落后的风险。

第二,自动驾驶产品需长期、巨大的前期投入,跟传统tier1不同的是车辆交付后也要持续演进,特别是数据驱动迭代演进,车企需要找到能按时推向市场,高品质且持续稳定更新的解决方案。

第三,软/硬件是自动驾驶的“躯体”,解决车辆可移动问题;数据是推动智能汽车演进的燃料,数据是决定差异化的“灵魂”,解决智能汽车成长演进的问题。

第四,希望和广大同行一起探索探讨新的模式,百度为客户提供“软硬一体”的解决方案,同时把“数据增值”,解决数据到能力转化这一圈套的工具链和背后的服务赋能给客户,让车企自己掌握数据,车企把控灵魂。

再次感谢大会的邀请,百度Apollo愿与更多车企合作伙伴合作共赢,谢谢大家!

(注:本文根据现场速记整理,未经演讲嘉宾审阅)
 


主页 > 新闻资讯 >


读者留言

看不清?点击更换