福瑞泰克李帅君:智能驾驶软硬一体新生态,创芯求异
时间: 2023-12-08 22:13
来源: 2023芯片大会
作者: editor
2023年12月5日-6日,由中国汽车工业协会和中国电子科技集团有限公司共同主办的“2023全球汽车芯片创新大会暨第二届中国汽车芯片高峰论坛”在无锡举办。本届芯片大会以“共享中国机遇•共谋创新发展•共赢产业未来”为主题,设置了“1场高层峰会、1场主旨论坛、4场主题论坛”共6场会议。其中,在12月6日下午举办的“主题论坛三:构建汽车智能‘芯’生态”上,福瑞泰克智能系统有限公司首席架构师李帅君博士发表精彩演讲。
以下内容为现场演讲实录:
感谢陈秘书长,我也是香港中文大学的博士,加上时教授,在这儿一下找到三位校友,直接把距离收缩到一栋楼里面,感觉很亲切。
回到正题,我是福瑞泰克的李帅君,今天带来的汇报叫做智能驾驶软硬件一体新生态,创芯求异,稍微呼应一下今天的主题。
先简单介绍一下公司的基本情况,再讲我为什么选择谈这个话题,福瑞泰克是一家Tier1的公司,我们致力于提供安全可靠和创新的智驾解决方案,我们希望成为中国智驾领域的博世。刚才王总在讲长期主义,要长期坚持去做一件事情,还有技术平权,这些我都非常感同身受,在福瑞泰克Tier1的基因里面,也包含着长期主义和技术平权,这两个重要的特质。
杭州是我们的总部,在上海和成都有我们的研发中心有一个智能制造的工厂在乌镇,这是我们的产品矩阵,我们做Camera摄像头,毫米波雷达,域控制器,以及CMS、DMS的硬件,在这些硬件基础之上做它的底软,再进一步搭载成智驾的系统和应用层的软件,最后给主机厂提供智能驾驶的解决方案。福瑞泰克已经形成了一个技术体系,叫做ODIN智能驾驶舒适底座的一个平台化解决方案,这里面有四大技术支柱,核心传感器、自动驾驶算法,中央计算平台和数据闭环系统,这样我们面向OEM,能够更快速、更高效的提供一个智驾平台的解决方案。
福瑞泰克的发展到今天,成绩单主要这么三个数字,到今天我们有超过40家主机厂的客户,完成了超过了100款量产车型的项目,出货量超过100万套的搭载量,这个成绩单支持了公司被福布斯评定为中国独角兽企业,以及右边一系列行业的认定,最近的是毕马威和美国SAE评定的中国零部件优秀企业,和国内外证券评定的,我们在ADAS和行泊一体市场上处于领先的地位。
以上是福瑞泰克公司的一个基本情况,大家可以看到,我们作为一家Tier1,有硬件的部分,有软件的部分,更多还要系统的部分。结合今天的主题,首先今天是关于芯片的创新大会,那我们先讲创新,然后我结合福瑞泰克公司摸索芯片相关的生态,特别是芯片自己本身和域控、算法整个完整的生态,我们去寻找一下里面差异化的地方,这个异可能是有一些和大家普遍意义上稍微有一些偏差的地方,也可能是有一些独特视角的地方,希望能给大家带来一些启发。
首先讲芯片的生态和发展。首先一张图,我们讲芯片的算力,这张图上罗列了行业里面主流的一些芯片的算力的情况,有Mobileye的IQ系列,地平线的征程系列,TI公司的TDA4系列,英伟达的系列等等,大家可以看到算力的一个分布,一个常见的问题,大家都会讨论芯片的算力,问:芯片的算力会一直持续向上上涨吗?我们对于这个问题的经验和回答,首先我们承认:是。虽然各家芯片算力上升的可能斜率有不一样,或者算力所处的等级不一样,但是大家可以看到整体确实是呈现上升趋势的,也是印证了芯片算力不断发展的大趋势。
但是我们也会补充一句:可能也不是,或者不完全是。这里主义,我中间有一个黄色的部分,把特斯拉的FSD画在上面,特斯拉FSD 144 Tops的芯片算力,推出之后,它并没有盲目的去向大算力追赶,而是停留在这个档位上,但同时,它的智驾系统在行业里面还是具有相当的领先性。同时,我们去观察一下其他的玩家,特别是英伟达和地平线,英伟达在不断地鼓吹它的大算力,1000tops,2000tops的芯片的同时,它也没有忘记在80、100这个区间去部署Orin-N,而地平线征程5出来以后,征程6到500tops左右的系列,它也没有忘记在80左右这个区间去部署一个J6E的产品。那么由此,我们可能会做出这样一个判断:芯片的发展趋势可能会存在一定的分化,在一定的算力等级上,可能会呈现一个收敛和稳定的趋势。
第二张图,我们纵观一下芯片算力的发展和智驾功能的对比,横轴是芯片的算力从小到大,纵轴是我们智驾功能的由弱到强,大家很明显的可以看到,并不是说算力的增加,我的智驾功能就会不断地提升,它是呈一个趋于饱和,并且边际效益递减的趋势。具体来说,我们当前10tops的系统完全可以支持L2.0,车道保持+一个拨杆变道的功能;当算力升到30tops,很多厂家都可以去支持高速NOA,上下匝道以及记忆泊车的功能;主流玩家在200tops和400tops这个区间,就可以进入到城区,支持城区NOA以及AVP,但它依然是一个L2.9级的系统;更大的算力,800-2000tops的算力,还是主要应用在L3、L4的系统上,以及包括Taxi的系统上,但仍然不能确保安全。,右边我写了两句话,200tops以内的算力,在未来来讲,很可能可以去支持高速和NOA的智能驾驶的辅助体验。但是更高的算力,目前看,并没有给用户带来显著的功能和体验的提升。
我们就会做出这样的一个判断,技术发展的方向可能会开始分化,这里在400tops划了一条线,这条线的左边和右边我们认为会出现一个技术分化的趋势,在这条线的左边,行业里的产品和玩家可能会用更精简的算力去打造更经济实用的智驾产品。而在这条线的右边,可能芯片还是会不断地去往大算力发展,并且伴随着尝试用更大的算力,去应用更强的AI算法和模型来尝试用更高的维度的方法去解决智能驾驶的问题。
还是回到这张图,我们继续去剖析,回答这样一个问题。我们今天是一个汽车芯片的大会,所有的芯片厂商都会去讲国产自研,国产自研大算力芯片,去追赶国际的发展趋势,但是正面追赶大算力芯片是不是一个最优的策略?我们想针对这个问题谈一谈我们的思考。还是看这张图,它的左边有什么特点呢?左边现在出现的全部是L2.9级的智驾辅助产品,人都是在环的,典型的标志性产品应该是特斯拉的FSD和华为ADS2.0,这个系统现在不是那么完美,但是它能实现什么功能?在什么区域下能用?在什么情况下可能会有风险,还是相对确定的,但在这条曲线的右边,更多的大家谈论的是一些具有潜力的颠覆性的技术,比如大模型的技术,端到端的自动驾驶的AI技术;但是从产品层面,L3、L4的系统,以及Robotaxi的产品法其实相对是停滞的。总体来讲,它具有更大的不确定性。在这个观察之下,我们对这个问题的回答可能偏保守一点,我们认为优先的追赶中等算力(100-200tops)的芯片,可能更容易产生商业的竞争力,背后付出的代价也会小很多。
刚才江波龙的王总也讲了很多类似的体会,我特别有共鸣,单独的去追这个长板,你要付出很大的代价,制成、成本、人力,但是是不是最聪明的做法?往往还是可以有更多的思考,追赶这里更容易产生商业竞争力,同时如果我们在右边的算力上边适度的追赶,也未必会落下很多,因为在左边,我们如果有中等算力的芯片,一样可以通过异构的组合来实现同样大算力芯片的功能,我后面会再展开讲一下这点。
这三页简单讲了一下我们对于芯片生态的观察和思考,接下来我们进一步看芯片和域控的生态关系。这里呈现了一张我们针对国内的一个高端的OEM去做的L4的域控制器的芯片系统。大家可以看到上面有非常复杂的芯片,单SOC,就有SOC1、SOC2,两颗、三颗、五颗,不同种类的,还有MCU芯片,还有电源芯片,Can芯片,以太网的传输芯片,串行、解串,我没有把DDR和IMU以及定位芯片标出来,但他们其实都非常重要。总体来讲,是下面三句话,我们是tier1公司,我们非常清楚这一点,域控制器本身就是一个多芯片系统的系统,它本身就是一个生态,不同的芯片负责不同的功能,其实是一件非常正常的事情,但是谈到今天的智能驾驶,好像大家把它抽象成我就是追大算力芯片,就能搞定智能驾驶,这个其实认知过于笼统了。即便对于智能驾驶的算法,由多个芯片的一个系统来共同协调完成,也是非常常见的,我们把这件事情叫做一个异构系统。
关于异构系统,我们去罗列了一下行业里面大家Tier1域控的解决方案,也会发现异构的芯片系统和架构往往是最常见的智能驾驶解决方案,我上面罗列的是大算力的域控方案,可以看到用英伟达的xavier或者Orin-X+MCU的架构,右边写的是它的一些特点,它多为采用单的或者双的SOC+一个MCU的异构方案来提供产品,支持今天的高阶智驾功能。它的特点我认为这种架构会更利于算力的升级和算法的迭代,未来的趋势依然会让这个单颗的芯片算力越来越大,在上面不断的迭代算法。
但是在下面,当前来讲,在50tops以内,中小算力的解决方案非常丰富也非常活跃,因为它的成本要低很多,你可以看到有这种J3+TDA4+MCU,或者由多颗J3+MCU的架构,它一样是一个异构的架构,更偏硬一点。它存在即有它存在背后的道理,我总结是它更利于一个研发的解耦以及硬件级的安全可靠。当你的芯片完全不同的任务,你可以把这颗芯片在上面的算法完全包给一家厂商,由你来做感知,由另一家来做规控定位的等等功能,来分这个活儿,从硬件的可靠性,总是会比软件的可靠性高一个档次。
在下面的方向,我们认为这个趋势依然会存在,而且未来会向更经济、更安全稳定的一个方向发展。
围绕异构系统这件事情,我们如果站在今天回头去看过去芯片的发展,这件事情也非常正常,今天的SOC系统的发展,就是由原来的CPU容纳了更多的外设设备,比如DDR,一些显示GPU的单元来发展成的。站在今天再往未来看,我们当前的SOC和域控里面的其他芯片依然是这个关系,它们的发展趋势,在今天SOC的基础上进一步去看,我的智能驾驶会需要哪些更常用的计算单元,怎么突破这个瓶颈,把它更集中化的去发展。更具体来讲,今天的发展趋势,应该会兼顾更多的计算核心,(还要包括一些存储带宽,我后面会讲一下),比如NPU、AIcore等等,它的目的是为了兼容更多的AI计算类的任务。
以上是我们在芯片和域控上面的观察,最后谈一下芯片和算法之间的一些生态和关系。
算法首先就谈感知,大算力芯片,BEV感知现在基本上都会绑定在一起去谈,确实没错,这张图上,先从右边看起,右边展示的是一个典型的BEVtransformer的算法结构,以及福瑞泰克在BEV和Transformer的感知算法的一个架构设计和它当前的效果。从行业来说,这件事情其实对于芯片是提出了一个更精细化的要求,我罗列了四点:对BEV的特征融合的算子,要求芯片支持,Transformer的特征融合算子也需要芯片支持,第三点,特征层高速缓存的存储和带宽搬运非常重要,刚才王总在谈数据存储和带宽搬运的时候,这一点应该非常有感触,这一个往往是你系统的短板,而不是芯片算力是你的长板,这个才是真正的限制因素。
而软件上算子和工具链的支持也是制约的短板,在左下角这里,我列举的是以地平线为例,因为感知提出了这样的要求,它也在做一些努力,比如对以上的算子和工具链做一些改进,来支持大家的需求,但是其实它能做的事情偏软的还可以,偏硬的是非常有限的,因为征程5的芯片在规划的时候,BEV、Transformer还没有提出来,这个硬件的东西都是两三年之前的,我们需要到两三年之后和下一代征程6的时候才能看到相应的内容得到提高。
上面一页如果说大家行业里面讨论的比较多,这一页我觉得是行业里讨论比较少的内容,我特别想讲一下,因为一个完整的智驾系统不仅是感知,还有预测地图、刚才时教授讲的定位、规控等等这些算法模块。我右边罗列的是一张完整的高阶智能驾驶的算法架构和它各个模块之间的配合关系,当它完整的拼起来之后,就像我们右下角展示的,这个是福瑞泰克高阶城区NOA功能在滨江区运行的视频,它才会组成一个完整的系统。
这里面对于芯片提出的是什么要求呢?是更全面的要求。要求芯片需要有更多的CPU算力,需要有更高速的跨核存储和通讯带宽,需要有更安全的故障监控和系统管理,这决定一个短板效应,因为我们在上面摸索了很多,我非常有这个感触,当我们芯片的算力发展很大的时候,它对于我来讲是一个长板,但是在一个真实的系统里面,它都是由短板来决定的,如果你的带宽和跨核通讯的功能没有解决好,给你再大的算力你也发挥不出来。
左下角还是在印证这件事情,行业里面深度的玩家也开始认识到这件事,我列举了地平线J3、J5、J6的一个发展,大家可以看到,AI算力是大家谈论很多的内容,在J6上面,它已经到了500tops,还有一个80tops的J6E的版本,不管AI算力增加与否,你可以看到它的CPU算力是非常显著的提升的,从26提升到了100,提升了4倍之多。这件事是一个非常好的迹象,说明大家从芯片的角度开始意识到这个智驾系统是一个完整的系统,而不是一个简单的感知系统。
我在这里希望更多的呼吁大家的一些共识。刚才王总也讲了,大家很辛苦的做车规级的芯片,但是都不挣钱,我们Tier1也很辛苦。今天是一个芯片的大会,如果大家更多的把往大算力芯片上投资的1美元,稍微分一点在存储带宽上,在定位芯片上,在我们整个个域控和智驾系统上面,去提高短板,而不是单纯的提高长板,可能会得到更好的更快的一个价值体现。
最后我们认为算法和芯片的一个迭代关系是这么两句话,长期算法定义芯片,而短期算法适配芯片。长期今天会有很多的刚刚产生的具有超大潜力的算法,我们讲大语言模型,重感知新地图的算法,以及端到端的AI智能驾驶的算法,它们都展示出非常高的潜力,可能可以解决更多的问题,但是当下它去影响芯片的定义可能还需要三年的一个周期才能兑现。那么回到三年以内的周期,短期,我们能够使用的芯片其实都是有一定的局限性的。谁能把它用的好,更多的要去看你的部署能力,我们福瑞泰克公司在这上面会花非常多的力气,我简单罗列了两点。一方面做算法部署的优化,把算法进行各种异构的拆分,把它部署到异构的域控和芯片系统上去。另一方面也做系统全链路的优化,去更多的提高整个系统的短板,而不是说单纯地利用长板,这是我们的一些观察。
最后总结一下,智能驾驶软硬一体新生态创芯求异,我结合福瑞泰克公司做一个Tier1摸索经验,我们寻求的差异可能是这么三个异:异构芯片,可能是另一种解决方案和思路。由异构芯片组成的域控制器,在当下更具有落地实施意义。单纯地感知芯片和完整的智驾解决方案之间还是有非常大的差异性的。
以上是我全部的内容,感谢大家了解福瑞泰克公司和我们的产品,这是我们的ODIN数智底座和四大技术支柱的技术特色,谢谢大家!
2023年12月5日-6日,由中国汽车工业协会和中国电子科技集团有限公司共同主办的“2023全球汽车芯片创新大会暨第二届中国汽车芯片高峰论坛”在无锡举办。本届芯片大会以“共享中国机遇•共谋创新发展•共赢产业未来”为主题,设置了“1场高层峰会、1场主旨论坛、4场主题论坛”共6场会议。其中,在12月6日下午举办的“主题论坛三:构建汽车智能‘芯’生态”上,福瑞泰克智能系统有限公司首席架构师李帅君博士发表精彩演讲。
以下内容为现场演讲实录:
感谢陈秘书长,我也是香港中文大学的博士,加上时教授,在这儿一下找到三位校友,直接把距离收缩到一栋楼里面,感觉很亲切。
回到正题,我是福瑞泰克的李帅君,今天带来的汇报叫做智能驾驶软硬件一体新生态,创芯求异,稍微呼应一下今天的主题。
先简单介绍一下公司的基本情况,再讲我为什么选择谈这个话题,福瑞泰克是一家Tier1的公司,我们致力于提供安全可靠和创新的智驾解决方案,我们希望成为中国智驾领域的博世。刚才王总在讲长期主义,要长期坚持去做一件事情,还有技术平权,这些我都非常感同身受,在福瑞泰克Tier1的基因里面,也包含着长期主义和技术平权,这两个重要的特质。
杭州是我们的总部,在上海和成都有我们的研发中心有一个智能制造的工厂在乌镇,这是我们的产品矩阵,我们做Camera摄像头,毫米波雷达,域控制器,以及CMS、DMS的硬件,在这些硬件基础之上做它的底软,再进一步搭载成智驾的系统和应用层的软件,最后给主机厂提供智能驾驶的解决方案。福瑞泰克已经形成了一个技术体系,叫做ODIN智能驾驶舒适底座的一个平台化解决方案,这里面有四大技术支柱,核心传感器、自动驾驶算法,中央计算平台和数据闭环系统,这样我们面向OEM,能够更快速、更高效的提供一个智驾平台的解决方案。
福瑞泰克的发展到今天,成绩单主要这么三个数字,到今天我们有超过40家主机厂的客户,完成了超过了100款量产车型的项目,出货量超过100万套的搭载量,这个成绩单支持了公司被福布斯评定为中国独角兽企业,以及右边一系列行业的认定,最近的是毕马威和美国SAE评定的中国零部件优秀企业,和国内外证券评定的,我们在ADAS和行泊一体市场上处于领先的地位。
以上是福瑞泰克公司的一个基本情况,大家可以看到,我们作为一家Tier1,有硬件的部分,有软件的部分,更多还要系统的部分。结合今天的主题,首先今天是关于芯片的创新大会,那我们先讲创新,然后我结合福瑞泰克公司摸索芯片相关的生态,特别是芯片自己本身和域控、算法整个完整的生态,我们去寻找一下里面差异化的地方,这个异可能是有一些和大家普遍意义上稍微有一些偏差的地方,也可能是有一些独特视角的地方,希望能给大家带来一些启发。
首先讲芯片的生态和发展。首先一张图,我们讲芯片的算力,这张图上罗列了行业里面主流的一些芯片的算力的情况,有Mobileye的IQ系列,地平线的征程系列,TI公司的TDA4系列,英伟达的系列等等,大家可以看到算力的一个分布,一个常见的问题,大家都会讨论芯片的算力,问:芯片的算力会一直持续向上上涨吗?我们对于这个问题的经验和回答,首先我们承认:是。虽然各家芯片算力上升的可能斜率有不一样,或者算力所处的等级不一样,但是大家可以看到整体确实是呈现上升趋势的,也是印证了芯片算力不断发展的大趋势。
但是我们也会补充一句:可能也不是,或者不完全是。这里主义,我中间有一个黄色的部分,把特斯拉的FSD画在上面,特斯拉FSD 144 Tops的芯片算力,推出之后,它并没有盲目的去向大算力追赶,而是停留在这个档位上,但同时,它的智驾系统在行业里面还是具有相当的领先性。同时,我们去观察一下其他的玩家,特别是英伟达和地平线,英伟达在不断地鼓吹它的大算力,1000tops,2000tops的芯片的同时,它也没有忘记在80、100这个区间去部署Orin-N,而地平线征程5出来以后,征程6到500tops左右的系列,它也没有忘记在80左右这个区间去部署一个J6E的产品。那么由此,我们可能会做出这样一个判断:芯片的发展趋势可能会存在一定的分化,在一定的算力等级上,可能会呈现一个收敛和稳定的趋势。
第二张图,我们纵观一下芯片算力的发展和智驾功能的对比,横轴是芯片的算力从小到大,纵轴是我们智驾功能的由弱到强,大家很明显的可以看到,并不是说算力的增加,我的智驾功能就会不断地提升,它是呈一个趋于饱和,并且边际效益递减的趋势。具体来说,我们当前10tops的系统完全可以支持L2.0,车道保持+一个拨杆变道的功能;当算力升到30tops,很多厂家都可以去支持高速NOA,上下匝道以及记忆泊车的功能;主流玩家在200tops和400tops这个区间,就可以进入到城区,支持城区NOA以及AVP,但它依然是一个L2.9级的系统;更大的算力,800-2000tops的算力,还是主要应用在L3、L4的系统上,以及包括Taxi的系统上,但仍然不能确保安全。,右边我写了两句话,200tops以内的算力,在未来来讲,很可能可以去支持高速和NOA的智能驾驶的辅助体验。但是更高的算力,目前看,并没有给用户带来显著的功能和体验的提升。
我们就会做出这样的一个判断,技术发展的方向可能会开始分化,这里在400tops划了一条线,这条线的左边和右边我们认为会出现一个技术分化的趋势,在这条线的左边,行业里的产品和玩家可能会用更精简的算力去打造更经济实用的智驾产品。而在这条线的右边,可能芯片还是会不断地去往大算力发展,并且伴随着尝试用更大的算力,去应用更强的AI算法和模型来尝试用更高的维度的方法去解决智能驾驶的问题。
还是回到这张图,我们继续去剖析,回答这样一个问题。我们今天是一个汽车芯片的大会,所有的芯片厂商都会去讲国产自研,国产自研大算力芯片,去追赶国际的发展趋势,但是正面追赶大算力芯片是不是一个最优的策略?我们想针对这个问题谈一谈我们的思考。还是看这张图,它的左边有什么特点呢?左边现在出现的全部是L2.9级的智驾辅助产品,人都是在环的,典型的标志性产品应该是特斯拉的FSD和华为ADS2.0,这个系统现在不是那么完美,但是它能实现什么功能?在什么区域下能用?在什么情况下可能会有风险,还是相对确定的,但在这条曲线的右边,更多的大家谈论的是一些具有潜力的颠覆性的技术,比如大模型的技术,端到端的自动驾驶的AI技术;但是从产品层面,L3、L4的系统,以及Robotaxi的产品法其实相对是停滞的。总体来讲,它具有更大的不确定性。在这个观察之下,我们对这个问题的回答可能偏保守一点,我们认为优先的追赶中等算力(100-200tops)的芯片,可能更容易产生商业的竞争力,背后付出的代价也会小很多。
刚才江波龙的王总也讲了很多类似的体会,我特别有共鸣,单独的去追这个长板,你要付出很大的代价,制成、成本、人力,但是是不是最聪明的做法?往往还是可以有更多的思考,追赶这里更容易产生商业竞争力,同时如果我们在右边的算力上边适度的追赶,也未必会落下很多,因为在左边,我们如果有中等算力的芯片,一样可以通过异构的组合来实现同样大算力芯片的功能,我后面会再展开讲一下这点。
这三页简单讲了一下我们对于芯片生态的观察和思考,接下来我们进一步看芯片和域控的生态关系。这里呈现了一张我们针对国内的一个高端的OEM去做的L4的域控制器的芯片系统。大家可以看到上面有非常复杂的芯片,单SOC,就有SOC1、SOC2,两颗、三颗、五颗,不同种类的,还有MCU芯片,还有电源芯片,Can芯片,以太网的传输芯片,串行、解串,我没有把DDR和IMU以及定位芯片标出来,但他们其实都非常重要。总体来讲,是下面三句话,我们是tier1公司,我们非常清楚这一点,域控制器本身就是一个多芯片系统的系统,它本身就是一个生态,不同的芯片负责不同的功能,其实是一件非常正常的事情,但是谈到今天的智能驾驶,好像大家把它抽象成我就是追大算力芯片,就能搞定智能驾驶,这个其实认知过于笼统了。即便对于智能驾驶的算法,由多个芯片的一个系统来共同协调完成,也是非常常见的,我们把这件事情叫做一个异构系统。
关于异构系统,我们去罗列了一下行业里面大家Tier1域控的解决方案,也会发现异构的芯片系统和架构往往是最常见的智能驾驶解决方案,我上面罗列的是大算力的域控方案,可以看到用英伟达的xavier或者Orin-X+MCU的架构,右边写的是它的一些特点,它多为采用单的或者双的SOC+一个MCU的异构方案来提供产品,支持今天的高阶智驾功能。它的特点我认为这种架构会更利于算力的升级和算法的迭代,未来的趋势依然会让这个单颗的芯片算力越来越大,在上面不断的迭代算法。
但是在下面,当前来讲,在50tops以内,中小算力的解决方案非常丰富也非常活跃,因为它的成本要低很多,你可以看到有这种J3+TDA4+MCU,或者由多颗J3+MCU的架构,它一样是一个异构的架构,更偏硬一点。它存在即有它存在背后的道理,我总结是它更利于一个研发的解耦以及硬件级的安全可靠。当你的芯片完全不同的任务,你可以把这颗芯片在上面的算法完全包给一家厂商,由你来做感知,由另一家来做规控定位的等等功能,来分这个活儿,从硬件的可靠性,总是会比软件的可靠性高一个档次。
在下面的方向,我们认为这个趋势依然会存在,而且未来会向更经济、更安全稳定的一个方向发展。
围绕异构系统这件事情,我们如果站在今天回头去看过去芯片的发展,这件事情也非常正常,今天的SOC系统的发展,就是由原来的CPU容纳了更多的外设设备,比如DDR,一些显示GPU的单元来发展成的。站在今天再往未来看,我们当前的SOC和域控里面的其他芯片依然是这个关系,它们的发展趋势,在今天SOC的基础上进一步去看,我的智能驾驶会需要哪些更常用的计算单元,怎么突破这个瓶颈,把它更集中化的去发展。更具体来讲,今天的发展趋势,应该会兼顾更多的计算核心,(还要包括一些存储带宽,我后面会讲一下),比如NPU、AIcore等等,它的目的是为了兼容更多的AI计算类的任务。
以上是我们在芯片和域控上面的观察,最后谈一下芯片和算法之间的一些生态和关系。
算法首先就谈感知,大算力芯片,BEV感知现在基本上都会绑定在一起去谈,确实没错,这张图上,先从右边看起,右边展示的是一个典型的BEVtransformer的算法结构,以及福瑞泰克在BEV和Transformer的感知算法的一个架构设计和它当前的效果。从行业来说,这件事情其实对于芯片是提出了一个更精细化的要求,我罗列了四点:对BEV的特征融合的算子,要求芯片支持,Transformer的特征融合算子也需要芯片支持,第三点,特征层高速缓存的存储和带宽搬运非常重要,刚才王总在谈数据存储和带宽搬运的时候,这一点应该非常有感触,这一个往往是你系统的短板,而不是芯片算力是你的长板,这个才是真正的限制因素。
而软件上算子和工具链的支持也是制约的短板,在左下角这里,我列举的是以地平线为例,因为感知提出了这样的要求,它也在做一些努力,比如对以上的算子和工具链做一些改进,来支持大家的需求,但是其实它能做的事情偏软的还可以,偏硬的是非常有限的,因为征程5的芯片在规划的时候,BEV、Transformer还没有提出来,这个硬件的东西都是两三年之前的,我们需要到两三年之后和下一代征程6的时候才能看到相应的内容得到提高。
上面一页如果说大家行业里面讨论的比较多,这一页我觉得是行业里讨论比较少的内容,我特别想讲一下,因为一个完整的智驾系统不仅是感知,还有预测地图、刚才时教授讲的定位、规控等等这些算法模块。我右边罗列的是一张完整的高阶智能驾驶的算法架构和它各个模块之间的配合关系,当它完整的拼起来之后,就像我们右下角展示的,这个是福瑞泰克高阶城区NOA功能在滨江区运行的视频,它才会组成一个完整的系统。
这里面对于芯片提出的是什么要求呢?是更全面的要求。要求芯片需要有更多的CPU算力,需要有更高速的跨核存储和通讯带宽,需要有更安全的故障监控和系统管理,这决定一个短板效应,因为我们在上面摸索了很多,我非常有这个感触,当我们芯片的算力发展很大的时候,它对于我来讲是一个长板,但是在一个真实的系统里面,它都是由短板来决定的,如果你的带宽和跨核通讯的功能没有解决好,给你再大的算力你也发挥不出来。
左下角还是在印证这件事情,行业里面深度的玩家也开始认识到这件事,我列举了地平线J3、J5、J6的一个发展,大家可以看到,AI算力是大家谈论很多的内容,在J6上面,它已经到了500tops,还有一个80tops的J6E的版本,不管AI算力增加与否,你可以看到它的CPU算力是非常显著的提升的,从26提升到了100,提升了4倍之多。这件事是一个非常好的迹象,说明大家从芯片的角度开始意识到这个智驾系统是一个完整的系统,而不是一个简单的感知系统。
我在这里希望更多的呼吁大家的一些共识。刚才王总也讲了,大家很辛苦的做车规级的芯片,但是都不挣钱,我们Tier1也很辛苦。今天是一个芯片的大会,如果大家更多的把往大算力芯片上投资的1美元,稍微分一点在存储带宽上,在定位芯片上,在我们整个个域控和智驾系统上面,去提高短板,而不是单纯的提高长板,可能会得到更好的更快的一个价值体现。
最后我们认为算法和芯片的一个迭代关系是这么两句话,长期算法定义芯片,而短期算法适配芯片。长期今天会有很多的刚刚产生的具有超大潜力的算法,我们讲大语言模型,重感知新地图的算法,以及端到端的AI智能驾驶的算法,它们都展示出非常高的潜力,可能可以解决更多的问题,但是当下它去影响芯片的定义可能还需要三年的一个周期才能兑现。那么回到三年以内的周期,短期,我们能够使用的芯片其实都是有一定的局限性的。谁能把它用的好,更多的要去看你的部署能力,我们福瑞泰克公司在这上面会花非常多的力气,我简单罗列了两点。一方面做算法部署的优化,把算法进行各种异构的拆分,把它部署到异构的域控和芯片系统上去。另一方面也做系统全链路的优化,去更多的提高整个系统的短板,而不是说单纯地利用长板,这是我们的一些观察。
最后总结一下,智能驾驶软硬一体新生态创芯求异,我结合福瑞泰克公司做一个Tier1摸索经验,我们寻求的差异可能是这么三个异:异构芯片,可能是另一种解决方案和思路。由异构芯片组成的域控制器,在当下更具有落地实施意义。单纯地感知芯片和完整的智驾解决方案之间还是有非常大的差异性的。
以上是我全部的内容,感谢大家了解福瑞泰克公司和我们的产品,这是我们的ODIN数智底座和四大技术支柱的技术特色,谢谢大家!
|