2024年3月15日,中国电动汽车百人会论坛(2024)在京开幕。围绕“巩固和扩大新能源汽车发展优势”这一核心议题,中国电动汽车百人会论坛(2024)将举办1场高层论坛、1场国际论坛、2场闭门会议、10场主题论坛,全面强化高端前瞻、全球视野、跨界融合的论坛特色。
在3月17日上午举行的智能汽车创新技术与产业论坛上,鉴智机器人联合创始人、CEO单羿发表了观点。
以下为演讲实录:
各位领导,各位同行:
大家下午好!我是来自鉴智的单羿,今天在这里跟大家分享一下鉴智基于双目传感器的强AI的自动驾驶的解决方案。
为什么我们这个时刻抛出这个方案,我们在意的是两个事情,一个是差异性,另外一个是极致的性价比。我们今天看在整个自动驾驶的行业里面有一个非常重要的问题,就是我们所装配的车大部分是25万以上的车型,如何能够把我们的自动驾驶变成一套更加普惠的系统,从我们看来,简单的去走一个性价比的路径,最后带来的只能是价格和性能之间不断去博弈,所以我们需要差异化的技术和产品路径,能够带给我们真正更加极致性能和极致价格的一套解决方案,鉴智这家公司就推出以双目立体视觉为核心的一套方案。
首先介绍一下我们公司,我们是一家做自动驾驶系统方案的公司,成立的时间不是很长,两年半时间。但我们在这个行业里也有一些实际的量产,我们在L2ADAS领域共量产了近100万套的解决方案,同时我们双目的硬件产品也获得了50万套的量产定点,非常有幸的是,今年我们在高阶NOA项目上也获得了40万套量产的定点,并且今年10月份会搭载6个车型推向市场跟大家见面。
我们在2021年公司成立的时候看到的一个契机,就是从L2的ADAS系统向高阶的NOA点到点的辅助驾驶跃迁的时刻大家遇到了一个性价比的问题,我们看到这个系统是从激光雷达和视觉不断博弈的过程中,以及我们用什么样的AI方式去驱动这套系统的智能化,从这个时刻进行切入。我们选择的是纯视觉的路径,但是我们思考了一下视觉这件事,本质上我们传感器是为了帮助我们更好的获得数据,我们的想象是,是不是可以用视觉维度的提升来获得我们对数据量需要维度的降低,如果是这样的方式我们就可以更快地实现更好的辅助驾驶。
第二点,我们去思考无论是BEVOccupancy这样一些算法的框架是不是有些新的范式能跟我们的传感器进行结合,我们也很荣幸在这个过程中为行业推出了一些新的范式。我们也看到,从去年开始大家不断推向城区,我们对城区的思考认为这件事情会非常复杂,一定会和我们真正纯AI的技术进行融合。
我们这个团队是一个有过成功创业经历的团队,包括在AI芯片、AI算法,由深鉴和地平线的早期员工构成的,我们这个团队对于极致性价比的理解更加符合系统化的思考,能够从传感器到AI算法、到芯片的优化部署,系统级地去思考这个问题。我们的目标就是,以差异化的方案切入,以极致性价比给行业提供量产,并且通过标准化进行复制,真正让自动驾驶变成赚钱的生意。
首先介绍一下我们在数据、在传感器侧的工作。我们在行业里第一批推出了AI驱动的双目立体视觉的传感器,视觉最大的优点,跟激光雷达相比,可以获得10倍的信息稠密度。左边这张图就是我们用双目立体视觉AI的算法所获得的点云的深度信息。第二个图所讲的是,我们知道在过去一年里Occupancy变成一个非常火的话题,我们如果依据这个获得的代价就是大量的数据积累,我们利用双目立体视觉利用1%的数据量就可以获得更加好的更加细腻的Occupancy效果。
我们AI驱动的双目立体视觉能够在以下三个地方帮到我们NOA功能的演进:第一个,对通用非标障碍物的检测,尤其是越远越小的物体,我们需要一个更加精密的3D传感器,像素级在这里面是非常重要的保障。第二个,我们不仅是对单一的物体,对场景中的3D结构拓扑,也可以很好地通过我们的立体视觉得到归纳总结,提供给我们智能化的这套系统。第三个,我们谈到数据闭环的时候需要量产车和闭环的系统达到严密的吻合,所以通过双目立体视觉这套量产的方案,可以更好地实现一套不依赖激光雷达的数据闭环。
从应用的角度,我们后边也会去分享我们怎么看待这样一套AI所驱动的立体视觉的系统,以及我们强AI的大脑如何能够在整车智能、多合一的功能上带给我们的车厂和消费者不同的体验,不仅仅是自动驾驶。
我们也非常欣喜地看到,行业同行和鉴智在一并努力下,我们看20年前双目立体视觉属于斯巴鲁、梅赛德斯—奔驰这样的车企使用,更多的在L2ADAS领域,从去年开始AI驱动的双目立体视觉由中国的供应商推广到量产车,包括前面伙伴提到的量产方案。我们看到,今年开始整个双目智驾方案的渗透率已经达到了10%,后边这个趋势非常明显地能够给行业带来真正起量的解决方案,我们依然还是一个观点,AI这件事情并不是阳春白雪,并不专属于高端小众的车,而是属于最大量的量产车型,才能够实现最好的人工智能驱动的自动驾驶。
从算法角度,我们看到这个行业从后融合的传统专家AI方案,到从2021年开始进行前融合BEV/Occupancy和Transformer这套方案,鉴智很容易在这个过程中推出了在行业里的可以称之为范式算法角度的创新,比如2021年推出的BEVDet和一系列的BEV相关工作,都在行业里有强大的影响力。我们在2022年推出Transformer相关算法的框架,并且这些已经搭载到我们即将量产的车型上,今年会和大家见面。
我们判断下一代自动驾驶系统更加会贴近AI大模型驱动的自动驾驶方案,但是我们在这件事情的前提一定是把端到端的车上的部署先去实现,所以我们在2023年推出了GraphAD这项工作,并且和我们国内的一家头部车企进行了量产上车的实践,目前看这个效果非常符合我们的预期。
这是我们在GraphAD上的一个工作,这就是一个车载端到端的自动驾驶系统,我们的算法把静态的目标、动态的目标以及鉴图定位、规划决策在一个网络上里实现,我们在不同指标上都获得了更好的效果。
接下来要讲的一个角度是算力,大家可能会很奇怪为什么自动驾驶这件事情我们会和算力的芯片结合在一起。这里边最重要的事情就是能帮我们去降低成本。因为我们这个团队具有非常丰富的在辅助驾驶领域芯片量产的经验,我们知道如何将一个模型去更好的发挥这颗芯片上计算的优势,同时避免带来的一些瓶颈。我们这个团队可以具备一些在行业里领先的技术,比如模型压缩,我们可以在不改变精度的同时使我们的算法模型技术算力极大的优化。我们对芯片如此了解,所以我们可以在不同的跨芯片平台上进行统一的部署。目前看我们非常推崇国内的地平线作为我们首选的芯片平台,在地平线的芯片平台上进行了两年的实践,尤其在征程5的芯片平台上,无论是帧率还是最领先的算法部署上,都是领先同行业的,并且我们的量产完全是围绕地平线的芯片进行展开,也可以看出这样国产化的芯片差异性给大家带来的商业机会是非常吸引人的。
接下来我会介绍鉴智机器人的产品方案,分三个角度来介绍。
第一个,我们在极致性价比的自动驾驶方案上的一套产品。
第二个,围绕整车智能化利用双目立体视觉如何思考做多合一功能的赋能。
第三个,行业里非常多的伙伴和车厂他们对自动驾驶参与的热情非常高,但是在AI驱动感知这里是有一定困难的,所以我们对行业推出了一个标品感知包供大家使用并且进行量产。
第一,PhiGO产品系统,自动驾驶的解决方案。
在这里分成三个级别的产品,最基础产品7VnR,就是7个摄像头,前视2颗双目立体视觉,后视加上周视4颗鱼眼摄像头。如果我们想做记忆行车,保证十字路口、左转等等这些场景更安全的效果,我们会推荐我们的客户再加上2个摄像头。
在城区的方案里边依然还是会非常重视觉,我们会推出11VnR的解决方案,目前已经支持了地平线、英伟达的芯片平台。
具体来看一下鉴智在极致性价比的7VnR高速的领航辅助驾驶的解决方案。刚刚我们的同行业讲,我们如何能够让20万以下的车,我们来去看今天市场的需求不仅是20万以下,我们现在10万左右的车都已经几乎标配了L2的ADAS,2024年开始大家就是更新换代的周期,所以未来的3年中我们会把领航辅助驾驶从30万、20万,做到15万、甚至10万的价格区间,我们圈套的产品在4000元人民币,包括Transformer、域控、算法的解决方案。我们所采用的芯片是地平线的征程6这颗芯片,并且配备SDMap来实现,我们也很荣幸在这套方案里获得国内头部车企的认可,也拿到了相应量产的定点。
我们的双目立体视觉这套传感器也会搭载在不同的产品类型上,我们看到它对通用障碍物的理解,不仅可以帮助我们的辅助驾驶,无论是在高速上、还是在城区里,更好地去判断远处的物体以及一些非标的近处小的障碍物,同时我们这套系统也可以更好地去驱动像魔毯底盘、智能车灯这样一些系统。右下方给大家看的是我们和我们的伙伴在进行的用双目立体世界去预瞄前方20米之内路面3D的信息,精准的3D信息配合我们的空气悬架和CDC使得我们的行车获得平稳的效果,这套魔毯悬架系统原来在百万豪车上搭载,随着我们对智能驾驶这套系统的利用,在同一套系统里不增加额外的成本就可以给我们的客户提供额外的功能,这件事情是非常符合我们今天降本的大趋势。左边是没有搭载双目预瞄和主动悬架的效果,右边是开启了对路面的预瞄和悬架的调节,可以看到车的平顺性有非常大的提升。我们判断无论是智能底盘、还是智能车灯,是和智能驾驶符合同一套的从感知到AI的分析、到最后的规划决策这样一套系统的逻辑框架,所以如何能够用一套成本实现多个功能,会是我们在接下来非常大的在行业里的差异性的供大家的选择。
刚刚也提到了,我们在量产的同时也看到有非常多的伙伴在不同层级去进行合作,比如我们做一个算法解决方案的Tier2和Tier1的合作过程中,很多伙伴会希望能够去获得一个标品的感知,这个标品感知并不是为了做样本拿项目,而是真正为了用它做量产,所以在我们的量产过程中,将感知进行抽取,把它形成一个标品的产品提供给行业使用。右边就是我们标品感知的实际效果,可以看到,无论是在高速领航辅助驾驶,还是在城区,都有相应的效果能够体现出来,一个量产的效果,可以和我们车厂的客户、可以和我们Tier1的伙伴进行非常好的配合,来去完成大家所需要的量产,也能进一步降低车厂的成本。
总结一下,鉴智作为一家在AI领域有十年从算法到芯片相应积累的团队,我们在三年前切入到自动驾驶这个行业,我们也看到这是一片红海,但是我们判断从L2向L2++到L2跨越的时候,可能某种程度上对于有能力提供高质量解决方案的公司来讲,可能是一个蓝海,是一个巨大的机会,所以我们秉承开放灵活、快速响应来助力行业伙伴获得成功。
从技术角度,我们依然看待AI是从数据、算法、算力三个角度来去协同优化,从数据角度,我们推出了AI驱动的双目立体视觉的这套硬件模组。从算法角度,利用我们十年间在AI端到端系统算法的积累,引领行业技术的范式。从算力角度,我们围绕定制平台,为这个行业提供极致性价比的算力优化方案。从产品角度,我们主打极致性价比,并且是多合一差异化的方案来去赋能行业。
最后一件事情,我们去命名这家公司叫鉴智机器人,也是因为我们在三年前看到自动驾驶会是机器人最先去广泛落地应用的一个场景,我们今天谈车身智能,我们是不是真的找到一个更比自动驾驶合适的场景实践这件事情,从我们来看,至少自动驾驶会是一个不可或缺的场景,我们从现在解决方案的专用智能向通用智能的跨越已经做出了端到端的实车模型的部署这样的第一步,后边是不是有机会将生成式的大模型进行融合,会是我们接下来的一个探索,我们相信在城区一定会跟大模型技术融合在一起。
谢谢大家!
|