汽车城吴俊贤:车路云一体化多元数据生成的开源仿真场景集

2024年7月11-13日,2024中国汽车论坛在上海嘉定举办。本届论坛以“引领新变革,共赢新未来”为主题,由“闭门峰会、大会论坛、10多场主题论坛、9场重磅发布、主题参观活动”等多场会议和若干配套活动构成,各场会议围绕汽车行业热点重点话题,探索方向,引领未来。其中,在7月12日下午举办的“主题论坛五:高级别自动驾驶加速,驱动未来出行革新”上,上海国际汽车城(集团)有限公司智能网联汽车事业部部长、上海车云数据科技有限公司总经理吴俊贤发表精彩演讲。以下内容为现场演讲实录:
汽车城吴俊贤:车路云一体化多元数据生成的开源仿真场景集
非常荣幸今天能够有机会和各位领导、各位专家交流一下,“车路云一体化”生成的开源仿真场景集以及相关工作,正如刚刚王耀总所说,我们不管是在去年年底拿到“双智试点”的第一名,包括今年刚刚入选了全国第一批“车路云一体化”试点城市,对我们来说都是非常大的荣誉,同时也是非常大的责任。
包括昨天辛国斌副部长来我们汽车城调研的时候,其实也是各个示范区面临同样的灵魂拷问,就是我们商业模式到底在哪里。正好也借此机会抛砖引玉,跟行业各位同仁、专家进行交流,也欢迎大家多来汽车城开展指导。
我的汇报分成四个部分:第一部分是整体建设背景,第二部分是建设目标,第三部分是技术实现的路径,第四是这套开源场景集到底能够实现什么样的应用。
第一块,首先也是介绍一下“车路云一体化”发展背景。
刚刚我们由中国工信部、公安部、交通部、自然资源部以及住建部发布的“车路云一体化”试点,其实“车路云一体化”这个名字并不是非常新鲜的名字,它是2015年由上海国际汽车城获得国内第一个智能网联汽车试点示范区以来,从2015年到现在接近10年时间,对于智能网联汽车长线推动。在工作基础上开展试点应用,主要也是为了解决行业面临智能化基础设施投资和建设标准还不清晰,车辆智能化和基础设施相互赋能效果并不明显,跨领域融合并不充分的挑战,针对这些挑战,我们由20个城市共同携手探讨怎么解决这些挑战的问题和路径。
讲到“车路云一体化”试点,试点由多个城市共同发起的一个区域性的工作,我们正好也借此机会介绍一下上海国际汽车城以及嘉定区。这次标出的几个城市:南京、无锡、苏州、杭州,都是入选这一批“车路云一体化”试点20个城市之一,我们整个嘉定区位于上海西北门户,同时上海国际汽车城位于嘉定西南区域,其实我们可以看到这块区域基本在整个长三角核心区域。
根据之前协会的统计,在整个长三角区域,4小时车程范围内基本就可以打造或生产出一辆汽车的全部生产要素,并且也是长三角区域基本在全国汽车产值、产量方面,基本占到三分之一的比例规模。
所以,我们整个长三角率先一体化包括车路云方面的打通以及试点方面的打通,成为整个行业非常期待的工作。
接下来,介绍一下国际汽车城,是工信部和住建部共同开展的“双智试点”承建单位,并且我们是从2001年开始,经历了二十多年的建设,整体核心区是25平方公里,并且我们也是承载了全国第一个电动汽车国际示范区和智能网联汽车示范区,并且也是见证了中国第一代轿车的诞生,包括中国第一条测试开放道路、第一张测试牌照、中国馆藏第一的汽车博物馆。
前面是简单介绍了一下整个嘉定区汽车城的区位优势以及我们所做的行业拓展方面的努力,接下来具体介绍一下我们在智能网联汽车推动方面的工作。
第一项工作是场景开发。众所周知,智能网联汽车早就已经不是实验室或封闭区里面的东西,它现在在开放道路上从最早的道路测试到示范应用到商业化示范运营。嘉定区目前累积开放了636条、1117公里整体道路,我们实现了嘉定区域全覆盖,并且开放了国内首个大流量、高动态、高复杂的高速公路这样的情况,这样给到智能网联汽车实现非常大范围的测试场景。
接下来,有了测试场景,我们在不断推动道路测试和示范应用,目前累积已经有21家企业、639辆车在嘉定区持续开展智能网联汽车道路测试和示范应用。
这块就不再详细展开了,接下来是汽车智能化和整个交通智能化,在智能化领域形成非常好的交叉点,我们国家从2020年年底开展“双智试点”工作,这也是我们开展“车路云一体化”试点非常重要的基础,“双智试点”是按照国家整体“1+1+N+1”的一套部署,我们也是在整个嘉定区和汽车城核心范围内,在230公里道路上建设了287个智慧路口,同时打造国内首张IPV6网络,并且我们也是打造了国内首个能够支持实时数字孪生的数字底座以及在所有道路上实现高精度地图覆盖。
这是我们开展相关工作的基础,刚刚已经讲了整个数字孪生平台,我们目前数字孪生平台能够支持一万辆L4级别和10万辆L3、L4级别车辆实时接入,并且能够支撑城市级仿真孪生。这是我们前面做的工作基础,今天围绕工作基础进行展开具体给到各位领导。今天是我们汽车论坛,汽车论坛上我们着重介绍对于整个汽车行业相关赋能。
前期,我们也开展了大量工作,比如实时数据怎么给到车辆红绿灯数据准确度的补齐,包括事件信息,怎么给到我们一些超视觉的感知以及事件推送,今天我们讲的一些主题,更多围绕海量数据集如何支撑企业研发,包括企业安全度验证。
首先,我们做任何工作,不是闭门造车或自以为是。我们希望做的工作可以解决行业共性痛点和实际问题,我们跟大量友商包括行业专家交流下来,尤其针对现在大模型架构,数据短缺是大家面临的非常重要的问题。各家企业都建立了自己数据闭环平台,但各个平台之间并不打通,同时各家数据又需要有一个数据训练的平台,现在各个训练平台又无法保证数据的完备性。
综上所述,目前各家企业缺乏数据训练的海量性和完备性的问题。这块海量数据可以通过“车路云一体化”试点,接近300个基础设施或大规模基础设施,7×24小时数据摘取进行补充。
第一,我们希望实现数据采集。刚才标题是基于“车路云一体化”多源数据,在车路云上面已经对多源进行了阐述,一方面通过车辆采集大量监管数据和运行数据,通过路端会采集到大量路侧基础设施数据,包括路侧视频摄像头,AI摄像头以及路侧毫米波雷达、激光雷达点云信息和感知信息。同时我们还跟一些大量政府云进行打通,政府云信息包括政府气象信息、道路交管信息以及城市治理信息,这是第一步数据采集。
第二,数据存储。通过可靠的光纤等传输方式把数据存储到高性能云平台,并且对于整个数仓进行分级分类的管制。
第三,数据治理。进行数据分析保证数据的质量。
第四,其实海量数据随处可见,但具备高价值的数据非常少见。举个例子,可能这片海域非常广阔,但在这片海域里面真正有价值的鱼并不多,所以我们也是希望能够建立一些数据价值提取的机制,能够从这些海量数据里面不断挖掘到有价值的场景或有价值的数据,再把这些数据,其实真实发生的场景并不是那么常见,但可以根据人类的经验对场景进行重构。比如我们可以七分真数据、三分重构数据,重构出更高的场景,最后通过这些场景回灌到车企研发平台进行算法训练以及模型验证。
这是我们整体建设思路。
基于这个建设思路,我们整体建设意义,尤其所有车企都在提出端到端和大模型基础上,我们能够对于端到端进行补充,并且对于端到端性能进行训练,包括仿真和测试,基于“车路云一体化”大量闭环测试验证,这些测试验证工况哪里来?就可以从道路非常罕见的工况里面进行提炼,同时我们也可以基于这一套对于每家车企水平提炼之后可以划一条及格线,为我们政策和标准制定提供一些依据,最后希望这些动作能够让企业产品变得更加智能,最终回馈到企业,产生更好的营销,开拓更大的市场,最终实现商业价值共赢。
这是我们整体的思路。接下来,讲一下我们技术是如何实现的:
目前,我们上海国际汽车城是基于“车路云一体化”数据,第一阶段在60个路口覆盖120公里,这些路口具备地域多元性,基本能够覆盖城市主干道、城市次干道、农村道路以及园区内非标准道路,这项工作从去年秋天开始到今年夏天,涵盖了上海绝大多数可以经历的一些极端天气,以及上海台风天和梅雨季,以及晴天、夜晚,基本涵盖中国百分之七八十的交通以及天气工况,并且我们是采取实时性采样方式,尽量贴合C端需求,一方面我们有自己的采集车,另外我们采集了自动驾驶车辆前端的摄像头进行独立场景的重构。最终在这些采集基础上自动挖掘,并且采取自动化提取的机制。
模块来说分成几大模块:
第一,采集模块。从路端数据、车端数据采集到海量信息,经过数据筛查、数据存储和数据清洗,把海量信息里面有价值的场景元素提取出来,对这些场景元素进行自动化标注和自动化挖掘,并且进行特殊设置,通过这些设置之后配置多模型训练,并且适配L4、L3、L2级别算法模型开发。
接下来,我们通过实际样例展现一下场景挖掘。
(展示视频)
所有数据都是来源于真实的路况和工况,这次采样也是覆盖了汽车城核心区域范围。
我们右边是真实路侧摄像头截取了一段视频,左侧是基于特殊驾驶场景的重构,刚刚是对非典型性停车进行重构。
我们简单地展现一些在这段时间提取非常具有典型性或非典型性的事例,我们进行仿真场景可视化的样例。接下来,我们有了这些样例之后,怎么形成商业化闭环的应用,在此也是跟各位领导和各位专家进行分享。
第一个应用,是自动驾驶训练集,现在基于大模型开发,一定是三个大:大数据、大模型、大算力。其中海量算力能够对整个模型进行前期训练。
第二,就是测试。训练效果到底好不好,其实每家企业有自己一杆尺,包括车企开发典型的环节VIL、MIL、SIL、HIL、DIL环节,围绕整个开发周期,每一道测试都可以通过仿真进行加速。 
第三,我们对它进行评测以及准入性考试。最终决定它是否能够具有上路的能力或安全的底线。
前面三个应用类比于人来说,第一个应用是大量的教材,让你能够学习到更多新鲜的知识,第二个应用就是自己买的大量课外作业和模拟考卷,第三个应用其实就是内容最终评判你是否具备升学能力或是否具备拿到一些学位最终的考试。三个体量,第一个体量是非常大的语义理解,第二个体量相对来说非典型性工况进行的训练集或测试集,第三个就是最终的考题库。
第四个应用,做这些事情最终还需要人,上一个环节对X-GAME进行了正式发布,我们希望更多高校学生以及企业开发人员,能够认可这套开发逻辑,对数据感兴趣,并且对数据集不断提出新的要求和需求,让我们不断迭代去改进,变得更好。
所以,最终也是希望通过对于产业进行提升,对于人才进行集聚,我们能够打造构建智能网联数据服务开放生态,实现产业链集聚,最终能够推动产业发展和进步。
最后,今天也是对于“车路云一体化”开源仿真场景集进行正式的发布,我们这次仿真场景集是由中国汽车工业协会牵头,汽车城、车云数据公司、众链科技进行具体赋能,具体讲一下开源场景集的情况,最主要是解决数据体量不足和数据孤岛的问题,整个工作在协会牵头下在2024年3月份就开始了开源计划,目前在下载链接上就能够看到我们这些开源的场景集,也希望大家对我们场景集多提要求和建议,也可以督促推动我们不断改进和发展。
最后,讲一个自己的愿景:我们大家学过数学的都知道,没有一个人可以画出一个完美的圆,但我们根据数学定理都知道完美的圆是一定存在的。就像我们大家都希望未来总有一天能实现零伤亡、零拥堵的出行体验,但可能在此过程中,完美并不是能够实现的,但我们相信随着技术进步,我们能够不断画出一个接近完美的圆,谢谢大家!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)

主页 > 新闻资讯 >


读者留言

看不清?点击更换