过去几年中,我国的智能汽车行业蓬勃发展,汽车数据处理能力日益增强,汽车数据规模也愈发庞大。
就百度来说,目前百度的L4无人车收集的数据量达到2TB/台/天,其中包括了传感器、感知结果、车辆状态等全量数据,每天百度自动驾驶车队的数据总量达到300-400TB。而量产乘用车的上传数据量约为11G/车/月——仅包含高价值的数据,如特殊场景等。
这些数据的最大用途是驱动自动驾驶体验持续提升,也就是所谓的“数据闭环”,数据闭环可分为两类:
- 模型训练闭环:在发生一些极端场景的时候,采集车外的环境数据,主要是摄像头的数据(目前也有激光雷达的数据),回传到云端,进行数据标注、数据清洗、模型训练等,迭代出新的模型,经过仿真环境的测试和验证、实车上的测试和验证后,将新的软件更新到车上。
- 地图更新闭环:高精地图底图拥有3D的信息,能够帮忙自动驾驶车辆提前了解前方道路情况或者记录某个路段的历史车况,当高精地图上的信息与实际道路信息不相同时,就需要更新地图,比如出现维修路段的时候,需要将某段路的维修信息同步到云端,更新到云端的地图,并同时给多车辆应用。
但在上面这些数据的收集过程中,汽车数据安全问题和风险隐患日益突出,包括:
- 数据确权:数据采集后,数据归车企还是自动驾驶供应商?拥有这些数据是否合法合规?
- 数据防护:采集到的数据大都是非结构化数据,包括GNSS信息、图像信息、点云信息、轨迹信息等,敏感程度较高,如何用一些自主可控的安全防护手段去防护?
- 数据流通:数据闭环的全过程会涉及多设备、多地点、多团队作业,比如涉及到多个级别的企业,比如车企、自动驾驶一级提供商、二级供应商等,如何保证数据不会外泄?
其中最大的隐患甚至涉及到了国家安全,近期的各类管理办法有:
- 今年八月底,自然资源部发布《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,其实就明确了,智能网联汽车安装或集成了卫星导航定位接收模块、惯性测量单元、摄像头、激光雷达等传感器后,在运行、服务和道路测试过程中对车辆及周边道路设施空间坐标、影像、点云及其属性信息等测绘地理信息数据进行采集、存储、传输和处理的行为,属于《中华人民共和国测绘法》规定的测绘活动,应当依照测绘法律法规政策的规定进行规范和管理。
- 按照自然资源部的分级标准,只有拥有电子导航地图甲级资质的公司才能进行大范围的测绘活动,但拥有甲级资质的公司屈指可数,目前仅有19家,门槛颇高,外资的车企根本没法申请。虽然去年放低了电子导航地图乙级资质的申请门槛,但乙级资质只能在政府部门划定的自动驾驶区域内从事测绘活动。
- 去年八月,国家互联网信息办公室等五部门发布《汽车数据安全管理若干规定(试行)》,倡导在开展汽车数据处理活动中坚持“车内处理”、“默认不收集”、“精度范围适用”、“脱敏处理”等数据处理原则,减少对汽车数据的无序收集和违规滥用,而且不得违规向境外提供重要数据。
受限于数据安全,车企在智能网联汽车以及自动驾驶汽车的研发、量产过程中急需相关技术、经验与资质,目前的各大云服务厂商,在汽车领域布局的已经有:
下面先简单分享下百度的做法。
百度追求合规的思路:“原始数据不出车、测绘数据不出云、测绘成果不关联、资质图商全管控”。
提到资质图商,就不得不提到百度智图,百度智图背后的主体公司长地万方是全国19家拥有导航电子地图制作甲级测绘资质企业之一,在合规测绘方面有多年的技术经验。
百度自动驾驶云联合百度智图目前在做的工作简单概括就是“图商——百度智云当看门人”,包括:
一个中心:通过图商建立数据安全监管中心,监测自动驾驶数据闭环合规的数据使用过程、数据内容、数据载体的安全性。
三重防护:
- 工具链合规:通过点云抽帧、图像脱敏、可控标注、车辆监管等方式保证自动驾驶数据在训练过程中的操作合规,不接触测绘数据,不将测绘数据带走。(但目前图像脱敏的自动化程度如何?以及所谓的点云抽帧和可控标注会不会影响数据闭环效率?)
- 数据防护:对于智能网联汽车时空数据进行端到端的加密改造,保证数据的完整性、有效性、机密性、以及不可抵赖性,通过图商的密码服务体系保证数据由图商进行管控。具体来说,就是图商会建设一个密钥中心,这个密钥中心有数据的根证书,建立一个可信根,然后在数据处理的每一个环节都会对这个数据进行解密,每次解密的时候都要到图商的数据中心进行数据请求,图商可以监管到数据加解密的情况、数据使用的情况。
- 云平台防护:基于对云基础设施的网络边界隔离,容器防护,数据审计,安全存储等措施,保证智能网联汽车时空数据在云平台环境中的安全性,由图商监控网络边界连接状态,不会将测绘成果外发,造成数据的滥用、泄露等风险,抵御黑客对数据平台的攻击,防止数据被黑客窃取。
在自动驾驶方面,百度相比较其他云服务厂商确实比较有优势——毕竟自己的车队就不少:
- 百度自动驾驶云目前有三大解决方案:数据闭环、云仿真测试以及数据合规,具备全栈式优势。
- 数据闭环方面,可基于用户反馈构建车云数据闭环,但工具链可解耦,支持个性化定制。提供的主要是平台和工具链,加速车企去打造自己独立的灵魂。
- 云仿真测试方面,过去十年的累计自动驾驶里程超过3400万公里,场景库累积已有超过3千万个场景,对自动驾驶有深刻洞察。
- 自动驾驶云已经在合作的车企客户包括上汽和广汽。(吉利和小鹏主要跟阿里云合作,一汽主要跟华为合作。)
- 除了自动驾驶云,还有汽车云,能覆盖整个汽车产业链的上云需求,比如订单协同、物流调度、质量追踪、库存管理等。
- One more thing,在今年12月,百度自动驾驶云会升级到2.0,可能还会再释放些信息。
(文/洪泽鑫)
|