更轻的车,更“重”的云
2024年,汽车智能进化之路变得更为复杂和残酷。你争我赶的新品战中,粹炼出极速迭代的能力。你死我活的价格战中,激发出技术致胜的觉悟——也终于明确解题思路:
整个产业将在更“轻”的同时更“重”。
更“重量级”的云——通过建设云端强大的数据闭环和算力能力,车端因进化迭代所面临的技术与算力瓶颈被打破,“云”成为智能汽车进化路上强大的底层基建。
更“轻盈”的车——借助云端支持实现技术与成本减负,智驾等技术得以被普及到更低价格段的车型上。正攀登L4这座智驾珠峰的玩家,能够不断通过“技术进步+成本降低→产品落地”,来获得更大的市场。
我们判断,未来只有车、云携手进化,更能形成“以质换量”与“以量换质”的正向循环。
也正因为如此,“车云一体”成为了智能驾驶必然的走向。
腾讯智慧出行副总裁钟学丹的观点,代表了业内的一个普遍共识:“随着数据规模、算力需求的指数级增长,构建车云一体的数据闭环,对海量数据进行更高效的收集、存储、处理和分析,将成为智能汽车的核心增长飞轮。”
一切的变化,要先从端到端的爆发说起。
端到端、大模型能力成为划分第一梯队的分水岭
如果给智能汽车找一个2024年度关键词,“端到端”当之无愧。
倒不是因为特斯拉分别在年初和年尾发布了现阶段对于端到端技术而言里程碑式的FSD V12和FSD V13,而是因为,后文中我们将聊到的几乎所有与今年智能汽车相关的热词——“纯视觉方案”“云端算力”“无图化”“车位到车位”等,都与端到端技术密切关联。
众多车企今年重仓押注的端到端技术及基于端到端的AI大模型,将成为划分智驾第一梯队的分水岭——
谁掌握了更先进的端到端技术,谁就掌握了L2增长密码与L3乃至L4优先通行证。不但可以吃下更多市场空间,更可以优先把更高级别的智驾从测试场带到真实路面。
什么是端到端?
“端到端”的两个“端”,指的是感知端和决策端。
过去:研发者需要分别设计感知、预测、规划、控制四个部分的小模型。再根据具体功能效果,人力写成应对各种情况的代码。也就是说,从汽车感知路况,到做出反应,中间要经历若干个模块化设计好的步骤。
这种模式的主要缺点是,信息在传递和处理的过程中可能出现误差、遗漏和延误。有点像综艺节目里常见的传话游戏,中间传话人越多,原话被歪曲的程度就越大。
端到端:从感知端直接进入输出端,省略中间过程,实现无损信息传递。就像人类神经网络的工作模式一样,观察到周围路况环境,直接做出反应。
前者让汽车像一个执行复杂指令的机器人。而端到端技术爆发靠的是人工智能技术的进化——有望随着训练量的增加,使智驾系统成长为一名经验丰富的“老司机”。
2024年,玩家加速卷向端到端。
3月,特斯拉开始在一定范围内推送FSD V12,宣告端到端技术正式落地。
5月,特斯拉基于“端到端”的FSD V12在数月的训练时间内,超过了数年积累的V11。12月,FSD V13.2版本亮相,其最大的亮点是“从停车位到停车位”(Park 2 Park)的端到端驾驶模式。
这一过程要求车辆能在城市复杂多变的路况下应对自如。是对车企自动驾驶系统的环境感知、决策规划、执行控制能力最好的“活广告”——众多车企卷入车位到车位的竞赛中,作为展示其端到端的规格标准。
2024年国内官宣端到端落地部分智驾玩家:
华为:华为在9月宣布推出ADS 3.0,端到端架构商用落地,实现了从车位到车位的高阶智能驾驶能力。
小鹏:特斯拉FSD V12版本推送后,小鹏汽车创始人何小鹏在美国体验,并称其“表现极好”。作为端到端技术的拥护者,小鹏在5月20日正式发布了“国内首个量产上车”的端到端大模型——神经网络XNet+规控大模型XPlanner+大语言模型XBrain。
理想:2024年7月,理想在推送“全国都能开”的无图NOA的同时,发布了基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构。11月底,OTA 6.5版本车机系统推送,其中涵盖了“车位到车位”功能。
Momenta、商汤:10月智己汽车联手Momenta推出采用“一段式端到端”架构的智驾方案——IM AD 3.0。商汤绝影于11月底发布采用一段式端到端技术的AD Ultra,预计明年年底实现端到端智驾方案量产落地。
小米:2024年11月16日,小米汽车宣布其智能驾驶系统HAD(Xiaomi Hyper Autonomous Driving)将搭载在小米SU7 Pro、SU7 Max和SU7 Ultra车型上。升级最大的亮点是接入了端到端大模型技术。
2024年,伴随着端到端技术C位出道,车企从智驾硬件、地图方案,到算力部署,全都被搅动起来。
硬件上,随着更大规模的“端到端”落地,“去激光雷达”趋势更加明显:
与端到端技术深度绑定在一起的,是“纯视觉方案”。
●纯视觉方案:指汽车主要依赖摄像头获取和处理周围环境信息。非常依赖算法能力的支撑。
●与之相对的,是使用激光雷达、毫米波雷达等硬件来装备汽车感知端。
众多车企在今年发布“去激光雷达”方案:华为在今年发布的问界M7 PRO基础版的智驾方案中去掉了激光雷达;小鹏推出了全新一代AI鹰眼视觉方案,首发搭载在小鹏P7+上;前不久暴雷的极越,在8月份发布了“纯视觉+端到端大模型”的智驾方案ASD。
车企这么做的原因有二:
一是技术层面,相关算法和大模型日渐成熟,尤其是端到端技术的突破,使得车载摄像头敢于骑在激光雷达头上“仗势欺人”。
二是市场层面,摄像头比激光雷达更便宜,拿出纯视觉方案,就是拿出成本优势。
●普通环视车载摄像头模组通常单价在150-200元之间,行车ADAS(Advanced Driver Assistance System 高级驾驶辅助系统)车载摄像头模组则在300-500元之间。
●相比之下,单颗激光雷达价格即达数千乃至数万元。因此在过去多年里,激光雷达都只配备在中高端车型上。
“去激光雷达”的“纯视觉”及“视觉+毫米波”方案,成为了智能驾驶“杀”向下沉市场关键利器。
这也是为什么李斌一边强调“说激光雷达没用的,非蠢即坏”,一边蔚来旗下品牌推出了搭载纯视觉方案的乐道L60车型。定价二十余万的乐道L60,正是蔚来系中最便宜的车型之一。
地图方案上,随着更大规模的“端到端”落地,2024年加速了“去高精地图”趋势:
高精地图即绝对位置精度接近1m,相对位置精度在厘米级别的地图。在车内预置一套高精地图,相当于不仅有了路线地图,也将车道线、人行道、车站、红绿灯、绿化带等种种路况信息一并收入囊中。同时具备全天候、不间断的特点。
2024年“去高精地图”趋势背后有两个原因。
一是高精地图眼下存在几座难以翻越的几座大山:采集成本高、审核时间长、更新时效慢等。
成本:一辆测绘车的成本高达数百万元至千万元级别。分米级地图的测绘效率约为每天每车500公里道路,成本达每公里10元左右,而厘米级地图的测绘效率约为每天每车100公里道路,成本达每公里千元左右。
更新效率:不少图商只能做到3个月更新一次高精地图。用华为余承东的说法就是:高精地图的数据采集更新速度赶不上中国的城市建设速度。
对于很多车企玩家而言,不是高精地图不香了,而是在激烈的市场竞争中,等不了了。
二就是我们上文说的,“纯视觉+端到端大模型”的技术路径已经逐渐成熟:汽车无需高精地图,靠车端视觉感知系统和大模型提供的决策能力就能搞定自动驾驶。
换言之,智驾成功的关键要素,已经从从车端装载的高精地图,转向了云端训练的大模型。让摆脱高精地图成为可能。
腾讯“多图合一”生产模式
目前不少玩家采取的方案,是在大多数简单的路段采用导航地图,部分复杂路段则挂接轻高精地图来保障体验。较为激进的无图化方案中,则连轻地图也一并不用,仅使用导航地图。
●所谓“轻高精地图”或“轻地图”,是一种折衷方案。
其精度和信息量介于导航地图与高精地图之间,是综合平衡整体感知定位效果与地图成本之后的结果。
2024年,华为、小鹏、比亚迪、理想、小米都先后推出了各自的无图化方案。
针对于此,作为图商的腾讯提供了更灵活的解决方案——“多图合一”的模式。
腾讯做到也业内首个一体化生产体系,把标准地图(SD Map)、辅助驾驶地图(ADAS Map)、高精地图(HD Map)等不同精度等级的地图数据融合在一起,按需灵活使用,让不同地图的功能实现优势互补。
与传统的不同地图先独立制作再互相关联的做法不同,腾讯的“一张图”生产模式做到了数据同源、解决了重复投入、数据不匹配、更新频率难统一等问题。
2024年另一地图趋势是“加速入云”。
例如,腾讯的智驾云图,是将车端实时感知数据、驾驶行为经验信息和车企自有数据资产等上传云端,实现云端多程建图。
云端建图的另一个好处,是帮助车企将自有数据与云图提供的数据信息融合使用,更好地发挥数据价值。腾讯将智驾地图分成多个图层,包含基础地图图层、运营图层等,车企可以根据自身需求灵活配置并管理图层,并通过和车企自身数据图层结合,搭建适合自身的数据驱动运营平台。
通过高鲜度的地图数据,及时有效的环境信息和动态交通信息,车企也可以在云端训练出“驾驶经验”更加丰富的大模型,加速智能化进程。
很明显,随着端到端的加速落地,车端正在“变轻”——去高精地图也好,去激光雷达也好——车端成本的降低,得以让智驾等技术被普及到更低价格段的车型上。
但新的挑战也随之出现:
上文所述,谁先掌握更先进的端到端技术,先一步训练出一个能像人一样决策的AI大模型,谁就在智驾路上独占鳌头。但一是端到端技术及各种大模型都十分依赖算力和数据。车端无法承载超高算力和海量数据。二是专注模型和算法的迭代极度烧钱。
除了“硬件减负”,车端还必须在算力、模型上变得更轻盈——才能在持久战上形成市场和技术的正循环。
更轻的车,需要更“重仓”的云
AI大模型的成长,必须拥有承载海量数据的能力,即庞大的算力和数据闭环能力。
2024年,智驾领域数据采集和处理走向2.0时代:从采集车采集到量产车采集;从标签搜索到大模型挖掘;从人工标注到自动化标注;从路侧测试到仿真测试,再到大规模并行仿真测试。
数据与算力能力带来的“马太效应”也在加剧,车企迎来“以质换量”与“以量换质”相辅相成、不断循环的时代。
理想总工程师马东辉这样形容未来智驾竞争模式:从端到端开始,才是真正使用人工智能的方式做智驾。而人工智能需要大量的数据和算力,会让具备高阶智驾车辆保有量以及充足研发投入的企业,在智能驾驶方面的优势增加,并且实实在在地促进销量提升,而销量提升又会带来保有量和研发投入的提升,形成滚雪球过程。
何小鹏的观点如出一辙:车企要赢得进入未来竞争的入场券,至少每年要销售100万辆AI 汽车,数据积累量的差异会让产品与产品、企业与企业之间的差距越来越大。
所有人都意识到,围绕算法、算力、数据的底层能力,是未来拉开差距的关键。
智驾“卷”向云端,从“再现”到“训练”
但车端的“三个难题”正影响竞速的步伐。
一是在大模型的训练上,车端算力相对“捉襟见肘”。某车企提到,其云端大模型的参数量将多达车端参数量80倍。
同时目前市面上的汽车芯片,有不少性能虚高,算力不足,而真实算力强的,往往功耗居高不下,散热困难。
二是成本问题。汽车芯片太过“烧钱”。如英伟达Orin-X的单芯片价格达400美元左右,约合人民币2800元,双芯片方案约合人民币5600元,四芯片方案则达到了1.12万元。
三是不少车企和自动驾驶 Tier1遇到的数据难题——
●数据采集方面,车辆分布广、数据收集难:
如前所述,数据采集来源已经逐步从传统的采集车过渡到上千万量级的量产车,庞大的采集量对网络的接入质量、稳定性能、分布式云的能力提出了考验。
●数据存储方面,数据容量大:仅一辆汽车单日产生的数据量,就是TB级的。
●数据处理方面,处理难度大,模型复杂度高:由于数据量和系统极为庞大,每次改动涉及到的的模块可能都是上百乃至上千。如何评测每个模块的代码质量,如何检验各模块之间是否有冲突,都极为复杂。需要有对应的工具能快速串联数据接入-标注-训练-评测等环节。
●数据采集和使用的过程中,政策法规多、合规约束严:我国汽车行业的安全合规要求正不断完善,已经陆续颁布了数十项规定。不是谁都有资格进行数据采集。
这也意味着,智驾汽车进行数据采集,需要拥有相应的测绘资质,或借助有资质的供应商来实现合规。
一切都指向了云端算力和“车云一体”的数据闭环能力——车企把算力布局的更多注意力和重心放到云端。把云端构造的智能化成果输送回车端,靠的就是“车云一体”方案。
数据闭环五大支柱
先看云端算力增长能带来多大的技术迭代效率提升——
大洋彼岸,特斯拉早已重仓云端,并在2024年算力飙升。
2020年,特斯拉每辆卖出的车上都搭载Autopilot辅助驾驶功能,并在同年积累了30亿英里Autopilot行驶里程。特斯拉依靠云端超算中心处理这些数据。
2022年,特斯拉将其最大超算中心规模扩充到了7360张 A100 GPU。车端大量数据+云计算能力,让特斯拉在一众智驾玩家中率先形成“车云互通”的数据闭环。这是其得以在2024年最先卷出FSD智能驾驶算法的前提。
2024年,特斯拉算力规模迎来近乎90度的陡然飙升。
图源:特斯拉
国内以华为为例。目前华为智能驾驶云端算力达 5E FLOPS,支撑“华为ADS”每日3500万公里仿真训练里程。
再看“车云一体”的数据闭环能力。即:从车端的数据采集,到通过网络传输上云,再到云端进行数据和算法的处理,进而迭代新的能力再下发到车端,实现功能升级。
“车云一体”的数据闭环所带来的,就是整个数据链路的运行效率提升:降低开发运维难度和成本、加速应用创新和发布速度、降低实施落地的风险。
再强大的算力和数据量,如果缺少这种能力,就像厨房里准备好了丰富食材,却没有好用的厨具和技术高超的厨师,食材无法有效利用。
车端部署小模型,云端训练大模型这种车云一体循环,是一种必然的趋势。
如腾讯智慧出行副总裁钟学丹所说,车云一体化的连接,是让车端变得更轻、更可靠,通过云端来获得无限的扩展空间和快速的迭代能力,让用户体验持续焕新。
“造车”的成败关键,再次回到“基建”上。只不过智驾的新基建,不在地面,而在云端。
谁更专注新基建?
捋清“车轻云重”的趋势后,一个更大视角下的事实也呼之欲出:
中国汽车在电动化转型的浪潮中已经拔得头筹
●至2023年,我国新能源汽车产销连续8年全球第一。
●2024年11月14日,我国新能源汽车年产量首次突破1000万辆。是全球首个新能源汽车年度达产1000万辆的国家。
它离不开我国强大的供应链网络优势。
中国新能源汽车拥有全球最完善的供应链体系,比如全球 75% 以上的锂电池在中国生产;配套设施方面,今年7月底,全国充电桩数量突破千万,其中公共充电桩320.9万台,而欧洲公共及半公共充电桩到7月份仅90万根,美国公共充电桩仅20万根。
从材料研发、工程设计到制造管理、总装集成,中国新能源汽车已形成一批契合“国内大循环为主体、国内国际双循环相互促进”要求的汽车产业集群布局。
而到了汽车产业从电动化往智能化疾跑的当下,中国互联网企业带来的“数智化基建”正形成我们的新助力。
过去多年里,腾讯、阿里、百度等企业均构建出成熟完整的业务体系。当互联网大厂齐齐进入智能汽车产业链时,却选择了两条不同的路径:
一条是既造车,又提供技术服务。另一条是专注做好汽车智能化的基础设施工作。
前者的代表是百度和阿里——百度、阿里各自通过合资的方式下场造车。这条路径也意味着,在智能汽车产业中,互联网与车企既是提供技术的甲乙方、又是竞争对手。在合资造车的同时也需要平衡与其他合作企业间的关系。
后者的代表是腾讯——主要以“数智化助手”身份进入智能汽车产业链,不造车,而是提供云、地图、AI等技术,以及社交、娱乐、出行、协同办公等生态服务。
而当“端到端”、“车云一体”成为行业大趋势后,人们更多把目光聚焦于——中国互联网企业将如何以云、图等技术为基础,为产业伙伴带来基于云端的更低研发成本和更多产业创新。
华为将其云服务贯穿于企业造车(数字化研发、生产、供应链管理)、卖车(数字化营销)、出行服务(车联网、地图导航、内容生态)全价值链。百度一边造车,一边也将力量放在了供应链与自动驾驶相关服务上。过去几年,阿里云在自动驾驶算法上的投入与研发在近两年未到看到大进展,开始逐步将重心更多转向自动驾驶云开发平台服务与算力支持。
腾讯的战略定位比较克制——1)目前为止,腾讯坚持不造车,定位于车企及Tier1供应商的伙伴。2)腾讯云的服务除了贯穿汽车全价值链外,专注于智能汽车“冰山下的基建”。
相较于其他供应商,腾讯更早把针对智驾的云服务从众多行业中单独划分出来。
●2024年6月,腾讯在上海专门建设了智能汽车云专区,被认为是业界第一个建设汽车专区的云厂商。
同时发布一站式智能汽车云解决方案,也是行业首个专为智能驾驶打造的一站式云。
这种“埋头搞基建”的专注力让腾讯逐步在自动驾驶云等领域取得一定优势。
比如提供车云一体的数据闭环能力上——腾讯云可提供车端的数据解决方案、云基础设施、云上的数据平台、AlInfra算力平台,以及端到端的安全及合规五大核心能力。
再以合规举例——数据在车端采集之后,还涉及到一系列数据安全相关环节环节,包括分类分级、脱敏、加密等流程。腾讯的优势在于——同时坐拥“甲级测绘资质图商”和“国内一流云服务商”双重身份,并通过组织架构设计,确保云业务与地图业务同属一个事业群,技术融合与业务协同十分高效,面对智驾政策法规等变化,合规响应及时到位。
《星船知造》了解到,已有车企和腾讯云合作,已经端到端打通了整个链路,云端能实现秒级捕捉变化、分钟级下发更新,通过云端成图释放车端算力,并结合多乘大数据融合算法,进一步提升地图准确率。在测试中,复杂路口的智驾通过率提升了20%。
算力方面,端到端所需要的AI算力集群规模,已从单一集群千卡逐步提升至万卡量级。腾讯可以提供高性能的算力集群,并且全面适配异构芯片,通过多芯混用的集群来为自动驾驶提供更大的算力,进而减少对单一芯片的依赖。同时,车企大模型训练提供了完备的工程工具,如开箱即用的机器学习TI平台,全面支持一键调用多种领域的预训练大模型并且能够通过技术优化,实现2倍以上的推理加速。
据腾讯集团副总裁、腾讯智慧出行总裁钟翔平介绍,目前已经有九成车企选择腾讯云,覆盖100多家车企和出行科技公司。
获得广泛合作的背后,其实与腾讯不投机、做好“数字化新基建”的定位、以及腾讯本身的企业基因都有关系——
虽然腾讯至今坚持不造车,但其实腾讯是一家在社交、娱乐、办公、AI大模型、出行服务、生活服务、金融服务等各个赛道,都有头部产品的互联网企业。而其专心搞汽车数字化基建的态度,正把其重连接、强生态的企业基因和强大的技术实力共同释放。
如蔚来CEO李斌所说,借助腾讯在行业内领先的云、图等能力,蔚来与腾讯实现的,是双方资源的高效整合,从而在智能座舱应用、自动驾驶等领域,为用户提供超越期待的产品体验。
中国的互联网企业正回到它们的初心上来——做好数字基建、连接价值、共创生态。这将成为中国智能汽车产业的强大优势,在全球市场不仅“卷”赢销量与硬件品质,也将赢得汽车智能化的下半场。
主要参考资料:
[1]智能驾驶走向十字路口 纯视觉路线“异军突起”,激光雷达未到“抛弃”时.每日经济新闻
[2]腾讯发布车云一体数据闭环方案和智驾地图8.0,加速智能汽车演进
本文基于访谈及公开资料写作,不构成任何投资建议