本报记者 龚梦泽
图①自动驾驶机场线载人接驳
图②自动驾驶重卡京津塘高速物流运输 公司供图
图③行进中的主驾无人出租车 龚梦泽/摄
进入2024年以来,自动驾驶行业热度陡然攀升。在人工智能时代,自动驾驶目前是前景最为清晰、落地最为迅速的领域之一。2月份,北京市高级别自动驾驶示范区为百度、小马智行、AutoX安途和文远知行颁发高速道路载人示范应用通知书,准许在北京经济技术开发区(北京亦庄)至北京大兴国际机场航站楼之间开展载人接驳。这标志着全球首个首都城市机场自动驾驶接驳载人示范场景正式开放。
价值萌动,资本先行。随着自动驾驶技术和应用落地“吸胀萌发”,其潜在的商业价值快速破土,吸引了众多企业和投资者的目光。据同花顺iFinD统计数据显示,今年以来,国内外自动驾驶领域已披露的融资总额(包括IPO募资)达到168亿元人民币,同比增长121%。因此,对于自动驾驶行业来说,2024年注定会是不平凡的一年。
客运城市级应用落地
无人驾驶重卡走进现实
“经过各方共同努力,近年来,我国自动驾驶相关产业和市场规模呈快速增长态势,自动驾驶技术由测试示范稳步迈向商业化应用。”中国汽车工程学会理事长张进华如是称。
今年3月下旬,《证券日报》记者也前往首都城市机场自动驾驶接驳载人示范区试乘,出行体验远超预期。从亦庄天骥智谷产业园外的上车点上车,安全员已在主驾位就座。记者后排落座后,面前屏幕上出现了“开启行程”的按钮。点击按钮,自动驾驶汽车一键启动,直奔机场。
“车辆很聪明,不仅能看清前面的路,行驶过程中还能自动寻找最优的行进路线。”自动驾驶安全员刘师傅称,从试车员变成安全员,尽管同样是坐在驾驶位,但工作内容发生了改变。安全员最重要的工作就是在紧急时刻随时接管车辆。不过,这种紧急情况已经很少见。
以机场接驳为例,此次自动驾驶接驳载人示范路线途径黄亦路—京台高速—大兴机场北线—机场高速—大兴国际机场,其中高速场景约40公里,全程几乎不需要安全员介入。
按照系统规划路线,自动驾驶汽车进入大兴机场高速后,路上车辆逐渐增多。自动驾驶汽车本在最内侧车道上行驶,突然屏幕发出提醒:找到更优车道,正在尝试变道。变道过程中,车辆先是自动开启转向灯,随后车速逐渐下降,方向盘微微向右转动,利落切换至右侧车道。
这是北京首次面向公众开放高速公路自动驾驶。驶出大兴机场高速时,收费站排布着10多个通道,分别标注着“ETC”“人工”和“临时关闭”。在众多通道中,自动驾驶车辆准确识别出ETC通道,并选择了一条排队最少的车道顺利通过。
“寻找最优路线换道、安全条件下自动超车、自主盘绕匝道和通过高速收费站,自动驾驶车辆现在都能高效地完成,有时候感觉自己驾驶都不如它稳当。”刘师傅笑称。
随着国家级车联网先导区、智慧城市基础设施与智能网联汽车协同发展试点等工作的深入开展,北京率先规划建设了全国首个高级别自动驾驶示范区,迸发出强劲的新质生产力。按照规划,亦庄示范区的建设正按照1.0阶段(试验环境搭建)、2.0阶段(小规模部署)、3.0阶段(规模部署和场景拓展)、4.0阶段(推广和场景优化)的步骤层层推进。
据北京经济技术开发区管委会副主任、北京高级别自动驾驶示范区工作办公室主任王磊介绍,目前北京正在进行高级别自动驾驶示范区4.0阶段的规划,初步考虑能够覆盖四环到六环之间的平原新城大部分面积,这样就可能具备初步推动全面商业化落地的基础条件。
“今年年初,本市已经实现了示范区至大兴机场的自动驾驶接驳以及城市副中心三大文化建筑周边的短途接驳。”北京市高级别自动驾驶示范区工作办公室相关负责人在接受《证券日报》记者采访时表示,接下来还将逐步开放更多场站,实现在北京南站、丰台站、朝阳站、清河站、城市副中心站及大兴机场、首都机场“五站两场”开放接驳,打造更多自动驾驶应用场景的标杆案例。
体验过机场线自动驾驶载人接驳后,记者又驱车赶往了国内首家跨省自动驾驶重卡示范区应用许可的企业仓库,亲身体验了京津塘高速北京段的自动驾驶货运服务。
马驹桥,北京重要的物流基地;天津港,京津冀的海上门户。每天,不计其数的货物在其间往来,繁忙的京津塘高速公路上车流如织。5个月前,国内首次开启了京津跨省高速自动驾驶示范,由于突破了单一省市内的限定测试区域,对自动驾驶干线物流可谓意义重大。
此次体验的京津塘高速北京段及天津段自动驾驶测试路段总长超过100公里,涵盖了高速公路、进出收费站口、上下匝道等复杂情况,是自动驾驶测试的天然场景。记者登上离地一米多高的驾驶舱后,自动驾驶重卡安全员李师傅掏出无线键盘,对着车上的屏幕输入信息。“自动驾驶模式启动。”当卡车进入马驹桥收费站时,系统发出语音提示,李师傅的身份就此由司机切换为安全员。开始高速行驶后,他的目光变得机警锐利。
此时,驾驶室后排的小马智卡产品经理张嘉浩同样目不转睛地看着电脑屏幕上的实时数据——包括车辆的位置标注以及方向盘摆动的次数、幅度等。“监测这些指标是为掌握车辆运行的实时数据,为接下来编队行驶和更大范围内的货运运营积累经验。”张嘉浩表示。
“从前司机开重卡到港口取箱,不仅劳动时间长,排队办票流程繁杂,遇到风霜雨雪等恶劣天气一天得工作10多个小时,极易疲劳驾驶。”李师傅说,如今只要在平板电脑上一点,货箱自动派单,重卡即提即走,还可以全天候运输,大大提高了运输效率和安全性。
从封闭园区测试到跨省开放运营,再到编队行驶的提出和应用,不仅进一步推动了整个智能网联汽车应用场景商业化进程,更标志着打通了包含公路货运在内的自动驾驶物流全场景运输。在张嘉浩看来,由于生产资料的属性,商用车是典型的成本敏感型行业。随着目前“门到门”自动驾驶运输逐步成为现实,高速干线运输的常态化运营曙光在望。
新技术不断涌现
自动驾驶迎质变之年
总体来看,高阶智驾产品渴望商业成熟,但仍处于技术剧烈变革阶段。
纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。从卷积神经网络(CNN)的引入,到循环神经网络(RNN)的应用,再到结合鸟瞰图(BEV)与Transformer(自注意力机制的神经网络架构)的创新,新技术的迭代涌现在不断增强自动驾驶的精确度与安全性。
尤其是在“BEV+Transformer”与OCC(占用网络)之后,端到端(End-to-End)自动驾驶技术开始受到广泛关注。而特斯拉作为行业的先锋,其推出的FSD V12系统成为端到端自动驾驶技术的典范。
所谓端到端,指的是通过AI模型,只要输入原始数据就可以输出最终结果。比如ChatGPT,就是一个典型的端到端模型,输入文字语句,直接就能得到回答。那么,在自动驾驶领域何为“最终结果”?
这还要从自动驾驶的演进说起。以前的自动驾驶按照不同功能划分为感知模块、控制模块、定位模块、规划决策模块等,由于涉及模块之间的参数传递,人为定义接口会过滤掉一些信息,导致处理的场景有限,长尾场景无法彻底消除。同时,依赖于人为规则的算法,每个模块之间“不可求导”,会导致各个模块只能达到局部而非全局最优。结果就是,人为规则操控的车辆缺乏“人味”,无法像人类一样随机应变且丝滑地处理场景挑战。
而在端到端范式下,整个自动驾驶系统只有一个模块,或者说是神经网络——摒弃了传统自动驾驶中感知、规划、控制各大模块及下边的各类子任务,能够实现输入传感器数据可直接输出车辆动作控制,宛如人类通过五官和经验在开车驾驶。
需要指出的是,目前业内对于端到端还没有一个权威统一的定义。特斯拉方面称,FSD Beta V12 也可叫做“感知决策一体化”,即把“感知”和“决策”融合到一个模型中,通过输入图像,旋即输出转向、刹车、加速等车辆控制信号的能力,进而实现自动驾驶。
据观察,FSD V12在今年大面积推送后的确展现出了不同寻常的潜力。有特斯拉车主向记者表示,新系统相比上一代进步明显,在狭路会车、超车方面已非常从容熟练——“就像人开车一样”。
“以前是靠人编程写规则,做海量的标定,教神经网络开车。现在则是仿生人类学习机制,通过一个AI神经网络大模型,不分模块和堆栈,直接接收感知信号,然后输出决策信号。”中国自动驾驶产业创新联盟调研员高超对《证券日报》记者表示。
基于此,国内一些领先的企业也在跟进这一技术的研发与部署。就在今年的北京国际车展期间,小鹏汽车、华为、元戎启行、长城、商汤科技等多家公司争相宣布推出类似FSD V12的自动驾驶系统。同期,软银、英伟达和微软也斥资10.8亿美元投资了与特斯拉路线相同的自动驾驶公司Wayve。
“2025年智能驾驶会发生质的改变。现在看甚至会提前到今年,因为技术进步比我想象中更快。”在小鹏汽车董事长何小鹏看来,原先智能驾驶需要大量代码制定规则,即使达到一万行,可能也只能实现50%的规则能力。“随着端到端技术的出现,我们仅需投入数十亿(元)的训练费用,便可以在一年内大幅提升产品性能,这将极大加快自动驾驶技术在实际应用中的普及速度。”
华为智能汽车解决方案BU董事长余承东表示,今年8月份,华为将进入高阶智驾ADS 3.0方案时代,该方案就采用端到端架构。理想汽车CEO李想也表示,三季度将向测试用户推送端到端+VLM(视觉语言模型)的智驾方案。蔚来汽车虽未明确宣布端到端方案的落地时间,但大概率也在年内发布。
尽管端到端自动驾驶系统蔚然成风,但其是否就是自动驾驶未来发展的唯一道路,目前也存在一些疑问。极越CEO夏一平在接受《证券日报》记者采访时就表示,大模型训练的核心不是比谁的数据多,而是比谁的数据更有价值。“数据质量很重要。数据质量不好,训练出的模型可能就是有缺陷的。”
与此同时,端到端也需要巨大的资源支持,包括高质量视频数据的采集和算力资源的大幅增加。特斯拉CEO马斯克今年4月份在社交媒体上表示:“在AI训练和推理领域,任何支出达不到每年100亿美元水平的公司,都无法在市场上竞争。”据马斯克透露,到2024年底,特斯拉的训练算力将达到100E FLOPS(每秒浮点运算次数)。对于国内企业来说,算力资源的积累和竞争问题已迫在眉睫。
但无论如何,端到端技术以其创新的理念,为实现完全无人驾驶的目标提供了新的可能性。随着技术的不断进步和行业的共同努力,上述挑战必将被逐一克服。而元戎启行、商汤科技、毫末智行等国内企业的积极参与,也展现了中国在自动驾驶技术领域的决心和潜力。
大模型与L3路测双重加持
年内行业融资达168亿元
在ChatGPT成功之后,由“大算力+大模型+大数据”驱动创造的“智能涌现”,加之国内有条件自动驾驶(L3级)高速公路道路测试牌照发放,使得自动驾驶行业声量渐隆,重获资本市场青睐。过去一年,已有文远知行、黑芝麻智能、知行科技、速腾聚创等数十家国内自动驾驶供应商申请IPO。其中,知行汽车科技和禾赛科技已经成功上市。
最新统计显示,今年以来,国内外自动驾驶领域公开超40起重要投融资,已披露的融资总额达168亿元,实现同比翻番。我国自动驾驶行业的融资区域较为集中,主要分布在北京、上海、江苏、广东等地。从投资主体来看,代表性投资主体有投中资本、高瓴投资、红杉资本中国、启明创投等;实业类的投资主体有百度、字节跳动、小米集团、广汽集团等。
进入2024年,自动驾驶赛道第一笔融资落在毫末智行头上。2月22日,毫末智行宣布获超亿元B1轮融资,此轮融资由成都武发基金投资。这次的融资一开始就确定了投入方向:大模型。
毫末智行董事长张凯表示,此次募得资金将主要用于毫末大模型等AI自动驾驶技术的研发投入。“毫末智行会以项目为牵引,加速自动驾驶项目落地。”记者观察到,早在去年,毫末智行就建成了国内自动驾驶行业最大的智算中心MANA OASIS,还推出了自动驾驶生成式大模型DriveGPT。
大模型概念的异军突起,令自动驾驶企业与车企的合作再上新台阶。国内的文心一言计划接入红旗、长安、吉利、岚图等车企;国外方面,微软亦与奔驰联手,将ChatGPT整合到奔驰车载语音控制系统中。更有部分车企,不再甘愿充当这场科技浪潮中的配角,试图从幕后走向台前。如理想就自研了大模型Mind GPT。据记者不完全统计,蔚来、小鹏、吉利、长城、奇瑞等车企都申请了与GPT相关的商标。
“Sora通过生成模拟现实世界视频自我训练,可能会比车企以往费时费力实际路测和视频训练来得更快,利用数据驱动解决复杂长尾的问题,极大地提高自动驾驶的泛化能力。”高超认为,Sora的交互能力还有机会影响到现有的自动驾驶模型,消除模块累计误差的同时降低成本。
需要指出的是,成效显著的背后是巨大的成本代价。开发大模型,抛去技术差异不谈,成本也能拖垮一大片企业。OpenAI的一份报告指出,到2030年训练大模型的成本预计将从1亿美元上升到5亿美元。自动驾驶行业本来就是个无尽烧钱的领域,若再牵扯上大模型,结果多半是不堪重负。
大模型之外,随着自动驾驶领域向L3迈出了落地的关键一步,也为行业平添了一把火。去年底,为促进智能网联汽车推广应用,提升智能网联汽车产品性能和安全运行水平,工业和信息化部、公安部、住房和城乡建设部、交通运输部等四部门联合发布《关于开展智能网联汽车准入和上路通行试点工作的通知》,L3及L4级别自动驾驶汽车开展准入试点。
这意味着,自动驾驶在低级别自动驾驶领域内斡旋多年后,终于有望打破L3级自动驾驶政策和技术的双重屏障。一时间,包括宝马、奔驰、阿维塔、深蓝、极狐、智己等车企纷纷领取到测试牌照,并相继在北京、上海、重庆和深圳开启测试。小米集团董事长兼CEO雷军更是放话将在今年底开通100个城市NOA(自动辅助导航驾驶)。
在力合资本副总裁许奔波看来,自动驾驶技术,是不亚于能源结构变革的交通领域技术革命。但短期内,受限于法律、伦理、技术等因素,需要在封闭或半封闭场景逐步培育、应用。“当前赛道场景的体量很重要,但赛道的场景特征及该特征能否有效延伸到更广阔的赛道,同样重要。”许奔波表示。
谈及下一步行业趋势,中国新能源汽车产业创新联盟理事高云鹏认为,在国家级先导区、车联网示范区、“双智试点”等先行先试带动下,我国车联网新型基础设施在各区域已形成一定规模。下一步,随着示范应用不断扩大,面对不同应用场景和主体,围绕自动驾驶、车联网和路网基建会演化出不同的商业模式,为实现车路协同奠定新基础。
例如,作为最早切入地图赛道的玩家,百度地图正经历着一场由汽车智能化以及AI驱动的技术和商业化变革。百度副总裁尚国斌告诉《证券日报》记者,在智能汽车成为最重要的智能设备后,地图厂商和车企均看到了巨大的商业潜力。百度地图会将过去做的地图大模型全部开放给合作车企,今年最重要的目标就是覆盖足够多的车型,把不同车型上的差异化跑通。
“对于车企而言,2024年将成为自动驾驶从形成认知到购买转化的重要时间窗口。L3级自动驾驶测试车企的逐步扩展和陆续落地,将大幅推动高阶智能驾驶进一步迭代。”高云鹏总结道,在新能源汽车同质化较为严重的当下,自动驾驶功能必将成为未来汽车产品的核心发力点。
自动驾驶有望迎来“质变”时刻
龚梦泽
进入2024年,自动驾驶行业的竞争愈发激烈,而大模型技术的崛起无疑又为这场竞赛注入了一剂强心剂。随着人工智能技术从深度学习到多模态大模型的快速发展、行业利好政策春风劲吹,以及商业化落地路径渐晰等三重共振,自动驾驶再次站在了技术进化和投资圈的第一线,有望迎来属于自己的“质变”时刻。
首先,在技术层面,时空融合、大模型等新技术正在被引入自动驾驶,特别是“BEV+Transformer(鸟瞰视图+基于自注意力机制的神经网络架构)”技术和端到端模型的日趋成熟,正以其强大的数据处理能力和自我学习能力,将车辆的感知、决策和执行能力提升到前所未有的高度。
其中,“BEV+Transformer”将二维图像和传感器信息综合转化为三维向量空间,支持多传感器信息融合,在车端实现高精度局部地图的实时构建。如此,极大地降低了自动驾驶对高精度地图的强依赖,使得城区领航成为可能。这是大模型技术在自动驾驶行业的首次亮相,也是FSD(完全自动驾驶)的关键所在。
端到端模型背后,是基于纯视觉方案,将上千万个视频片段包含的人类驾驶知识压缩到了端到端神经网络参数中,形成一个大的神经网络,而无需从前的大量泛化代码。借助端到端,自动驾驶系统便具备了时空理解能力,能读懂文字信息,有了时间观念,理解不同城市特点的交通元素,做出更拟人的决策。
其次,政策层面,随着国内首批有条件自动驾驶(L3级)高速公路道路测试牌照正式发放,宝马、奔驰、深蓝、赛力斯等多家车企获得测试牌照,并相继在北京、上海、重庆和深圳开启测试。可以预见,L3级的规模性启动,将使自动驾驶车辆从小范围测试验证转入技术快速发展、生态加速构建的新阶段。自动驾驶技术的迭代升级,将显著助力汽车产业发展和智慧城市建设,为实现汽车产业、城市管理与大众生活数字化转型升级贡献光热。
最后,商业化层面,基于以上技术和政策的双重加持,2024年将成为智能驾驶在消费端从形成认知到购买转化的重要时间窗口。自动驾驶技术成为消费者购车的重要考量因素后,车企对高阶智能驾驶的重视程度显著提升。目前,国内几乎所有参与智能汽车竞争的头部玩家,都发布了各自的城区智能驾驶,甚至不少车企和自动驾驶供应商还建立了自己的算力中心。此外,智能化使得车载半导体、线控制动、车载软件等产业需求得以延伸,带来了诸多投资机会。
需要指出的是,在取得一系列实践成果、产业发展速度显著提升的同时,自动驾驶汽车现存的挑战仍不容忽视。不管是人工智能领域近年取得的突破式进展,还是对自动驾驶做出的发展路径预判,底层逻辑仍然是坚守长期主义。
笔者认为,自动驾驶每向前一步都需要庞大的数据、场景、资金和政策支撑,这些都是自动驾驶走向终极无人驾驶目标过程中必经的隘口。以上,既需要企业经历规模化落地的严苛考验,更需要法规体系的支持跟进以及社会各界的“包容审慎”。令人鼓舞的是,越来越多的产业参与者已经携使命马不停蹄,星夜兼程了。
图片 | 站酷海洛
制作 | 周文睿