全球生活网 > 热点 > 内容

盖世汽车研究院:汽车AI大模型应用发展趋势

时间:2025-04-03 20:53  来源:盖世汽车  阅读量:12953 

AI技术在汽车行业的应用不断演进,从早期的传感器技术和初步算法融合,到BEV、Transformer等架构的兴起,再到当前端到端模型、AI大模型的广泛应用,标志着汽车行业正经历智能化变革。

2025年3月20日,在第三届AI定义汽车论坛上,盖世汽车研究院副总裁王显斌指出,AI大模型在智能驾驶领域展现出强大的处理能力,尤其在复杂场景下的应对能力显著提升。在智能座舱内,AI大模型与多模态交互功能的融合,为用户提供了更为丰富和贴心的应用场景。此外,AI大模型还在汽车研发设计、生产制造、产品定义及数字化营销等方面发挥着重要作用,推动了汽车行业的全面智能化升级。

盖世汽车研究院副总裁

以下为演讲内容整理:

AI+汽车行业概况

AI在汽车领域应用的早期阶段,一个极具标志性的事件是美国卡内基梅隆大学的“Navlab”项目首次实现自动驾驶车辆在城市道路上行驶,当时主要聚焦于传感器技术的测试以及初步算法融合的应用。

2010年到2022年,BEV结合Transformer架构、CNN等成为焦点,特别是谷歌推出无人驾驶汽车原型,以及百度的Apollo 3.0架构,都是传统AI算法架构发展模式的重要进展。

2023年开始,AI技术在汽车领域的应用迎来了新的变革。OpenAI、DeepSeek等大模型火爆,端到端模型等技术出现,特别是特斯拉FSDV12版本的发布,对市面上的诸多观点以及自动驾驶算法的迭代产生了极大影响。

图源:盖世汽车研究院

今年,智能驾驶技术的普及化趋势明显,众多企业的战略中,AI的应用愈发显著。从当前应用的角度来看,AI大模型在汽车产品全生命周期开发中的应用日益广泛。前几年,多模态技术主要应用于座舱内的多模式交互,此外,XR技术的应用也逐渐增多。

智能驾驶的仿真测试与数据标注方面,AI也发挥了重要作用。在汽车的生命周期中,AI的应用将从较为简单的领域如智能客服和数字化营销,逐步扩展到智能制造中的排产优化,以及L4级自动驾驶和智能座舱中的agent应用等更为复杂的领域。

AI大模型汽车应用进展

目前,AI大模型在智能驾驶领域的发展呈现出新的趋势。以往基于Rule-based的感知、决策与规划控制逻辑,在实时性、精度、数据传输效率以及全场景感知决策方面存在显著短板。

转向端到端模型后,从国内情况来看,多数车企与科技公司目前的技术仍处于分段式发展阶段。尽管感知与决策部分已能通过模型实现,但决策与执行之间仍需通过某些链接来过渡,以确保安全性,未来的发展模式将趋向于采用单一的端到端模型,以模拟人类驾驶员的操作。

图源:盖世汽车研究院

在此维度下,随着数据深度训练的加强和投入的增加,端到端方案虽然在初期投入较大,但其性能上限表现较高。此外,从整个架构发展过程来看,一个积极的方向是我们对算力的依赖将逐渐降低,这是因为通过算法的持续深化训练和学习,模型能够不断提升场景处理能力和泛化技术能力。

不仅限于自动驾驶领域,具身智能及其他agent应用同样展现出广阔的发展前景。近期,DeepSeek在智驾中的应用备受瞩目,该模型因其成本效益、硬件投入优化、开源特性以及算力优化等方面的优势受到广泛关注。

初期而言,DeepSeek大模型主要聚焦于数据标注与数据挖掘两大方面,涵盖数据增强、数据泛化及深度学习等关键环节,对于长尾数据的处理尤为关键。当前可以通过大量图像或其他感知算法进行演化与场景重建,实现数据的实时生成。在车载端,可以将云端大量的计算数据通过知识蒸馏技术迁移至车载端,构建高效推理模型。

在自动驾驶场景中,我们面临诸多复杂场景。比如潮汐车道,传统摄像头技术在此类场景下难以发挥有效作用。通过大模型的长时序推理预测,结合数据训练,可以实现对此类场景的准确识别与处理。再比如,在道路上行驶时,如果右侧车道的车辆打左转向灯,驾驶员通常会根据对方的动作适当等待几秒以判断其意图,对于传统自动驾驶系统而言,这一判断过程极为困难。还有国内的一些公交车道按时间规定使用,这对自动驾驶系统的全场景实时变化处理能力提出了更高要求。大模型的应用能够显著提升系统在这类复杂场景下的应对能力。

大模型在数据闭环方面的应用也尤为重要。自动驾驶的数据闭环链条冗长,涉及从车端到云端的数据传输,以及车端不同传感器数据向量的转化与存储。引入AIGC模型不仅能够优化存储空间和处理速度,还能有效降低对算力的依赖。

当前众多企业正致力于在仿真环境中模拟多种驾驶场景。借助大模型的实时生成能力,我们可以在极端条件下实现更多案例的覆盖。同时,自监督训练及算法模型的优化能够显著提升自动化处理效率,缩短开发周期,这对于数据闭环的完善及自动驾驶技术的迭代具有显著优势。

就当前最新的端对端应用而言,国内大部分企业仍主要采用模块化或分段式架构,例如理想汽车计划推出基于端对端+VM的VLA技术。VLA之所以成为未来框架中的关注焦点,主要在于其能够降低大模型的不可解释性,同时拥有强大的推理能力。此外,VLA还能有效解决之前提到的极端场景及特殊情况下的空间识别问题,并推动向空间智能的发展,提升整体处理能力。因此,大多数车企正考虑向VLA端对端技术路线转型,并加大研发布局力度。

大模型在底盘中的运用核心主要聚焦于智能底盘与传感器的深度整合,以及涉及XYZ轴的多项技术应用。比如小米最新的预研技术,通过AI与视觉信息的融合,结合其悬架与转向系统,实现与LT设备的互联互通。在当前应用场景中,通过语音技术控制车辆XYZ轴动态变化的能力,不仅提升了车辆在不同环境下的适应能力,还针对驾驶者不同的驾驶风格、舒适度需求及个性化应用提供了更为出色的体验。

AI技术的应用不仅限于智能驾驶领域的普及,它同样将在智能底盘领域发挥重要作用,特别是在机械硬件与算法深度融合的过程中,展现出更多的协同控制发展方向。

目前,座舱内的许多应用相对较为直接且被动,通常需要用户通过唤醒或采用多模态交互方式,才能实现特定功能。引入大语言模型后,其功能实现方式将变得更为多样。

另外,当AI大模型与座舱的多模态交互功能实现融合后,座舱内将涌现出丰富的应用场景。以驾车前往某目的地寻找餐饮为例,若车内记录了相关聊天记录,AI将能依据用户的兴趣爱好和历史数据,智能推荐符合用户期望的目的地和餐饮场所,甚至主动提供导航路线,极大地提升了用户体验。

在当前的汽车AI应用中,UI元素如壁纸、文章创作及问答功能等得到了广泛采用。然而,由于基础大模型与垂直大模型尚未完全融合,这些应用仍面临一些待解决的问题。

另外,随着多模态与多模感知技术的发展,座舱正被视作一个移动空间,用户期望在其中获得情绪价值的提升,AI大模型在座舱内的应用能够实现更为强化的主动关怀,它利用车内外的多模态感知技术,结合沉浸式体验设计,如声音调整、导航设置及场景应用等,根据用户的当前情绪、乘坐情况及人数,实现更为贴合与完美的应用体验。

当前,国内多数主机厂尤其是自主品牌更倾向于在应用层面开发AI大模型,相比之下,外资企业则更可能与基础大模型或是与科技公司的模型进行合作。总体而言,大多数企业的核心关注点仍在于语言理解能力,涵盖不同方言的识别、知识问答以及文本生成等。此外,业界正逐步向文本生成的推理能力拓展,如元宝、DeepSeek等应用在此方面已有较多实践。我们预见在语音交互及更广泛的交互领域,将更多地趋向于多模态与场景融合的发展。

自然语言交互能力方面,包括在座舱内的语音响应实时性、问题深度思考以及场景推荐等,是当前业界关注的重点,也是当前应用发展的主流趋势。未来的核心仍在于座舱,通过座舱实现控制功能,并与车外环境,包括智能驾驶系统以及车辆外部环境进行交互与融合。

大模型还被应用于芯片设计结构以及软件架构中的模块设计,例如功能安全设计,这些都可以通过大型模型来生成。软件开发领域,大型模型能够实时检查代码,提升编码效率,甚至辅助实现代码的自动生成。

在产品开发的后续阶段,大型模型同样发挥着重要作用。它能够帮助提升验证与部署的效率,加速产品迭代,并对产品进行持续优化。特别是在产品使用过程中,大型模型能够基于收集的数据进行深度分析,从而进一步推动产品的优化升级。

大模型在生产制造领域同样展现出广泛的应用潜力。对于大多数汽车整车厂和零部件供应商而言,产线多样且产品种类繁多,如何有效处理复杂的工艺参数数据和排产中的不确定性因素,通过深度学习实现成本优化,成为一大挑战。

无论是设备维护还是生产计划排布,大模型都发挥着关键作用。目前,已有部分汽车电子企业基于自身的产能及工艺约束条件,利用大型模型实现最优排产,既降低了成本,又提高了生产效率。大模型在设备预测性维护方面也展现出显著优势,通过分析设备运行时间和产品生产情况的历史数据,大模型能够自动生成设备维护的最佳时间点,为设备维护提供了科学依据。

在4S店的数字化营销中,数字人已成为基础内容问答的重要工具,大模型在内容营销中的广泛应用进一步推动了数字化营销的发展。在广告创意设计、新产品视频推广以及新车原创故事传播等方面,AI正展现出其在汽车营销领域的广泛应用进展。部分企业已开始利用VR和AR技术创建虚拟场景,为消费者提供沉浸式虚拟试驾体验。消费者只需站在4S店或体验店前,便能身临其境地感受不同车型的魅力。

未来应用展望

世界模型作为自动驾驶、汽车智能化以及具身智能的重要发展方向,正受到业界的广泛关注。以英伟达在今年的CES展会上的展示为例,其通过仿真场景实现数据的持续优化与场景的不断生成,为数据训练和生成提供了强有力的支持,同时也为数据增强技术带来了显著的提升。

图源:盖世汽车研究院

我们观察到,除了在特定场景中的应用,3D场景的沉浸式体验也日渐显著,此类体验广泛应用于游戏、娱乐及教育培训领域,通过虚拟事件与物理事件的融合,实现了更为出色的沉浸式效果。我们还见证了二维内容向三维空间的扩展,这对空间智能及整体应用体验与研发设计带来了深远的影响。

在座舱环境中,目前大部分功能仍由人类进行定义并设置相关问题,AI主要扮演辅助角色以协助完成任务。在协同模式下,我AI将主动提供服务。最终,人类在汽车内部可能会转变为一个纯粹的指令设定者,仅需设定所需功能,而AI将全权负责这些功能的实现。

智能座舱势必朝着AI agent模式发展,并逐步演变为汽车机器人的形态。这一趋势也涵盖了当前备受瞩目的人形机器人领域,它们支持人类从地点A到地点B的移动,以及在该空间内满足娱乐和工作等多种需求。

就座舱的交互模式而言,我们预见其将从传统的人机交互界面向更加人性化的交互维度转变。以往座舱的设计主要追求可用性、可靠性和安全性,未来的座舱将更加注重用户体验,致力于成为用户喜爱且能带来愉悦感受的空间,甚至能够为用户创造价值。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

  • 精选图集