首页 科技快讯 给汽车装上大脑:火山引擎的时机、策略和卡位

给汽车装上大脑:火山引擎的时机、策略和卡位

来源:晰数塔互联网快讯 时间:2026年04月26日 23:18



互联网公司有机会从功能供应商往更核心的方向再进一步。

文丨司雯雯

过去十多年,互联网公司不愿错过每一轮进入汽车万亿规模产业的机会,从帮着卖车、卖保险到保养,从地图、音乐、内容、社交、车联网、自动驾驶等功能或技术尝试上车。

但汽车行业分工精细、链条长,车企和供应商掌握着主动权,新技术在它们之间流转,互联网公司大多只能提供某一项功能,很难进入中心。绝大多数坐进车里和车机说话的人,不知道背后是谁在回答。屏幕上是各家车企自己的助理名字,语音是各家定制的声线。

在奔驰纯电 GLC 里,让车机找附近有充电桩的川菜馆,回答的是豆包大模型;坐进别克至境 E7、奥迪 E7X ,几个人同时说话、去不同目的地、提出一连串复杂任务,理解和解决需求的也是豆包大模型——它的日均 Token 调用量已经涨至 120 万亿,100% 覆盖了中国主流车企。

直到 AI 迭代速度和汽车竞争烈度都不断以超出人们预期的程度进行,情况开始变化。科技公司发展中聚集起足够的算力、资金和工程团队,把 AI 推向跨行业的基础设施,Token 消耗量成为考量一家公司、一名研究员 AI 原生程度的指标,模型和应用的迭代节奏远快于汽车工业。

对车企来说,把基础研发交给头部模型公司、自己做产品定义、体验和品牌,更符合当下的竞争节奏——仅 4 月北京车展前后,就有超过 181 款新车首发,比上一届北京车展多了 55%。

火山引擎想抓住这个窗口。他们持续扩展豆包大模型的边界,汽车是下一个被他们看重的入口。今年北京车展,火山引擎专门设了展台,展示了奔驰、别克、上汽大众、上汽奥迪等 7 个品牌的合作车型。火山引擎副总裁杨立伟说,汽车行业对其非常重要,“不追求现阶段有多少利润”。

在汽车产业里,互联网公司有机会从功能供应商往更核心的方向再进一步。

从闲聊到助手,核心是解决问题

汽车公司有时高估用户对新技术的耐心,低估把新技术变成用户体验的难度。2024 年初,超过 10 家车企在座舱密集接入 DeepSeek 等大模型技术,想让用户和车机像手机一样对话。

一些车企很快就明白路线不对。车内场景下,闲聊对用户的实际价值相对有限。即便每次发布会都被拿来宣传的聊天功能,语音助手也很难做好,多数停留在一问一答或独白,无法识别说话对象,也无法跟踪上下文。用户想让语音助手做些什么,多数功能指令需要用户用相对准确甚至固定句式才能被准确执行,偶尔还会出现想关车内灯却误关闭车大灯的情况。

而一台好用的车机不在于多么风趣、博学,而是解决问题。尤其今天中国做的电动车车内实体按键越来越少。杨立伟以今天手机端的交互效率做参照系,认为手机端能做到 85 分到 90 分,座舱车机交互长期停在四五十分。

这与过去车机的语音架构有关。传统架构里,用户和大模型的交互由对话驱动,架构设计的奖励函数是被动响应需求、及时给出回应,而不是提供功能,有时得到的回复只是 “听不懂” 或 “做不到”。

相比手机或其他终端,汽车座舱接入大模型的另一个特殊性在于信息密度更高、种类更多、强调本地状态。手机端的大模型多是单人使用;车内最多时可能有 6 名乘客。多人对话场景下大模型介入的时机随机且多变。除了语音、文字信息,还有座舱内的温度、声音等视觉和端侧信息,以及座舱外的光线、道路、交通情况等复杂信息。用户说 “有点吵”,既可能指音乐声音大,也可能因为车窗没关好,过去的语音对话大模型没有端侧的多维信息,很难根据模糊的语句辨别,更难解决。

如果想通过大模型对话解决问题,用户需要做决策也做分解,把任务拆细,语音助手再通过 NLU(自然语言理解)模块把指令转成结构化信号,分发给导航、车控、媒体等领域,任务一多,要么漏、要么错、要么用户一遍遍重复。

“能提供情绪价值很好,但首先要把事办好,把基础、高频的功能做到足够丝滑。” 杨立伟说,他们把车机定位为助手而不是 “Chatbot”。

他们的做法是建立一个 Agentic AI 架构的大脑,由 3 个核心模块互相协作运行,分别对应流式对话推理、学习沉淀、目标任务驱动三种能力。

- 对话推理引擎目的是像人一样的交流。免唤醒,但能判断接入时机,不会随便插话,联系上下文、结合车内环境、理解用户模糊的隐含意图,除了听得懂,还能像人一样的自然流式的对话、像人一样理解你的需求;

- 学习沉淀引擎目的是像人一样的学习和成长。“记得住” 用户的喜好,包括对温度、风向、座椅调节和音乐风格等习惯,根据知识、反馈,自我进化,并且会反思上一个任务执行情况,沉淀成 skill;

- 在前两者基础上,目标驱动引擎的最终落点是 “办好事”,让用户不必一步步发出 “开空调、调温度、播放音乐、回家” 等指令,由车机根据任务拆解步骤、调用车载工具、技能和生态,像人的思维一样办事,协调好各项车控功能,调整到舒适的状态。



火山引擎将对话推理引擎、目标驱动引擎、学习成长引擎三大引擎融入统一的 “汽车大脑”。

据杨立伟介绍,豆包大模型目前和 50 个汽车品牌、145 种车型合作,搭载在超过 700 万辆车,平均每天使用量超过 3000 万次,其中应用场景最多的是车控(53%)、导航(29%)、媒体(10%)—— 火山引擎认为这反应了用户的真实需求,“起码要先把车控、导航、多媒体做好。”

基于这套 Agentic AI 架构,火山引擎可以提供两种形式的合作方案:

“AI 座舱套件” 方案,基于已经量产落地的豆包大模型智能座舱方案,做了 Agentic 化的架构升级,以能力形式输出,既有大模型、有 Agent ,也有各类交互、工具和运营管理平台,车企可根据需求灵活选配。

他们对新方案豆包座舱助手——用统一的 “大脑” 联动整车能力,以完整产品形式交付,与豆包 APP 互联互通—— 期待更多,投入大量资源与几家深度合作的车企共同打磨。

而对于 AI 能力强化之后的安全边界,火山引擎也有自己的思考。在与荣威的合作里,双方把车控权限分为黑、灰、彩三层。彩区是空调、座椅、屏幕、车内灯光等可由 AI 直接调控的功能;灰区涉及行驶状态判断(比如行驶中能否调座椅),AI 给出建议但执行受规则限制;黑区是刹车、转向等核心驾驶功能,是 AI 禁区。

“根据我们的规划,到年底时,豆包座舱助手会像人一样思考、基于目标持续地办事。” 杨立伟举例,如果一位用户行驶中担心后排的孩子,他也许会说 “帮我看看孩子睡着没?” 传统的大模型会根据这一条要求做回应,或者调节灯光和空调。

但据他介绍,火山引擎的座舱助手会持续思考,如果小孩睡了,调整座舱到更舒适的状态;如果小孩醒了,会主动陪伴,讲故事、播放他喜欢的小猪佩奇或模仿妈妈的口吻安抚,以不影响车主驾驶的形式汇报状态……“这看起来只是一个简单任务——不是测试时常用的开车去某地、顺便选餐厅、再播放一首音乐,但只帮忙看 ‘孩子睡没睡’ 并不完全解决问题。人类助手会做什么?那么我们希望座舱助手也能做到。”

一个大脑,深度联动整车

过去三个多月,OpenClaw 让大众直观看到 AI 除了能聊天,还能动手做事,自主调用工具、完成多步任务。它和 ChatBot 最大的不同是,后者由对话驱动,而 OpenClaw 这类 Agent 由目标驱动,这要求 OpenClaw 至少需要理解、思考和调度能力——那么,如果汽车内也有一个自主性的 Agent 呢?



观众在火山引擎展台体验火山引擎合作车型的座舱。

随着底层模型、框架、工具生态的逐渐成熟,一些 API 已经有了标准和规范,技术上给车机配一个能主动服务的 Agent 不是太难,比如一些车机助手能记住用户想要避开的路段,在下一次规划路线时避开——这意味着它有时空因果记忆和对用户的长期记忆;另一类车机系统可以在听到 “有点冷” 时主动调高空调、关闭车窗、打开座椅加热——这体现了意图识别和使用工具的能力。

技能各家都有,做好不易。如果问题复杂、任务链长,累积的误差越多,越容易陷入死循环。这正是考验大模型厂商和汽车公司能力的核心。尤其在 2024 年 5 月 GPT-4o 发布会后,行业开始认同有情感、像真人的语音交互在车上实现的可能性和前景。

2026 年,座舱 AI 的竞争从 “大模型上车” 转向 “智能体上车”,有人开始称 2026 年为 “智能体上车元年”。

有自研能力或孵化 AI 公司的车企快速推进,理想、小鹏已完成从技术架构到组织架构的整合,吉利和阶跃星辰、千里科技合作,将座舱、辅助驾驶等在生态层面打通,组建为 “超级智能体”,在极氪 8X 上首发。另一些车企选择和头部 AI 公司合作,除了火山引擎和荣威合作的 “家越”,阿里通义千问和上汽智己宣布,将把座舱、智驾、底盘和阿里生态服务连成一个整车级智能体。

他们之中有的选择在座舱内分场景部署多个 Agent,比如通勤点单、长途出游等;有的则推动智能座舱和大模型的结合从 “接一个 LLM 进车机” 演化为让车 “长” 出一个能感知、推理、调度的 “大脑” —— 这正是火山引擎正在做的 —— Agents 在同一个基础模型上调度,对外作为一个大脑响应用户的指令。

这正成为汽车智能化竞争的新焦点。体现之一是舱驾融合,过去车企讲舱驾融合更多指的是用一块芯片提供座舱和辅助驾驶两套系统的算力,但从特斯拉将 Grok 大模型引入座舱,整合座舱功能和 FSD 开始,理想、小鹏、吉利等陆续推动底层模型和数据不同程度打通,目的是让 AI 沟通座舱和驾驶,从单个功能整合为整车体验。

火山引擎对舱驾配合的处理是分工明确:座舱大模型作为助手,把用户的泛化指令转译成智驾系统能懂的输入,最终能不能执行、怎么执行由智驾系统自己判断。

挑战在于汽车是超级硬件——有上千种原子化功能,一张座椅的角度、加热、通风、按摩等功能就涉及近百个工具,且驾驶类相关功能安全性、稳定性要求极高。

火山引擎智能座舱产品负责人张航回忆,2023 年时,他们也做车内 Chatbot,但体验不够好,认为未来的 AI 上车趋势一定是做助手,但与同行讨论时,大多数判断这件事做不成。

他们和豆包大模型基模团队沟通后,结论是有挑战但有可能。第一步是做 Function Call(函数调用),让大模型理解且能够调用每个车控,比如开关和调节空调。一开始,大模型只能控制 100 多个车控接口,慢慢扩展到 1000 多个,就像拥有了手和脚——能否用工具解决问题,这是大模型和 Agent 的重要区别之一。

第二步让大模型能感知环境状态,通过实时变化的传感器,输入车速、温度、电量、驾驶员状态等信息,比如车窗关闭和开了一条缝时空调的调节方式不同。这让大模型有了更多的决策依据。

“只能是硬啃。” 张航说,做完第二步时已经过去一年。这一年多足够一家新成立的大模型厂商涨到数十亿美元估值。但汽车产品结构复杂、精密,需要一定周期积累技术和工程化经验。

同样是调节空调,豪华、商务车型车主与运动车型车主的需求可能不同,年长用户和年轻用户的偏好也不同。当用户说 “有点热” 时,如何才能调整到最舒适的状态——这需要车企的 KnowHow。每家车企对空调档位、出风位置、扫风情况的设置不同,车企需要根据产品定义和经验告诉火山引擎每款车型的空调具体情况和想达到的状态。

通过 3 年积累,火山引擎的大模型有了可调用的工具、能感知环境状态、积累了用户偏好和场景知识,就像有了手脚、感官和神经,变成能主动识别、规划、处理任务的 Agent——给汽车装上 “大脑” 的时机到了。

不过行业里也有车企走多模型协同的路线,由意图分类先做粗筛,再分发到专门模型处理具体任务。对于大模型如何上车,有的车企希望自研;有的车企认为自研成本高且必要性不大,倾向直接采购完整方案;还有的车企在两条路线之间组合,自研与外采并行。

杨立伟说,他们正和合作车企推进豆包座舱助手方案,2026 年年底就会发布,“体验效果能有 80、90 分”。

先做标杆,再做标准化

Agent 的进化速度,和 FOMO 情绪笼罩下人们对 Agent 的热情推动车企更开放。2026 年,辅助驾驶的技术路线收敛,同类配置的驾驶体验逐渐趋同,座舱内的使用体验成为智能化竞争的 “下半场”;大模型在手机端的迅速发展,也让消费者将 “AI 上车” 作为评价一台车是否 “先进”“智能” 的重要维度;与外部已有用户认知的互联网科技公司合作,还能得到品牌加成。

杨立伟说,对豆包座舱助手方案上车的第一批合作伙伴,火山引擎投入了上百人,“重投入加快落地、短期内不优先考虑要有多少利润,而是看服务水平”,因为 “成功与否不看现在成了几单,而是看用户体验能不能做好,能不能做出爆品”,展示豆包大模型和火山引擎上车的最好效果。

座舱和大模型的结合,让火山引擎看到了进入汽车更深一层的可能。杨立伟说,豆包座舱方案寻找最初的合作伙伴时,品牌因素只排第四,更重要的是对座舱 + AI 足够相信、开放程度够高、愿意投入、节奏要快。他说火山引擎总裁谭待与他讨论汽车业务时,更多关注的是用户价值、使用体验、使用频次。

字节集团的资源也会提供支持。豆包大模型在 2026 年 4 月的日均 Token(词元)使用量已经超过 120 万亿,是最活跃的模型之一。车机端会和手机端的豆包会互联互通,能力同步提高,手机端的交互经验、KnowHow 也会帮助优化车端 Agent。此外,字节集团的今日头条、抖音、番茄小说等内容生态也区别于其他大模型厂商。

他们对于汽车业务的长期设想是随着经验增加和技术发展,座舱助手的底层能力和架构更加成熟,把产品和应用模块化,避免重复投入、节约人力。在产品标准化后,和一级供应商等生态伙伴合作,扩大服务范围。

标准化与生态合作的背后的商业逻辑是,火山引擎提供基础能力,让客户在它之上做出差异化产品;客户做得越好,供应商的调用规模越大,双方的利益方向一致。这是 AWS、Shopify 等互联网基础设施长期成功的重要因素:将自己的商业利益与客户的成功绑定在一起。



Shopify 能力和合作关系示意图。来源:Ben Thompson、晚点、ChatGPT

火山更进一步的地方在于自己做工具链、集成集团体系内的各种能力。挑战则是车企作为大型制造业公司,与 AWS 的初创客户、Shopify 的中小商家在议价位置上完全不同。车企多数时候希望以更低的成本、更快的速度获得差异化、个性化的服务;而且车端大模型的迁移成本目前还不高,车企接入一家供应商的模型,主要工程量集中在提示词、车控接口映射、测试校准,迁移到另一家时可以部分复用。

这个领域的从业者大多相信车正从交互终端演化为物理 Agent。座舱是这条演化的起点,终点是车能感知环境、理解意图、规划任务、执行动作的一体化能力。基于这个假设,火山引擎选的是一条需要长期投入的路。模型与工具链持续迭代,与车企的合作持续加深,标杆项目持续落地。

中国电动车时代的供应链公司有过类似剧本 —— 每次技术变革新增或改进零部件时,新供应商常以更新的技术、更开放的合作模式、更好的服务意识抓住有潜力的客户,随他们成长 —— 过去 10 年里,地平线、孔辉、拓普等供应链新军沿这条路径起步。一位头部辅助驾驶供应商总结,作为创业公司,一开始只能自己扑上去、做出样板,才有上牌桌的资格。

“就像马拉松比赛刚跑了 1 公里,我们会把周期放得比较长。” 杨立伟说。

题图来源:通用汽车 1964 Runabout 概念车

相关推荐

火山引擎的野心,藏在Seed2.0里
从 Others 到挑战者第一,火山引擎没有错过大模型
对话火山引擎谭待:多数人低估了火山拿下 AI 云的决心
押注智能化的确定性,火山引擎做对了什么?
火山引擎的新产品,字节和 100 多家企业的大模型实验场
AI从科学到商业,火山引擎的少数派答案
字节跳动的ToB生意,为什么需要火山引擎?
元戎X火山|AI汽车加速进化
让企业拥有用得起的好模型,火山引擎给出一个更优选择
最前线 | 字节旗下火山引擎发布全系云产品,计划3年服务10万用户

网址: 给汽车装上大脑:火山引擎的时机、策略和卡位 http://www.xishuta.cn/newsview149104.html

所属分类:人工智能

推荐科技快讯