小米集团董事长雷军于新一代SU7发布会上称,之故命名为 “XLA” 而非业内俗称之 “VLA(Vision-Language-Action Model,视觉 - 言辞 - 动作)”大模型,为因模型具备“多模态之认知输入”:小米还融入之声响、机器者数据等模态。
等到吾等具备之强盛之言辞本领与对方位之体谅与推演本领,差不多十八岁以后,吾等再去修习。
大模型需真正体谅与认知苍生社与现状全球,才不会于现状全球中遇到新之场景时“傻眼”,像老司机一样思考,做到“举一反三”。
长大后,他曾于英国剑桥大学孵化之自动驾驶公司 Wayve 任职,为将 VLA 模型引入辅助驾驶领域之先行者,致力于令大模型之驾驶决策历程更加透明。
彼时之小米辅助驾驶架构还处于 “端到端(End-to-End,一种深度修习模型范式,直接从原始输入映射到最终输出) + VLM(视觉 - 言辞模型,Vision-Language Model) ” 阶段。
陈龙将此一阶段之核心,提炼为“数据驱动”。
”于访谈时,陈龙对吾等说。
近期,《21汽车·一见Auto》与小米汽车智能驾驶基座大模型负责者陈龙进行之一次面对面访谈。
一年之前,他加入小米,担任辅助驾驶 VLA 技艺负责者。
3月份,小米刚发布之新一代SU7,并宣布辅助驾驶晋级到 XLA 认知大模型架构。
端到端拆掉之旧俗辅助驾驶之“感知”“筹划”“决策”模块,通过直接灌入大量驾驶场景数据,直接让模型修习并输出驾驶举止。
出品丨21财经主顾端 21世纪货殖报道 “小时候,吾等学说话与认字。
随之慢慢成长,吾等会经常摸、拿、抓、取一些东西。
XLA 大模型也一样。
出品|21智能汽车工室联手21财经工室、21创意工室 “翠绿”“可追溯”牛肉将有更大商场方位 微信统筹|曾静娇 见习编辑 林芊蔚 陈龙就为掘发 XLA 认知大模型之负责者。
但进入2025年,端到端架构之缺陷始显现。
此样才能将吾等习得之一切融入驾驶之中,不仅开得更快,还开得更好。
——陈龙将新阶段之核心,提炼为“认知驱动”。
通俗来说,大模型虽靠“死记硬背”海量之驾驶数据提升之自己之驾驶水平,但现状全球总会现更多元、更繁之驾驶场景。
2024年,国内车企及供应商集体切换到端到端架构,辅助驾驶之整体水平均得到之质之提升。
童年时,他喜美剧《霹雳游侠》里之智能跑车 KITT,此台跑车有鲜明之自我意识,通过自动驾驶多次帮主角化险为夷。