123,123

智駕網(wǎng) 2025-06-13 10:57

元戎啟行周光：攜手火山引擎，基于豆包大模型打造物理世界Agent

周光表示:“VLA的四大核心功能，相當(dāng)于為AI汽車增加‘透視眼’‘百事通’‘翻譯官’‘應(yīng)答靈’等屬性，讓AI汽車更全面地了解駕駛環(huán)境，準(zhǔn)確預(yù)測潛在駕駛危險(xiǎn)因素，顯著提升輔助駕駛的安全性?！?/div>

6月11日，元戎啟行CEO周光受邀出席2025年火山引擎Force原動力大會，宣布元戎啟行將攜手火山引擎，基于豆包大模型，共同研發(fā)VLA等前瞻技術(shù)，打造物理世界的Agent。

同時，周光宣布元戎啟行的VLA模型將于2025年第三季度推向消費(fèi)者市場，并展示了VLA模型的四大功能——空間語義理解、異形障礙物識別、文字類引導(dǎo)牌理解、語音控車，功能將隨量產(chǎn)逐步釋放。

▲元戎啟行CEO周光

周光表示:“VLA的四大核心功能，相當(dāng)于為AI汽車增加‘透視眼’‘百事通’‘翻譯官’‘應(yīng)答靈’等屬性，讓AI汽車更全面地了解駕駛環(huán)境，準(zhǔn)確預(yù)測潛在駕駛危險(xiǎn)因素，顯著提升輔助駕駛的安全性。”

空間語義理解：駕駛“透視眼”

VLA模型能夠全維度解構(gòu)駕駛環(huán)境，精準(zhǔn)破解橋洞通行、公交車遮擋視野等動靜態(tài)駕駛盲區(qū)場景駕駛風(fēng)險(xiǎn)。

例如，在通過無紅綠燈的路口時，VLA模型能提前識別到“注意橫穿，減速慢行”的指示牌，即使公交車通行造成動態(tài)盲區(qū)，VLA也會結(jié)合公交車的動作去做出準(zhǔn)確的決策。當(dāng)公交車進(jìn)行減速時，它會通過推理前方可能有行人穿行，并做出“立即減速、注意風(fēng)險(xiǎn)、謹(jǐn)慎通行”的決策。

▲公交車動態(tài)盲區(qū)遮擋

異形障礙物識別：駕駛“百事通”

VLA模型是一個超級學(xué)霸，它通過互聯(lián)網(wǎng)迅速獲取知識并轉(zhuǎn)換成自己的經(jīng)驗(yàn)，有自己的駕駛“知識庫”，對駕駛過程中出現(xiàn)的各類障礙物了如指掌，準(zhǔn)確判斷潛在危險(xiǎn)因素，行駛更安全。例如，VLA模型能夠識別“變形”的超載小貨車，結(jié)合實(shí)際路況，執(zhí)行減速繞行或靠邊駕駛。

▲異形障礙物識別

文字引導(dǎo)牌理解：駕駛“翻譯官”

搭載VLA模型的AI 汽車不僅能 “看見” 道路標(biāo)識，更能 “讀懂” 文字背后的通行規(guī)則，解析復(fù)雜路況里蘊(yùn)含的路況信息，讓復(fù)雜路況決策如 “開卷考試” 般從容。面對左轉(zhuǎn)待行區(qū)、可變車道、潮汐車道等 “動態(tài)規(guī)則路段”，VLA模型能夠讀懂字符與圖標(biāo)的含義，高效匹配實(shí)時路況。在多車道復(fù)雜路口選道直行的場景中，能夠準(zhǔn)確識別車輛前方的文字及圖案標(biāo)識牌，從左轉(zhuǎn)右轉(zhuǎn)混雜的路口準(zhǔn)確找到左轉(zhuǎn)車道，并執(zhí)行操作。

▲特殊路標(biāo)識別

語音交互控車：駕駛“應(yīng)答靈”

通過VLA模型，AI汽車可以與用戶高效交流，根據(jù)語音指令做出對應(yīng)的駕駛決策，隨叫隨應(yīng)，交互更擬人，體驗(yàn)更舒適。并且當(dāng)用戶意愿與導(dǎo)航信息相沖突時，VLA模型會優(yōu)先采納用戶意愿。

▲語音控車指令

目前，元戎啟行已完成VLA模型的真實(shí)道路測試，預(yù)計(jì)今年將有超5款搭載元戎啟行VLA模型的AI汽車陸續(xù)推入市場。其中，VLA模型支持激光雷達(dá)方案與純視覺方案，將率先搭載在NVIDIA Drive Thor芯片上，后續(xù)元戎啟行還將通過技術(shù)優(yōu)化，讓VLA模型可以適配更多芯片平臺。

火山引擎汽車總經(jīng)理、智慧出行和具身研究院院長楊立偉表示：“元戎啟行作為業(yè)內(nèi)率先推出VLA模型的企業(yè)之一，對人工智能的理解極為深刻?；鹕揭孀鳛樾袠I(yè)領(lǐng)先的云服務(wù)提供商，在云計(jì)算領(lǐng)域擁有深厚的技術(shù)實(shí)力和豐富的經(jīng)驗(yàn)。我們非常期待與元戎啟行攜手合作，共同推動基于豆包大模型的物理世界Agent的落地應(yīng)用，助力智慧出行領(lǐng)域的創(chuàng)新發(fā)展?！?/p>

周光強(qiáng)調(diào)：“VLA模型作為當(dāng)下最先進(jìn)的AI技術(shù)，可以連接視覺、語言、動作等多種模態(tài)，打通物理世界與數(shù)字世界的壁壘，具有完善的任務(wù)規(guī)劃和執(zhí)行能力，是實(shí)現(xiàn)物理世界 agent 的關(guān)鍵技術(shù)。元戎啟行很高興能夠與火山引擎達(dá)成合作，基于VLA模型共同打造物理世界的Agent，讓雙方的先進(jìn)技術(shù)在物理世界的各個領(lǐng)域落地，推動生產(chǎn)力進(jìn)階?！?/p>

打賞

相關(guān)標(biāo)簽：

物理Ai 元戎啟行周光

王欣 hello world

專欄作者|464篇文章

相關(guān)文章全部

禾賽科技一季度出貨量近20萬臺，激光雷達(dá)向機(jī)器人市場全面進(jìn)擊 2025-05-30 18:34
歷史進(jìn)程中的「一個吉利」 2025-05-27 12:05
對標(biāo)半價(jià)問界，深藍(lán)CEO鄧承浩：入局雖晚，但深藍(lán)S09目標(biāo)份額20%-30% 2025-05-26 15:45