大模型能如何改造智能駕駛和智能座艙?百度的模式是從底層重構(gòu),百度Apollo借助生成式AI給今天的智能汽車市場(chǎng)開始提供一種全新的人機(jī)交互產(chǎn)品:性能更強(qiáng),成本更低。
生成式AI正成重塑百度的產(chǎn)品線。
10月17日,首鋼園,在2023百度世界大會(huì)上,李彥宏自信滿滿。在中美高度內(nèi)卷的百模大戰(zhàn)中,他推出了全新升級(jí)的文心大模型4.0和十余款A(yù)I原生應(yīng)用,在智能汽車領(lǐng)域,百度也借助大模型能力發(fā)布了多個(gè)行業(yè)領(lǐng)先的智能駕駛和智能座艙產(chǎn)品。簡(jiǎn)單來看,文心大模型4.0具備了對(duì)前后亂序、模糊意圖和潛臺(tái)詞等復(fù)雜提示詞的理解力,能根據(jù)素材圖生成海報(bào)、文案和視頻,還能撰寫小說,解讀藥品說明書等。李彥宏直言,文心大模型4.0綜合能力“與GPT-4相比毫不遜色”。在李彥宏發(fā)布的多款A(yù)I原生應(yīng)用中,包括搜索、入流、地圖、網(wǎng)盤、文庫(kù)等均在大模型能力賦能下具備了全新的能力。李彥宏下結(jié)論稱:AI原生時(shí)代已經(jīng)來臨。而在百度重點(diǎn)布局的智能汽車領(lǐng)域,可以說生成式AI 同樣重塑了百度的智艙和智駕產(chǎn)品,百度Apollo的多款產(chǎn)品都頗具看點(diǎn)。智駕產(chǎn)品中,百度Apollo發(fā)布的城市常用路線領(lǐng)航Apollo City Driving,借助車道級(jí)地圖,僅一趟就能實(shí)現(xiàn)秒級(jí)建圖。國(guó)內(nèi)首款純視覺城市領(lǐng)航高階智駕產(chǎn)品Apollo City Driving Max將于今年4季度量產(chǎn)落地。而在智艙領(lǐng)域,大模型能力將重構(gòu)人車交互業(yè)態(tài)。同時(shí),百度發(fā)布了智艙開發(fā)工具鏈,幫助品牌構(gòu)建專屬模型和應(yīng)用。此外,百度即將發(fā)布國(guó)內(nèi)首款艙駕融合智能汽車,搭載艙駕一體軟芯融合智算平臺(tái)Apollo Robo-Cabin。入門級(jí)產(chǎn)品可實(shí)現(xiàn)基本的行泊一體功能和智艙語言功能,后續(xù)也將推出高階智駕版本產(chǎn)品。具體來看,在智能駕駛領(lǐng)域,除了此前已經(jīng)發(fā)布的高速領(lǐng)航輔助產(chǎn)品,本次世界大會(huì)上,百度主要推出了城市專用路線領(lǐng)航Apollo City Driving。在百度統(tǒng)計(jì)的數(shù)據(jù)中,在城市場(chǎng)景,包括通勤場(chǎng)景、接送家人、固定活動(dòng)等在內(nèi)的常用路線占到整體出行需求的85%,為此,Apollo推出通勤模式,可以最高性價(jià)比實(shí)現(xiàn)無限趨近全域場(chǎng)景的城市輔助智駕。Apollo City Driving包括高速領(lǐng)航輔助、城區(qū)輔助、智能泊車以及可升級(jí)的通勤模式。通勤模式可實(shí)現(xiàn)城市自主變道、交通燈識(shí)別、無保護(hù)左/右轉(zhuǎn)以及十字路口啟停等功能。在整合多項(xiàng)功能后,Apollo City Driving可實(shí)現(xiàn)全場(chǎng)景覆蓋,實(shí)現(xiàn)全域點(diǎn)到點(diǎn)的領(lǐng)航,打通室外車位,任意城快/高速路線和城市常用路線間的連接,大幅擴(kuò)展使用場(chǎng)景,同時(shí)提高行車連續(xù)性。而且,由于通勤模式僅需使用中算力平臺(tái)就能實(shí)現(xiàn),大大優(yōu)化了性價(jià)比,而BEV能力的上線也將進(jìn)一步強(qiáng)化其安全性。Apollo City Driving優(yōu)秀的軟件能力可實(shí)現(xiàn)一趟秒級(jí)建圖,只需駕車開過一趟就能開啟通勤模式。而借助云端共享可將建圖路線分享給同車型的家人朋友。而且,建圖后,區(qū)域內(nèi)任意車位或任意點(diǎn)均可啟動(dòng)泊車功能。在泊車能力方面,支持?jǐn)囝^路車位、斜列,以及戶外記憶泊車等場(chǎng)景,可實(shí)現(xiàn)99%泊車場(chǎng)景覆蓋。這套方案使用的是9V5R12S傳感器配置,預(yù)計(jì)將于2024年下半年實(shí)現(xiàn)OTA推送升級(jí)。此外,百度智能汽車業(yè)務(wù)部總經(jīng)理蘇坦也表示,國(guó)內(nèi)首款純視覺城市領(lǐng)航高階智駕產(chǎn)品Apollo City Driving Max將于今年4季度量產(chǎn)落地。純視覺路線的高階智駕能力是今年業(yè)內(nèi)頗為熱門的概念,但目前有還沒有車企實(shí)現(xiàn)正式量產(chǎn)落地。同一天,極越發(fā)布了其國(guó)內(nèi)首個(gè)“BEV+Transformer”算法實(shí)現(xiàn)的純視覺高階智駕技術(shù)方案,并對(duì)外公布了極越與百度聯(lián)合研發(fā)的國(guó)內(nèi)首個(gè)占用網(wǎng)絡(luò)技術(shù)(Ocuupancy Network,OCC)。從公布內(nèi)容來看,極越01搭載的應(yīng)該就是Apollo City Driving Max。在極越官方社交賬號(hào)發(fā)布的一段城市領(lǐng)航輔助駕駛路試視頻中,極越01一鏡到底跑完了上海陸家嘴-外灘-南浦大橋等路段,全程零接管。BEV+Transformer的純視覺,配合OCC占用網(wǎng)絡(luò)技術(shù)能夠幫助汽車機(jī)器人更準(zhǔn)確還原3D場(chǎng)景,獲取比激光雷達(dá)點(diǎn)云分辨率更高的三維結(jié)構(gòu)信息,還能減少漏檢、誤檢并彌補(bǔ)視覺所不具備的空間高度信息,突破能力上線和提升安全保障的同時(shí),替代激光雷達(dá),并大幅提升了泛化能力。除了智駕能力,極越01的智能座艙能力也在百度世界大會(huì)上同步發(fā)布演示。極越01的語音交互不僅可覆蓋車內(nèi)車外、四路同說、連續(xù)對(duì)話等復(fù)雜場(chǎng)景,還融合語音、手勢(shì)、視覺識(shí)別等多模態(tài)交互,可根據(jù)用戶喜好和習(xí)慣帶來個(gè)性化的體驗(yàn)。未來,極越01還將搭載車載語音大模型,可實(shí)現(xiàn)語音、語義與聲紋端到端一體化建模,聲紋準(zhǔn)確率大于98.5%。同時(shí),百度Paddle Lite深度學(xué)習(xí)推理框架將多個(gè)云端大模型基座極致優(yōu)化后適配高通8295芯片,可使推理加速2倍,內(nèi)存降低60%,同時(shí)保持模型精度不降。蘇坦認(rèn)為,在大模型時(shí)代,理解、生成、推理、記憶等能力成為核心要素,座艙內(nèi)人和車的關(guān)系也將變?yōu)槿撕吞摂M人之間的關(guān)系,交互方式將發(fā)生巨變。百度推出的智艙大模型就是大模型由通用到專深的應(yīng)用,是專為座艙打造的技術(shù)底座。大模型的加持,可增強(qiáng)艙內(nèi)效果,使其獲得更類人的智能,提升艙內(nèi)交互理解能力60%,并增加多模/主動(dòng)交互能力,實(shí)現(xiàn)擬人回復(fù)能力,且推理速度快至1秒。同時(shí),大模型的加持可大大降低智能座艙落地成本,場(chǎng)景開發(fā)投入降低90%,推理調(diào)用成本也降低90%。語音交互是大模型落地智艙的基座,可實(shí)現(xiàn)大模型技能和座艙語音體驗(yàn)的無縫融合。目前Apollo大語言模型在智能座艙領(lǐng)域的產(chǎn)品包括車載語音SDK5.0/5.5,可實(shí)現(xiàn)大模型本地化加持的語音交互,車載智慧增強(qiáng)包,即可快速上車的車載大模型原生應(yīng)用,以及車載對(duì)話開發(fā)平臺(tái),實(shí)現(xiàn)車載大模型場(chǎng)景能力開發(fā)。Apollo大語言模型的合作車型包括極越01、凱迪拉克銳歌、別克E5、吉利銀河L和吉利銀河L6等。前一日,長(zhǎng)城也與百度Apollo簽定了大模型戰(zhàn)略合作備忘錄。此外,百度Apollo還提供智艙開發(fā)工具鏈,可支持主機(jī)廠高效構(gòu)建品牌專屬的模型和應(yīng)用,實(shí)現(xiàn)大模型從專深到品牌的進(jìn)一步細(xì)化。工具鏈將智艙AI原生應(yīng)用開發(fā)范式流程化、工具化,可實(shí)現(xiàn)全鏈路的降本增效。更值得一提的是百度Apollo將發(fā)布國(guó)內(nèi)首個(gè)艙駕融合智能汽車。隨著電子電氣架構(gòu)向中央集成式發(fā)展,跨域融合,艙駕融合也是近期業(yè)內(nèi)不斷被提及的話題。雖然多家芯片廠商發(fā)布了艙駕融合產(chǎn)品的計(jì)劃,車企與智駕公司也宣稱在進(jìn)行研發(fā),但目前尚未有一家企業(yè)公開發(fā)布過艙駕融合產(chǎn)品。Apollo Robo-Cabin即是百度即將推出的艙駕融合產(chǎn)品,采用同一平臺(tái)智駕基線架構(gòu),可實(shí)現(xiàn)快速高效量產(chǎn)。初期計(jì)劃中的產(chǎn)品將基于高通8295芯片,可實(shí)現(xiàn)入門級(jí)行泊一體能力和智能座艙能力。后續(xù),百度Apollo還計(jì)劃推出可實(shí)現(xiàn)高速領(lǐng)航+自主泊車能力以及城市通勤+自主泊車2.0能力的艙駕一體平臺(tái)產(chǎn)品。今年Chat GPT 橫空出世,引發(fā)產(chǎn)業(yè)顛覆式變革,人工智能漸行漸近。而在中國(guó)市場(chǎng),面向智能汽車推出特定應(yīng)用的大模型,先后有百度的文心一言、科大訊飛的星火大模型以及華為的盤古大模型和商湯科技的日日新SenseNova大模型。同時(shí)在智駕領(lǐng)域,長(zhǎng)城投資的毫末智行推出了Drive GPT。對(duì)于大模型對(duì)于智能駕駛和智能座艙的影響,業(yè)內(nèi)有不同聲音,像數(shù)據(jù)量達(dá)不到百億規(guī)模的屬于偽大模型。盡管對(duì)大模型的定義有爭(zhēng)議,對(duì)于如何借助大模型改造人車交互有不同看法,但大模型將從底層重構(gòu)人機(jī)交互方式卻是共識(shí)。百度在智能駕駛領(lǐng)域和智能座艙領(lǐng)域的投入和探索時(shí)間最入,并基本與國(guó)內(nèi)各大車企都有過合作,但一直受制于車輛的數(shù)據(jù)開放而無法深入,最終尋求自己造車,開發(fā)Robotaxi,此次文心一言4.0的發(fā)布,讓百度在AI時(shí)代找到了重塑數(shù)字基礎(chǔ)設(shè)施的機(jī)會(huì),因而李彥宏借助生成式AI重構(gòu)了產(chǎn)品線,如同馬化騰所說,什么是移動(dòng)互聯(lián)網(wǎng)就是在手機(jī)上把PC時(shí)代的互聯(lián)網(wǎng)重做一遍。以大模型為代表的生成式AI正成為移動(dòng)互聯(lián)網(wǎng)的下一個(gè)形態(tài),從這個(gè)視角來看大模型對(duì)智能汽車的改造,即可以看出百度Apollo正走在正確的路上,這也是百度與長(zhǎng)城汽車和吉利汽車進(jìn)一步加深合作的基礎(chǔ)。
百度依然是這一市場(chǎng)一位可改變格局的玩家。