123,123,123

智駕網(wǎng) 2024-10-29 16:26

這一次視覺智駕是不是真的可以把激光雷達(dá)干掉了？

從激光雷達(dá)路線轉(zhuǎn)型到視覺路線，感知能力反而大幅提升，小鵬視覺智駕進(jìn)化的秘訣就在于云端大模型和LOFIC架構(gòu)的落地。而隨著造車成本的下降，性價(jià)比優(yōu)勢顯然會推動更多的主機(jī)廠跟隨加入，視覺智能有沒有可能超越雷視融合方案成為市場主流，小鵬P7+的市場表現(xiàn)十分關(guān)鍵。

盡管路上配備激光雷達(dá)的車輛越來越多，但加入視覺感知路線的玩家陣營正在更具規(guī)?；?。

今年夏天何小鵬在美國體驗(yàn)了一輪特斯拉的FSD之后，宣布將小鵬的雷視融合智駕方案全面切換到視覺感知路線。

所謂全面，即是未來小鵬新推出的車型都不再配備激光雷達(dá)。

這與部分品牌將視覺智駕做為智駕的低配方案完全不同。

01.
視覺智駕的陣營正空前強(qiáng)大

做為小鵬未來十年的開山之作，小鵬P7+成為小鵬AI鷹眼視覺方案落地的首款車型。

小鵬汽車成為繼特斯拉、極越之后，第三個(gè)高調(diào)宣布僅采用視覺感知智駕的智能汽車品牌。

而在此之前，蔚來樂道品牌的首款車型L60，以及智界S7、新問界M5、深藍(lán)S07都推出了基于華為乾崑ADS SE系統(tǒng)的視覺感知智駕系統(tǒng)。

而在供應(yīng)商層面，華為乾崑、百度阿波羅、大疆車載、商湯絕影、智駕科技MAXIEYE、Nullmax都是視覺感知智駕技術(shù)的供應(yīng)商。

而在10月11日特斯拉發(fā)布的無人駕駛出租車Cybercab也是一款“不需要激光雷達(dá)做感知冗余”的L4級無人駕駛車輛。

盡管多家智駕科技公司曾向智駕網(wǎng)表示，視覺感知就是無人駕駛的終極解決方案，但激光雷達(dá)做為感知冗余配置在L4、L5級無人駕駛車輛上的配置還是不可取代的，但馬斯克對于Robotaxi上能過視覺方案實(shí)現(xiàn)完全自動駕駛的路線非常有信心：“使用AI和計(jì)算視覺，不需要昂貴的設(shè)備，就可以在無監(jiān)督的情況下實(shí)現(xiàn)FSD。”

這無疑進(jìn)一步提振了視覺感知派的信心。

那么視覺感知路線真的能實(shí)現(xiàn)其所宣稱的能力嗎？鑒于特斯拉的FSD尚沒有明確的入華時(shí)間表，國內(nèi)能驗(yàn)證視覺智駕天花板的就是小鵬P7+。

當(dāng)下無論是樂道L60還是鴻蒙智行系的智界S7、新問界M7在城市高階智駕方面宣稱的皆是快速路NOA，小鵬P7+則是直接面向城市所有場景的NOA。

日前智駕網(wǎng)在廣州市區(qū)，特別是在夜間場景體驗(yàn)了小鵬P7+，這款車在掉頭、無保護(hù)左轉(zhuǎn)、緊急避讓逆行車輛、臨時(shí)變道等場景表現(xiàn)出極強(qiáng)的超越人類駕駛員的能力。

在夜間模式下，小鵬P7+對目標(biāo)物的識別，道路狀況的分析做到了與白天幾無差別的自動行駛。

廣州做為小鵬汽車的大本營，可以想象小鵬汽車對這座城市的道路信息十分熟悉，但即便如此，這樣的驚艷表現(xiàn)依然讓人相信，視覺感知智駕的上限對于激光雷達(dá)已沒有不得已的依賴。

那么小鵬視覺智駕是如何克服傳統(tǒng)的攝像頭對陰暗、逆光、靜態(tài)物場景等的應(yīng)對，實(shí)現(xiàn)全場景、隨時(shí)隨地開啟的？

綜合來看，小鵬的視覺智駕能力是新技術(shù)應(yīng)用的結(jié)果。

1、在硬件上保證算力和感知冗余：2顆英偉達(dá)Orin-X智駕芯片，算力為508TOPS，攝像頭達(dá)到了11顆，多于傳統(tǒng)的7顆；

2、端到端的云端大模型，依托強(qiáng)大的云端算力，增強(qiáng)了智駕系統(tǒng)對道路場景的理解能力，判斷時(shí)間更短，更能應(yīng)對突發(fā)狀況；

3、新技術(shù)架構(gòu)LOFIC架構(gòu)大大提升了攝像頭的全場景感知能力，讓智駕看得更清晰、更準(zhǔn)確。

小鵬P7+的技術(shù)工程師向智駕網(wǎng)表示，視覺感知路線不僅省掉了激光雷達(dá)的成本，在決策效率上也要更快，因?yàn)槭∪チ思す饫走_(dá)感知信息的融合過程。而從人類駕駛的形式來看，也不需要雷達(dá)來輔助，所以在技術(shù)上只要擁有了足夠強(qiáng)大的視覺感知能力，就可以實(shí)現(xiàn)高階智駕，級別甚至可以達(dá)到L4級。

在10月24日的小鵬的“1024科技日”，小鵬汽車的智駕團(tuán)隊(duì)詳細(xì)解釋了AI鷹眼視覺方案的兩大核心技術(shù)，云端大模型和LOFIC架構(gòu)方案。

02.
云端大模型加持，視覺感知能力進(jìn)化

按照小鵬官方的說法，在采用了云端大模型之后，訓(xùn)練效率已提升了2.6倍，2025年小鵬云端的算力將會達(dá)到10EFlops以上。

基于這個(gè)表現(xiàn)，小鵬高層判斷：自動駕駛的新一輪競爭正在云端展開。

小鵬汽車副總裁、自動駕駛負(fù)責(zé)人李力耘表示，目前行業(yè)有三種主流的端到端發(fā)展路線：

一種是通過大量規(guī)則小模型堆疊的 “大模型”，其需要大量的優(yōu)秀規(guī)則工程師；

一種是“車端大模型”，即直接將端到端模型部署于車輛上，雖然見效快，但受限于車端算力，且隨著后期訓(xùn)練數(shù)據(jù)量的增加，容易陷入瓶頸；

最后一種便是云端大模型，其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍，這是單純的車端大模型所不可企及的。

李力耘表示，前兩種端到端的技術(shù)路線都能帶來一定成效，但云端大模型才是制勝關(guān)鍵，小鵬云端大模型的參數(shù)量將多達(dá)車端參數(shù)量的80倍，云端大模型能夠全面吸納智駕數(shù)據(jù)，不遺漏重點(diǎn)信息細(xì)節(jié)。通過大參數(shù)量的訓(xùn)練，能夠盡可能地窮盡智能駕駛中的長尾問題，以覆蓋更多駕駛場景，使XNGP實(shí)現(xiàn)L3級的智駕體驗(yàn)。

李力耘提到的所謂“長尾問題”，就是指在自動駕駛過程中那些發(fā)生概率較低、但種類繁多的特殊場景所帶來的潛在風(fēng)險(xiǎn)。

當(dāng)下，目前自動駕駛的底層架構(gòu)和大部分技術(shù)問題已解決，但剩下的約5%的長尾問題成了關(guān)鍵。

這些問題涵蓋各種零碎、極端的情況和難以預(yù)測的人類行為，例如：帶有凸出貨物的卡車、打傘的行人、倒在路中央的樹木，以及異形車輛、亂穿馬路的行人和自行車、雨雪等極端天氣、極暗的行車環(huán)境等。

自動駕駛依靠攝像頭、激光雷達(dá)、毫米波雷達(dá)等傳感器感知環(huán)境并做出決策但這些傳感器在某些情況下存在局限。例如：

在惡劣天氣中可見光攝像頭可能衰減直至失效，

超聲波雷達(dá)在遠(yuǎn)距離探測精度較差，

激光雷達(dá)在雪天和風(fēng)沙天易受影響，在對向眩光、陽光及信號干擾、黑夜無燈路段等情況下也會出現(xiàn)不同程度的問題。

導(dǎo)致長尾問題的本質(zhì)其實(shí)是信息不足，解決方法就是從補(bǔ)充信息的角度去處理。

根據(jù)官方數(shù)據(jù)，小鵬云端大模型可極致發(fā)揮攝像頭高信息量輸入，8倍提升有效視覺信息量。相較于激光雷達(dá)方案，AI鷹眼視覺方案的攝像頭信息量是前者的80倍，而攝像頭能夠感知的語義和顏色信息是其100倍，攝像頭的反應(yīng)速度也是其3倍。

這些數(shù)據(jù)表明，在擁有云端大模型加持之后，其視覺感知能力已經(jīng)遠(yuǎn)遠(yuǎn)超越了激光雷達(dá)，因此也就不再需要它的輔助。

系統(tǒng)通過視覺感知方案獲得了更多的信息量，長尾問題的解決也就更加高效和可靠。

可以說，這正是現(xiàn)階段視覺感知技術(shù)開始呈現(xiàn)超越激光雷達(dá)感知能力的基礎(chǔ)。

李力耘表示，對于輕雷達(dá)、輕地圖的智駕方案而言，高算力大模型既是基礎(chǔ)也是門檻。

他表示，小鵬的云端大模型是國內(nèi)首個(gè)泛機(jī)器人領(lǐng)域的基礎(chǔ)大模型，不僅可以應(yīng)用在自動駕駛領(lǐng)域，機(jī)器人、飛行汽車等領(lǐng)域均適用。它讓小鵬成為了全球唯二能做到不依賴高精度地圖、激光雷達(dá)，實(shí)現(xiàn)用一套軟件適配全車系的車企。

按照官方公布的規(guī)劃，小鵬P7+及后續(xù)車型也因此不再區(qū)分Max和Pro版本，全系都能標(biāo)配AI智駕。

03.
LOFIC架構(gòu)落地，AI鷹眼視覺方案實(shí)力倍增

在談及由小鵬P7+首發(fā)搭載的AI鷹眼視覺方案時(shí)，官方特別強(qiáng)調(diào)了其采用了行業(yè)首個(gè)單像素LOFIC架構(gòu)方案。

這一技術(shù)的優(yōu)勢，是在逆光、大光差、暗光等環(huán)境下的信息采集能力更強(qiáng)。并且該架構(gòu)方案的視覺感知范圍也更大，達(dá)到了1.8個(gè)標(biāo)準(zhǔn)足球場，甚至能夠清晰分辨顏色、文字等語義信息。

LOFIC技術(shù)的全稱是“Lateral overflow integrated capacitor”，即橫向溢出集成式電容技術(shù)，這項(xiàng)技術(shù)的誕生是為了滿足CMOS圖像傳感器對高動態(tài)范圍的需求。

CMOS圖像傳感器的動態(tài)范圍越高，視覺感知系統(tǒng)就能“看得更準(zhǔn)更清晰”。

CMOS的成像原理主要是通過把光線轉(zhuǎn)換成電荷，進(jìn)而形成畫面，如果我們用一個(gè)“桶”來承載單個(gè)像素所轉(zhuǎn)換出來的電荷，那這個(gè)桶能容納電荷的多少就決定了這個(gè)像素成像的明暗細(xì)節(jié)程度。如果桶里是空的，那此時(shí)的畫面就是全黑的，也就是曝光不足；如果桶里的電荷數(shù)量多到溢出了桶外，那這時(shí)的畫面就是一片白色，也就是曝光過度。

在LOFIC技術(shù)出現(xiàn)之前，要提高動態(tài)范圍有許多方式，例如多次曝光或大小像素等。

據(jù)小鵬工程師介紹，之前的視覺技術(shù)是同步記錄兩張圖像，一個(gè)曝光比較亮的，一個(gè)曝光比較暗的，之后通過算法將二者進(jìn)行合成，從而構(gòu)成完整的感知圖像。這樣做的缺點(diǎn)，是遇到運(yùn)動速度比較快的目標(biāo)物時(shí)會有延遲，并且有色彩串?dāng)_和產(chǎn)生閃爍等問題。

▲圖片來自：3d tof的《HDR技術(shù)詳細(xì)解析》

LOFIC技術(shù)的原理，就是對承載電荷的“桶”進(jìn)行擴(kuò)容，LOFIC電容用于收集橫向溢出的電荷。當(dāng)電荷數(shù)量超過像素CFD原本能承載的最大限度，多余的電荷就不會溢出損失掉，而是會流到相鄰的“桶”里。之后通過讀取“桶”里的電荷，再結(jié)合數(shù)字算法技術(shù)，就能夠獲得更高的動態(tài)范圍，成像也就更加細(xì)膩、清晰。

而這也是小鵬宣稱LOFIC架構(gòu)方案信息采集能力更強(qiáng)、感知范圍更大，能夠清晰分辨語義信息的原因。

04.
視覺智駕的更大優(yōu)勢是降低了造成成本

在有了云端大模型和LOFIC架構(gòu)加持之后，智駕網(wǎng)在實(shí)際路測過程中，真實(shí)感受到了AI天璣5.4.0系統(tǒng)的智駕能力。

當(dāng)然試駕車輛和量產(chǎn)落地車輛的技術(shù)表現(xiàn)可能存在一定的變化。

在小鵬汽車發(fā)布的數(shù)據(jù)顯示，AI天璣5.4.0系統(tǒng)的“擬人性”提升了4倍，變道成功率提升了53%，繞行成功率提升了155%。

但我們的真實(shí)感受是，這一系統(tǒng)與當(dāng)下眾多采用雷視融合方案的城市高階智駕相比沒有短板，甚至超過不少一線陣營的體驗(yàn)。

而這一系統(tǒng)的另一優(yōu)勢，在于大大降低了造車成本，讓小鵬汽車在市場上更有性價(jià)比優(yōu)勢。

這讓何小鵬敢于在這款車上全系標(biāo)配這一功能，而不再區(qū)分所謂的Pro、Max等版本。

據(jù)了解，小鵬P7+是小鵬汽車首款實(shí)現(xiàn)技術(shù)成本降低25%目標(biāo)的車型，預(yù)計(jì)其利潤率將達(dá)到兩位數(shù)。而此前何小鵬曾透露：“投資人希望這款車的毛利率到20%?！?/p>

而隨著造車成本的下降，其強(qiáng)大的性價(jià)比優(yōu)勢顯然會推動更多的主機(jī)廠跟隨加入，視覺智駕有沒有可能超越雷視融合方案成為市場主流，小鵬P7+的市場表現(xiàn)十分關(guān)鍵。

打賞

相關(guān)標(biāo)簽：

智駕視覺智駕激光雷達(dá)

智駕網(wǎng)編一號機(jī)

專欄作者|6571篇文章

相關(guān)文章全部

比亞迪、零跑提前完成年度銷量，智駕頭部企業(yè)加碼「車位到車位」丨11月銷量橫評 2024-12-03 15:00
奧迪的一小步，合資品牌的一大步 2024-12-03 14:31
無圖，擁抱端到端，奔馳在華搶先落地高階智駕 2024-12-03 14:23