123,123,123

智駕網(wǎng) 2024-06-05 11:38

英偉達(dá)加快AI芯片路線圖：黃仁勛透露GPU將一年一更

一個(gè)PC顯卡市場(chǎng)明顯不夠老黃的胃口了，英偉達(dá)成為PC和生成式AI行業(yè)主導(dǎo)者的野心昭然若揭。

連續(xù)幾個(gè)月霸屏科技圈頭條，只是“皮衣老黃”黃仁勛的開(kāi)胃菜。

正菜是這次他在臺(tái)北國(guó)際電腦展前夕發(fā)表的演講。

北京時(shí)間6月2日晚，英偉達(dá)創(chuàng)始人黃仁勛舉辦了一場(chǎng)名為“揭開(kāi)新工業(yè)革命”的主題演講。他花了兩個(gè)小時(shí)詳細(xì)闡述自己對(duì)“GPU加速AI計(jì)算革命”及“AI工廠”的理解。

而硬核信息是去年發(fā)布的Blackwell芯片開(kāi)始投產(chǎn)，2025年將推出Blackwell Ultra，而下一代 AI 芯片架構(gòu)平臺(tái)名為Rubin，采用HBM4芯片，預(yù)計(jì)將于2026年推出。

同時(shí)，黃仁勛還宣布推出推理模型微服務(wù)NVIDIA NIM，以部署在云、數(shù)據(jù)中心或工作站上，并且開(kāi)發(fā)者能夠輕松地為Copilot、ChatGPT等構(gòu)建生成式 AI 應(yīng)用，所需時(shí)間從數(shù)周縮短至幾分鐘。

同時(shí)，英偉達(dá)面向GeForce RTX AI電腦平臺(tái)推出AI助理，為數(shù)字人推出G-Assist和NVIDIA ACE（數(shù)字人技術(shù)） NIMs，以及為微軟Windows Copilot Runtime推出用于RTX加速API的小語(yǔ)言模型（SLM）等等。

而在這一系列新產(chǎn)品與新預(yù)言中，最具看點(diǎn)的是其展示的GPU全新一代的Rubin架構(gòu)。

在黃仁勛看來(lái)，生成式AI剛剛打開(kāi)了軟件編寫(xiě)軟件的歷史，而一步，或者說(shuō)新一代的工業(yè)革命正是機(jī)器來(lái)生產(chǎn)機(jī)器。

01.

盡管英偉達(dá)才剛推出了新的Blackwell平臺(tái)，卻開(kāi)始了預(yù)告下一代Rubin GPU架構(gòu)路線圖的野心計(jì)劃。

黃仁勛表示，Blackwell的下一代架構(gòu)將是Rubin架構(gòu)，且Rubin GPU將采用8顆HBM4，而Rubin Ultra GPU將采用12顆HBM4。

這個(gè)新的架構(gòu)以美國(guó)天文學(xué)家Vera Rubin命名，她被視為發(fā)現(xiàn)宇宙中的暗物質(zhì)的第一人，并在研究銀河系等星系自轉(zhuǎn)速度方面做了開(kāi)創(chuàng)性的工作。

黃仁勛透露了GPU的更迭計(jì)劃：

“我們公司有一年的節(jié)奏。我們的基本理念很簡(jiǎn)單：建立整個(gè)數(shù)據(jù)中心規(guī)模，然后以一年的節(jié)奏拆解并出售給您，并將一切推向技術(shù)極限。”

這意味著英偉達(dá)新的GPU架構(gòu)將從兩年一次迭代，加速到以一年為周期推出。

2024 年：Blackwell 芯片現(xiàn)已開(kāi)始生產(chǎn)
2025 年：推出 Blackwell Ultra 產(chǎn)品
2026 年：推出 Rubin 產(chǎn)品
2027 年：推出 Rubin Ultra 產(chǎn)品

根據(jù)外媒wccftech的消息，英偉達(dá)的Rubin GPU將采用4x光罩設(shè)計(jì)，并將使用臺(tái)積電的CoWoS-L封裝技術(shù)，并采用N3制程。此外，英偉達(dá)將使用下一代HBM4 DRAM來(lái)為其Rubin GPU提供動(dòng)力，目前英偉達(dá)在其B100 GPU中使用最快的HBM3E存儲(chǔ)器，并預(yù)計(jì)在2025年底當(dāng)HBM4存儲(chǔ)器解決方案大幅量產(chǎn)時(shí)，用HBM4版本來(lái)更新這些芯片。

02.

當(dāng)前CPU面臨的困境是什么？

在黃仁勛看來(lái)，當(dāng)今 CPU 性能擴(kuò)展的速度已經(jīng)大大減緩，盡管我們需求的計(jì)算量仍然在以指數(shù)級(jí)的速度非?？焖俚胤丁Ｈ绻幚硇枨?、我們需要處理的數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)，但性能卻沒(méi)有相應(yīng)增長(zhǎng)，我們將經(jīng)歷計(jì)算的「通貨膨脹」（computation inflation）。事實(shí)上，就在我們現(xiàn)在說(shuō)話的時(shí)候，世界各地使用的數(shù)據(jù)中心電力數(shù)量正在大幅增長(zhǎng)。計(jì)算機(jī)的成本正在不斷增長(zhǎng)。這當(dāng)然不能再繼續(xù)下去了，因?yàn)閿?shù)據(jù)將繼續(xù)呈指數(shù)級(jí)增長(zhǎng)，但 CPU 性能擴(kuò)展速度將永遠(yuǎn)不會(huì)恢復(fù)。

比如說(shuō)對(duì)比英偉達(dá)2016年發(fā)布的Pascal GPU，Blackwell GPU的計(jì)算能力（對(duì)應(yīng)人工智能浮點(diǎn)運(yùn)算能力）增長(zhǎng)了1000倍，幾乎“超越了摩爾定律在最佳時(shí)期的增長(zhǎng)”。

黃仁勛一貫堅(jiān)持“買(mǎi)的越多，省得越多”的理念。

GPU和CPU組合在一起，實(shí)現(xiàn)了高達(dá)100倍的加速計(jì)算，同時(shí)功耗僅增加三倍，換算下來(lái)平均單位性能比單獨(dú)使用CPU提高25倍，顯著起到了節(jié)能、降成本的效果。

而100倍的速度意味著97%、98%的節(jié)省，所以當(dāng)GPU+CPU的組合從100倍的速度到200倍的速度再到1000倍的速度，節(jié)省、計(jì)算的邊際成本就會(huì)繼續(xù)下降。

黃仁勛的設(shè)想是，隨著人工智能模型繼續(xù)擴(kuò)大，對(duì)GPU性能的要求也將越來(lái)越高，傳統(tǒng)數(shù)據(jù)中心將進(jìn)化為“AI工廠”，而工廠的基石便是超級(jí)GPU。

演講過(guò)程中，黃仁勛甚至還親自搬上一臺(tái)體型更大的DGX服務(wù)器。這臺(tái)服務(wù)器上連接了8個(gè)Blackwell GPU，采用空氣冷卻技術(shù)散熱。目前全球搶購(gòu)的AI服務(wù)器都用到這款產(chǎn)品，也是各大數(shù)據(jù)中心的核心設(shè)備。

其中DGX的AI算力提升到上一代的45倍，達(dá)到1440PFLOPS，而能耗僅為上一代的10倍。

黃仁勛極力描繪著生成式AI時(shí)代的一幅藍(lán)圖，展示了英偉達(dá)如何從Blackwell芯片等一系列先進(jìn)技術(shù)和產(chǎn)品的組合，壘起層層疊疊的機(jī)架、集群，最終形成由32000張GPU組成的AI工廠。

03.

一座AI工廠到底如何掀起新產(chǎn)業(yè)革命？

這次演講，黃仁勛宣布推出推理模型微服務(wù)NIM，能將企業(yè)部署生成式AI應(yīng)用的時(shí)間從幾天壓縮到幾分鐘，

這個(gè)微服務(wù)可以用于研究、開(kāi)發(fā)和測(cè)試。

該服務(wù)提供了一種簡(jiǎn)單、標(biāo)準(zhǔn)化的方式，通過(guò)經(jīng)優(yōu)化的容器形式提供AI模型，可部署在云、數(shù)據(jù)中心或工作站上。

現(xiàn)在，全球2800萬(wàn)開(kāi)發(fā)者可下載NIM，從而輕松構(gòu)建Copilot、聊天機(jī)器人等生成式AI應(yīng)用。

04.

如果你有聽(tīng)黃仁勛在今年GTC上演講內(nèi)容，會(huì)發(fā)現(xiàn)具身智能占到居多篇幅。

黃仁勛堅(jiān)信下一波AI浪潮是物理AI，機(jī)器人時(shí)代已經(jīng)到來(lái)，所有移動(dòng)的物體都將實(shí)現(xiàn)自動(dòng)化。

英偉達(dá)這次發(fā)布了Isaac機(jī)器人平臺(tái)。

黃仁勛表示，我們正在努力通過(guò)推進(jìn)英偉達(dá)機(jī)器人堆棧來(lái)加速生成物理 AI，包括用于模擬應(yīng)用的Omniverse、Project GR00T人形基礎(chǔ)模型和 Jetson Thor機(jī)器人計(jì)算機(jī)。

目前，Isaac 生態(tài)系統(tǒng)迅速擴(kuò)張，包括西門(mén)子、比亞迪、Gideon、idealworks和RGo Robotics等都在與英偉達(dá)展開(kāi)合作。

其他一系列新產(chǎn)品服務(wù)的落地情況，還有為專(zhuān)為AI打造的新型以太網(wǎng)Spectrum-X等。

一年前，黃仁勛曾在臺(tái)大畢業(yè)典禮上提出了一個(gè)這樣的問(wèn)題：

2023年畢業(yè)的同學(xué)們，你們即將進(jìn)入一個(gè)經(jīng)歷巨大變革的世界，就像我畢業(yè)時(shí)遇到個(gè)人電腦和芯片革命時(shí)一樣，你們正處于AI的起跑線上。每個(gè)行業(yè)都將被革命、重生，為新思想做好準(zhǔn)備——你們的思想。在40年的時(shí)間里，我們創(chuàng)造了個(gè)人電腦、網(wǎng)路、移動(dòng)設(shè)備、云端技術(shù)。現(xiàn)在的AI時(shí)代，你們將創(chuàng)造什么？

彼時(shí)英偉達(dá)的市值超過(guò)了1萬(wàn)億美元，這一時(shí)刻與生成式AI爆發(fā)對(duì)GPU需求增長(zhǎng)的節(jié)點(diǎn)吻合。

05.

一年過(guò)后的現(xiàn)在，英偉達(dá)市值超過(guò)2.7萬(wàn)億美元，成為直逼蘋(píng)果挑戰(zhàn)全球第二大市值地位的公司。

根據(jù)Google財(cái)經(jīng)的數(shù)據(jù)，截止目前，蘋(píng)果的市值為2.95萬(wàn)億美元，而英偉達(dá)的市值為2.7萬(wàn)億美元。參考路透社的解釋認(rèn)為，英偉達(dá)仍受益于人工智能熱潮，但蘋(píng)果目前正苦于IPhone需求疲軟和中國(guó)市場(chǎng)的激烈競(jìng)爭(zhēng)。

今年，英偉達(dá)市值已從1萬(wàn)億美元增長(zhǎng)到2萬(wàn)億美元，一舉超越亞馬遜、谷歌和沙特的石油公司。

這不禁讓智駕網(wǎng)想到此前在社交平臺(tái)上看到的一幕——

一位國(guó)外網(wǎng)友在社交平臺(tái)評(píng)論稱(chēng)：“一百年后，人們會(huì)記得蘋(píng)果還是英偉達(dá)？”

另一位網(wǎng)友模仿老黃的口吻回答：“the future is generative AI！”

打賞

相關(guān)標(biāo)簽：

英偉達(dá)

王欣 Wechat：xinwell0709 ，快來(lái)找我嘮嗑呀~

專(zhuān)欄作者|90篇文章

相關(guān)文章全部