連續(xù)幾個月霸屏科技圈頭條,只是“皮衣老黃”黃仁勛的開胃菜。
正菜是這次他在臺北國際電腦展前夕發(fā)表的演講。
北京時間6月2日晚,英偉達創(chuàng)始人黃仁勛舉辦了一場名為“揭開新工業(yè)革命”的主題演講。他花了兩個小時詳細闡述自己對“GPU加速AI計算革命”及“AI工廠”的理解。
而硬核信息是去年發(fā)布的Blackwell芯片開始投產(chǎn),2025年將推出Blackwell Ultra,而下一代 AI 芯片架構平臺名為Rubin,采用HBM4芯片,預計將于2026年推出。
同時,黃仁勛還宣布推出推理模型微服務NVIDIA NIM,以部署在云、數(shù)據(jù)中心或工作站上,并且開發(fā)者能夠輕松地為Copilot、ChatGPT等構建生成式 AI 應用,所需時間從數(shù)周縮短至幾分鐘。
同時,英偉達面向GeForce RTX AI電腦平臺推出AI助理,為數(shù)字人推出G-Assist和NVIDIA ACE(數(shù)字人技術) NIMs,以及為微軟Windows Copilot Runtime推出用于RTX加速API的小語言模型(SLM)等等。
而在這一系列新產(chǎn)品與新預言中,最具看點的是其展示的GPU全新一代的Rubin架構。
在黃仁勛看來,生成式AI剛剛打開了軟件編寫軟件的歷史,而一步,或者說新一代的工業(yè)革命正是機器來生產(chǎn)機器。
01.
盡管英偉達才剛推出了新的Blackwell平臺,卻開始了預告下一代Rubin GPU架構路線圖的野心計劃。
黃仁勛表示,Blackwell的下一代架構將是Rubin架構,且Rubin GPU將采用8顆HBM4,而Rubin Ultra GPU將采用12顆HBM4。
這個新的架構以美國天文學家Vera Rubin命名,她被視為發(fā)現(xiàn)宇宙中的暗物質的第一人,并在研究銀河系等星系自轉速度方面做了開創(chuàng)性的工作。
黃仁勛透露了GPU的更迭計劃:
“我們公司有一年的節(jié)奏。我們的基本理念很簡單:建立整個數(shù)據(jù)中心規(guī)模,然后以一年的節(jié)奏拆解并出售給您,并將一切推向技術極限?!?/strong>
這意味著英偉達新的GPU架構將從兩年一次迭代,加速到以一年為周期推出。
2024 年:Blackwell 芯片現(xiàn)已開始生產(chǎn) 2025 年:推出 Blackwell Ultra 產(chǎn)品 2026 年:推出 Rubin 產(chǎn)品 2027 年:推出 Rubin Ultra 產(chǎn)品
根據(jù)外媒wccftech的消息,英偉達的Rubin GPU將采用4x光罩設計,并將使用臺積電的CoWoS-L封裝技術,并采用N3制程。此外,英偉達將使用下一代HBM4 DRAM來為其Rubin GPU提供動力,目前英偉達在其B100 GPU中使用最快的HBM3E存儲器,并預計在2025年底當HBM4存儲器解決方案大幅量產(chǎn)時,用HBM4版本來更新這些芯片。
02.
當前CPU面臨的困境是什么?
在黃仁勛看來,當今 CPU 性能擴展的速度已經(jīng)大大減緩,盡管我們需求的計算量仍然在以指數(shù)級的速度非常快速地翻倍。如果處理需求、我們需要處理的數(shù)據(jù)量呈指數(shù)級增長,但性能卻沒有相應增長,我們將經(jīng)歷計算的「通貨膨脹」(computation inflation)。事實上,就在我們現(xiàn)在說話的時候,世界各地使用的數(shù)據(jù)中心電力數(shù)量正在大幅增長。計算機的成本正在不斷增長。這當然不能再繼續(xù)下去了,因為數(shù)據(jù)將繼續(xù)呈指數(shù)級增長,但 CPU 性能擴展速度將永遠不會恢復。
比如說對比英偉達2016年發(fā)布的Pascal GPU,Blackwell GPU的計算能力(對應人工智能浮點運算能力)增長了1000倍,幾乎“超越了摩爾定律在最佳時期的增長”。
黃仁勛一貫堅持“買的越多,省得越多”的理念。
GPU和CPU組合在一起,實現(xiàn)了高達100倍的加速計算,同時功耗僅增加三倍,換算下來平均單位性能比單獨使用CPU提高25倍,顯著起到了節(jié)能、降成本的效果。
而100倍的速度意味著97%、98%的節(jié)省,所以當GPU+CPU的組合從100倍的速度到200倍的速度再到1000倍的速度,節(jié)省、計算的邊際成本就會繼續(xù)下降。
黃仁勛的設想是,隨著人工智能模型繼續(xù)擴大,對GPU性能的要求也將越來越高,傳統(tǒng)數(shù)據(jù)中心將進化為“AI工廠”,而工廠的基石便是超級GPU。
演講過程中,黃仁勛甚至還親自搬上一臺體型更大的DGX服務器。這臺服務器上連接了8個Blackwell GPU,采用空氣冷卻技術散熱。目前全球搶購的AI服務器都用到這款產(chǎn)品,也是各大數(shù)據(jù)中心的核心設備。
其中DGX的AI算力提升到上一代的45倍,達到1440PFLOPS,而能耗僅為上一代的10倍。
黃仁勛極力描繪著生成式AI時代的一幅藍圖,展示了英偉達如何從Blackwell芯片等一系列先進技術和產(chǎn)品的組合,壘起層層疊疊的機架、集群,最終形成由32000張GPU組成的AI工廠。
03.
一座AI工廠到底如何掀起新產(chǎn)業(yè)革命?
這次演講,黃仁勛宣布推出推理模型微服務NIM,能將企業(yè)部署生成式AI應用的時間從幾天壓縮到幾分鐘,
這個微服務可以用于研究、開發(fā)和測試。
該服務提供了一種簡單、標準化的方式,通過經(jīng)優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。
現(xiàn)在,全球2800萬開發(fā)者可下載NIM,從而輕松構建Copilot、聊天機器人等生成式AI應用。
04.
如果你有聽黃仁勛在今年GTC上演講內(nèi)容,會發(fā)現(xiàn)具身智能占到居多篇幅。
黃仁勛堅信下一波AI浪潮是物理AI,機器人時代已經(jīng)到來,所有移動的物體都將實現(xiàn)自動化。
英偉達這次發(fā)布了Isaac機器人平臺。
黃仁勛表示,我們正在努力通過推進英偉達機器人堆棧來加速生成物理 AI,包括用于模擬應用的Omniverse、Project GR00T人形基礎模型和 Jetson Thor機器人計算機。
目前,Isaac 生態(tài)系統(tǒng)迅速擴張,包括西門子、比亞迪、Gideon、idealworks和RGo Robotics等都在與英偉達展開合作。
其他一系列新產(chǎn)品服務的落地情況,還有為專為AI打造的新型以太網(wǎng)Spectrum-X等。
一年前,黃仁勛曾在臺大畢業(yè)典禮上提出了一個這樣的問題:
2023年畢業(yè)的同學們,你們即將進入一個經(jīng)歷巨大變革的世界,就像我畢業(yè)時遇到個人電腦和芯片革命時一樣,你們正處于AI的起跑線上。每個行業(yè)都將被革命、重生,為新思想做好準備——你們的思想。在40年的時間里,我們創(chuàng)造了個人電腦、網(wǎng)路、移動設備、云端技術?,F(xiàn)在的AI時代,你們將創(chuàng)造什么?
彼時英偉達的市值超過了1萬億美元,這一時刻與生成式AI爆發(fā)對GPU需求增長的節(jié)點吻合。
05.
一年過后的現(xiàn)在,英偉達市值超過2.7萬億美元,成為直逼蘋果挑戰(zhàn)全球第二大市值地位的公司。
根據(jù)Google財經(jīng)的數(shù)據(jù),截止目前,蘋果的市值為2.95萬億美元,而英偉達的市值為2.7萬億美元。參考路透社的解釋認為,英偉達仍受益于人工智能熱潮,但蘋果目前正苦于IPhone需求疲軟和中國市場的激烈競爭。
今年,英偉達市值已從1萬億美元增長到2萬億美元,一舉超越亞馬遜、谷歌和沙特的石油公司。
這不禁讓智駕網(wǎng)想到此前在社交平臺上看到的一幕——
一位國外網(wǎng)友在社交平臺評論稱:“一百年后,人們會記得蘋果還是英偉達?”
另一位網(wǎng)友模仿老黃的口吻回答:“the future is generative AI!”
x
-
特斯拉自動駕駛出租車“Cybercab”曝光,但投資者為Model 2喊冤 2024-06-13 13:44
-
2024北京車展:讓流量回歸流量,技術回歸技術 2024-05-29 13:17
-
禾賽和速騰聚創(chuàng)Q1財報橫評:市場對激光雷達的需求剛剛迎來爆發(fā)期 2024-05-22 11:05
-
續(xù)航301km,花仙子摯愛版5.99萬元起售 2024-06-10 23:14
-
歐盟關稅大棒砸向中國電動汽車:中歐貿(mào)易戰(zhàn)山雨欲來 2024-06-13 12:49
-
特斯拉自動駕駛出租車“Cybercab”曝光,但投資者為Model 2喊冤 2024-06-13 13:44