智駕網(wǎng) 2024-06-05 11:38
英偉達(dá)加快AI芯片路線圖:黃仁勛透露GPU將一年一更
分享
一個(gè)PC顯卡市場明顯不夠老黃的胃口了,英偉達(dá)成為PC和生成式AI行業(yè)主導(dǎo)者的野心昭然若揭。

連續(xù)幾個(gè)月霸屏科技圈頭條,只是“皮衣老黃”黃仁勛的開胃菜。


正菜是這次他在臺北國際電腦展前夕發(fā)表的演講。


北京時(shí)間6月2日晚,英偉達(dá)創(chuàng)始人黃仁勛舉辦了一場名為“揭開新工業(yè)革命”的主題演講。他花了兩個(gè)小時(shí)詳細(xì)闡述自己對“GPU加速AI計(jì)算革命”及“AI工廠”的理解。


而硬核信息是去年發(fā)布的Blackwell芯片開始投產(chǎn),2025年將推出Blackwell Ultra,而下一代 AI 芯片架構(gòu)平臺名為Rubin,采用HBM4芯片,預(yù)計(jì)將于2026年推出。


同時(shí),黃仁勛還宣布推出推理模型微服務(wù)NVIDIA NIM,以部署在云、數(shù)據(jù)中心或工作站上,并且開發(fā)者能夠輕松地為Copilot、ChatGPT等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從數(shù)周縮短至幾分鐘。


同時(shí),英偉達(dá)面向GeForce RTX AI電腦平臺推出AI助理,為數(shù)字人推出G-Assist和NVIDIA ACE(數(shù)字人技術(shù)) NIMs,以及為微軟Windows Copilot Runtime推出用于RTX加速API的小語言模型(SLM)等等。


而在這一系列新產(chǎn)品與新預(yù)言中,最具看點(diǎn)的是其展示的GPU全新一代的Rubin架構(gòu)。


在黃仁勛看來,生成式AI剛剛打開了軟件編寫軟件的歷史,而一步,或者說新一代的工業(yè)革命正是機(jī)器來生產(chǎn)機(jī)器。


01.

盡管英偉達(dá)才剛推出了新的Blackwell平臺,卻開始了預(yù)告下一代Rubin GPU架構(gòu)路線圖的野心計(jì)劃。


黃仁勛表示,Blackwell的下一代架構(gòu)將是Rubin架構(gòu),且Rubin GPU將采用8顆HBM4,而Rubin Ultra GPU將采用12顆HBM4。


圖片


這個(gè)新的架構(gòu)以美國天文學(xué)家Vera Rubin命名,她被視為發(fā)現(xiàn)宇宙中的暗物質(zhì)的第一人,并在研究銀河系等星系自轉(zhuǎn)速度方面做了開創(chuàng)性的工作。


黃仁勛透露了GPU的更迭計(jì)劃:


“我們公司有一年的節(jié)奏。我們的基本理念很簡單:建立整個(gè)數(shù)據(jù)中心規(guī)模,然后以一年的節(jié)奏拆解并出售給您,并將一切推向技術(shù)極限?!?/strong>


這意味著英偉達(dá)新的GPU架構(gòu)將從兩年一次迭代,加速到以一年為周期推出。


  • 2024 年:Blackwell 芯片現(xiàn)已開始生產(chǎn)

  • 2025 年:推出 Blackwell Ultra 產(chǎn)品


  • 2026 年:推出 Rubin 產(chǎn)品


  • 2027 年:推出 Rubin Ultra 產(chǎn)品

根據(jù)外媒wccftech的消息,英偉達(dá)的Rubin GPU將采用4x光罩設(shè)計(jì),并將使用臺積電的CoWoS-L封裝技術(shù),并采用N3制程。此外,英偉達(dá)將使用下一代HBM4 DRAM來為其Rubin GPU提供動(dòng)力,目前英偉達(dá)在其B100 GPU中使用最快的HBM3E存儲(chǔ)器,并預(yù)計(jì)在2025年底當(dāng)HBM4存儲(chǔ)器解決方案大幅量產(chǎn)時(shí),用HBM4版本來更新這些芯片。


02.

當(dāng)前CPU面臨的困境是什么?


在黃仁勛看來,當(dāng)今 CPU 性能擴(kuò)展的速度已經(jīng)大大減緩,盡管我們需求的計(jì)算量仍然在以指數(shù)級的速度非??焖俚胤?。如果處理需求、我們需要處理的數(shù)據(jù)量呈指數(shù)級增長,但性能卻沒有相應(yīng)增長,我們將經(jīng)歷計(jì)算的「通貨膨脹」(computation inflation)。事實(shí)上,就在我們現(xiàn)在說話的時(shí)候,世界各地使用的數(shù)據(jù)中心電力數(shù)量正在大幅增長。計(jì)算機(jī)的成本正在不斷增長。這當(dāng)然不能再繼續(xù)下去了,因?yàn)閿?shù)據(jù)將繼續(xù)呈指數(shù)級增長,但 CPU 性能擴(kuò)展速度將永遠(yuǎn)不會(huì)恢復(fù)。


圖片


比如說對比英偉達(dá)2016年發(fā)布的Pascal GPU,Blackwell GPU的計(jì)算能力(對應(yīng)人工智能浮點(diǎn)運(yùn)算能力)增長了1000倍,幾乎“超越了摩爾定律在最佳時(shí)期的增長”。


黃仁勛一貫堅(jiān)持“買的越多,省得越多”的理念。


GPU和CPU組合在一起,實(shí)現(xiàn)了高達(dá)100倍的加速計(jì)算,同時(shí)功耗僅增加三倍,換算下來平均單位性能比單獨(dú)使用CPU提高25倍,顯著起到了節(jié)能、降成本的效果。


圖片


而100倍的速度意味著97%、98%的節(jié)省,所以當(dāng)GPU+CPU的組合從100倍的速度到200倍的速度再到1000倍的速度,節(jié)省、計(jì)算的邊際成本就會(huì)繼續(xù)下降。


黃仁勛的設(shè)想是,隨著人工智能模型繼續(xù)擴(kuò)大,對GPU性能的要求也將越來越高,傳統(tǒng)數(shù)據(jù)中心將進(jìn)化為“AI工廠”,而工廠的基石便是超級GPU。


演講過程中,黃仁勛甚至還親自搬上一臺體型更大的DGX服務(wù)器。這臺服務(wù)器上連接了8個(gè)Blackwell GPU,采用空氣冷卻技術(shù)散熱。目前全球搶購的AI服務(wù)器都用到這款產(chǎn)品,也是各大數(shù)據(jù)中心的核心設(shè)備。


圖片


其中DGX的AI算力提升到上一代的45倍,達(dá)到1440PFLOPS,而能耗僅為上一代的10倍。


黃仁勛極力描繪著生成式AI時(shí)代的一幅藍(lán)圖,展示了英偉達(dá)如何從Blackwell芯片等一系列先進(jìn)技術(shù)和產(chǎn)品的組合,壘起層層疊疊的機(jī)架、集群,最終形成由32000張GPU組成的AI工廠。


03.

一座AI工廠到底如何掀起新產(chǎn)業(yè)革命?


這次演講,黃仁勛宣布推出推理模型微服務(wù)NIM,能將企業(yè)部署生成式AI應(yīng)用的時(shí)間從幾天壓縮到幾分鐘,


這個(gè)微服務(wù)可以用于研究、開發(fā)和測試。


圖片

圖片


該服務(wù)提供了一種簡單、標(biāo)準(zhǔn)化的方式,通過經(jīng)優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。


現(xiàn)在,全球2800萬開發(fā)者可下載NIM,從而輕松構(gòu)建Copilot、聊天機(jī)器人等生成式AI應(yīng)用。


04.

如果你有聽黃仁勛在今年GTC上演講內(nèi)容,會(huì)發(fā)現(xiàn)具身智能占到居多篇幅。


黃仁勛堅(jiān)信下一波AI浪潮是物理AI,機(jī)器人時(shí)代已經(jīng)到來,所有移動(dòng)的物體都將實(shí)現(xiàn)自動(dòng)化。


英偉達(dá)這次發(fā)布了Isaac機(jī)器人平臺。


黃仁勛表示,我們正在努力通過推進(jìn)英偉達(dá)機(jī)器人堆棧來加速生成物理 AI,包括用于模擬應(yīng)用的Omniverse、Project GR00T人形基礎(chǔ)模型和 Jetson Thor機(jī)器人計(jì)算機(jī)。


圖片


目前,Isaac 生態(tài)系統(tǒng)迅速擴(kuò)張,包括西門子、比亞迪、Gideon、idealworks和RGo Robotics等都在與英偉達(dá)展開合作。


其他一系列新產(chǎn)品服務(wù)的落地情況,還有為專為AI打造的新型以太網(wǎng)Spectrum-X等。


一年前,黃仁勛曾在臺大畢業(yè)典禮上提出了一個(gè)這樣的問題:


2023年畢業(yè)的同學(xué)們,你們即將進(jìn)入一個(gè)經(jīng)歷巨大變革的世界,就像我畢業(yè)時(shí)遇到個(gè)人電腦和芯片革命時(shí)一樣,你們正處于AI的起跑線上。每個(gè)行業(yè)都將被革命、重生,為新思想做好準(zhǔn)備——你們的思想。在40年的時(shí)間里,我們創(chuàng)造了個(gè)人電腦、網(wǎng)路、移動(dòng)設(shè)備、云端技術(shù)?,F(xiàn)在的AI時(shí)代,你們將創(chuàng)造什么?


彼時(shí)英偉達(dá)的市值超過了1萬億美元,這一時(shí)刻與生成式AI爆發(fā)對GPU需求增長的節(jié)點(diǎn)吻合。


05.

一年過后的現(xiàn)在,英偉達(dá)市值超過2.7萬億美元,成為直逼蘋果挑戰(zhàn)全球第二大市值地位的公司。


根據(jù)Google財(cái)經(jīng)的數(shù)據(jù),截止目前,蘋果的市值為2.95萬億美元,而英偉達(dá)的市值為2.7萬億美元。參考路透社的解釋認(rèn)為,英偉達(dá)仍受益于人工智能熱潮,但蘋果目前正苦于IPhone需求疲軟和中國市場的激烈競爭。


今年,英偉達(dá)市值已從1萬億美元增長到2萬億美元,一舉超越亞馬遜、谷歌和沙特的石油公司。


這不禁讓智駕網(wǎng)想到此前在社交平臺上看到的一幕——


一位國外網(wǎng)友在社交平臺評論稱:“一百年后,人們會(huì)記得蘋果還是英偉達(dá)?”


另一位網(wǎng)友模仿老黃的口吻回答:“the future is generative AI!”

x

收藏 1
打賞
相關(guān)標(biāo)簽:
電話:010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽區(qū)朝外大街乙6號朝外SOHO D座5097室
北京智駕時(shí)代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權(quán)所有 AutoR智駕 智能汽車網(wǎng)
京ICP備14027737號-1      京公網(wǎng)安備 11010502038466號
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證:京B-20211307
關(guān)注官方微信