智駕網(wǎng) 2024-06-05 11:38
英偉達加快AI芯片路線圖:黃仁勛透露GPU將一年一更
分享
一個PC顯卡市場明顯不夠老黃的胃口了,英偉達成為PC和生成式AI行業(yè)主導者的野心昭然若揭。

連續(xù)幾個月霸屏科技圈頭條,只是“皮衣老黃”黃仁勛的開胃菜。


正菜是這次他在臺北國際電腦展前夕發(fā)表的演講。


北京時間6月2日晚,英偉達創(chuàng)始人黃仁勛舉辦了一場名為“揭開新工業(yè)革命”的主題演講。他花了兩個小時詳細闡述自己對“GPU加速AI計算革命”及“AI工廠”的理解。


而硬核信息是去年發(fā)布的Blackwell芯片開始投產(chǎn),2025年將推出Blackwell Ultra,而下一代 AI 芯片架構平臺名為Rubin,采用HBM4芯片,預計將于2026年推出。


同時,黃仁勛還宣布推出推理模型微服務NVIDIA NIM,以部署在云、數(shù)據(jù)中心或工作站上,并且開發(fā)者能夠輕松地為Copilot、ChatGPT等構建生成式 AI 應用,所需時間從數(shù)周縮短至幾分鐘。


同時,英偉達面向GeForce RTX AI電腦平臺推出AI助理,為數(shù)字人推出G-Assist和NVIDIA ACE(數(shù)字人技術) NIMs,以及為微軟Windows Copilot Runtime推出用于RTX加速API的小語言模型(SLM)等等。


而在這一系列新產(chǎn)品與新預言中,最具看點的是其展示的GPU全新一代的Rubin架構。


在黃仁勛看來,生成式AI剛剛打開了軟件編寫軟件的歷史,而一步,或者說新一代的工業(yè)革命正是機器來生產(chǎn)機器。


01.

盡管英偉達才剛推出了新的Blackwell平臺,卻開始了預告下一代Rubin GPU架構路線圖的野心計劃。


黃仁勛表示,Blackwell的下一代架構將是Rubin架構,且Rubin GPU將采用8顆HBM4,而Rubin Ultra GPU將采用12顆HBM4。


圖片


這個新的架構以美國天文學家Vera Rubin命名,她被視為發(fā)現(xiàn)宇宙中的暗物質的第一人,并在研究銀河系等星系自轉速度方面做了開創(chuàng)性的工作。


黃仁勛透露了GPU的更迭計劃:


“我們公司有一年的節(jié)奏。我們的基本理念很簡單:建立整個數(shù)據(jù)中心規(guī)模,然后以一年的節(jié)奏拆解并出售給您,并將一切推向技術極限?!?/strong>


這意味著英偉達新的GPU架構將從兩年一次迭代,加速到以一年為周期推出。


  • 2024 年:Blackwell 芯片現(xiàn)已開始生產(chǎn)

  • 2025 年:推出 Blackwell Ultra 產(chǎn)品


  • 2026 年:推出 Rubin 產(chǎn)品


  • 2027 年:推出 Rubin Ultra 產(chǎn)品

根據(jù)外媒wccftech的消息,英偉達的Rubin GPU將采用4x光罩設計,并將使用臺積電的CoWoS-L封裝技術,并采用N3制程。此外,英偉達將使用下一代HBM4 DRAM來為其Rubin GPU提供動力,目前英偉達在其B100 GPU中使用最快的HBM3E存儲器,并預計在2025年底當HBM4存儲器解決方案大幅量產(chǎn)時,用HBM4版本來更新這些芯片。


02.

當前CPU面臨的困境是什么?


在黃仁勛看來,當今 CPU 性能擴展的速度已經(jīng)大大減緩,盡管我們需求的計算量仍然在以指數(shù)級的速度非常快速地翻倍。如果處理需求、我們需要處理的數(shù)據(jù)量呈指數(shù)級增長,但性能卻沒有相應增長,我們將經(jīng)歷計算的「通貨膨脹」(computation inflation)。事實上,就在我們現(xiàn)在說話的時候,世界各地使用的數(shù)據(jù)中心電力數(shù)量正在大幅增長。計算機的成本正在不斷增長。這當然不能再繼續(xù)下去了,因為數(shù)據(jù)將繼續(xù)呈指數(shù)級增長,但 CPU 性能擴展速度將永遠不會恢復。


圖片


比如說對比英偉達2016年發(fā)布的Pascal GPU,Blackwell GPU的計算能力(對應人工智能浮點運算能力)增長了1000倍,幾乎“超越了摩爾定律在最佳時期的增長”。


黃仁勛一貫堅持“買的越多,省得越多”的理念。


GPU和CPU組合在一起,實現(xiàn)了高達100倍的加速計算,同時功耗僅增加三倍,換算下來平均單位性能比單獨使用CPU提高25倍,顯著起到了節(jié)能、降成本的效果。


圖片


而100倍的速度意味著97%、98%的節(jié)省,所以當GPU+CPU的組合從100倍的速度到200倍的速度再到1000倍的速度,節(jié)省、計算的邊際成本就會繼續(xù)下降。


黃仁勛的設想是,隨著人工智能模型繼續(xù)擴大,對GPU性能的要求也將越來越高,傳統(tǒng)數(shù)據(jù)中心將進化為“AI工廠”,而工廠的基石便是超級GPU。


演講過程中,黃仁勛甚至還親自搬上一臺體型更大的DGX服務器。這臺服務器上連接了8個Blackwell GPU,采用空氣冷卻技術散熱。目前全球搶購的AI服務器都用到這款產(chǎn)品,也是各大數(shù)據(jù)中心的核心設備。


圖片


其中DGX的AI算力提升到上一代的45倍,達到1440PFLOPS,而能耗僅為上一代的10倍。


黃仁勛極力描繪著生成式AI時代的一幅藍圖,展示了英偉達如何從Blackwell芯片等一系列先進技術和產(chǎn)品的組合,壘起層層疊疊的機架、集群,最終形成由32000張GPU組成的AI工廠。


03.

一座AI工廠到底如何掀起新產(chǎn)業(yè)革命?


這次演講,黃仁勛宣布推出推理模型微服務NIM,能將企業(yè)部署生成式AI應用的時間從幾天壓縮到幾分鐘,


這個微服務可以用于研究、開發(fā)和測試。


圖片

圖片


該服務提供了一種簡單、標準化的方式,通過經(jīng)優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。


現(xiàn)在,全球2800萬開發(fā)者可下載NIM,從而輕松構建Copilot、聊天機器人等生成式AI應用。


04.

如果你有聽黃仁勛在今年GTC上演講內(nèi)容,會發(fā)現(xiàn)具身智能占到居多篇幅。


黃仁勛堅信下一波AI浪潮是物理AI,機器人時代已經(jīng)到來,所有移動的物體都將實現(xiàn)自動化。


英偉達這次發(fā)布了Isaac機器人平臺。


黃仁勛表示,我們正在努力通過推進英偉達機器人堆棧來加速生成物理 AI,包括用于模擬應用的Omniverse、Project GR00T人形基礎模型和 Jetson Thor機器人計算機。


圖片


目前,Isaac 生態(tài)系統(tǒng)迅速擴張,包括西門子、比亞迪、Gideon、idealworks和RGo Robotics等都在與英偉達展開合作。


其他一系列新產(chǎn)品服務的落地情況,還有為專為AI打造的新型以太網(wǎng)Spectrum-X等。


一年前,黃仁勛曾在臺大畢業(yè)典禮上提出了一個這樣的問題:


2023年畢業(yè)的同學們,你們即將進入一個經(jīng)歷巨大變革的世界,就像我畢業(yè)時遇到個人電腦和芯片革命時一樣,你們正處于AI的起跑線上。每個行業(yè)都將被革命、重生,為新思想做好準備——你們的思想。在40年的時間里,我們創(chuàng)造了個人電腦、網(wǎng)路、移動設備、云端技術?,F(xiàn)在的AI時代,你們將創(chuàng)造什么?


彼時英偉達的市值超過了1萬億美元,這一時刻與生成式AI爆發(fā)對GPU需求增長的節(jié)點吻合。


05.

一年過后的現(xiàn)在,英偉達市值超過2.7萬億美元,成為直逼蘋果挑戰(zhàn)全球第二大市值地位的公司。


根據(jù)Google財經(jīng)的數(shù)據(jù),截止目前,蘋果的市值為2.95萬億美元,而英偉達的市值為2.7萬億美元。參考路透社的解釋認為,英偉達仍受益于人工智能熱潮,但蘋果目前正苦于IPhone需求疲軟和中國市場的激烈競爭。


今年,英偉達市值已從1萬億美元增長到2萬億美元,一舉超越亞馬遜、谷歌和沙特的石油公司。


這不禁讓智駕網(wǎng)想到此前在社交平臺上看到的一幕——


一位國外網(wǎng)友在社交平臺評論稱:“一百年后,人們會記得蘋果還是英偉達?”


另一位網(wǎng)友模仿老黃的口吻回答:“the future is generative AI!”

x

收藏 1
打賞
相關標簽:
電話:010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽區(qū)朝外大街乙6號朝外SOHO D座5097室
北京智駕時代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權所有 AutoR智駕 智能汽車網(wǎng)
京ICP備14027737號-1      京公網(wǎng)安備 11010502038466號
電信與信息服務業(yè)務經(jīng)營許可證:京B-20211307
關注官方微信