ICC訊 北京時間2026年3月17日凌晨,英偉達CEO黃仁勛在GTC 2026大會上發(fā)表主題演講(Keynote),核心圍繞“AI工廠”與“物理AI”兩大主線,發(fā)布了從底層芯片架構到上層應用生態(tài)的全棧解決方案,將英偉達從“芯片廠商”升級為AI全?;A設施服務商,并表示這將是萬億美元AI基建時代的發(fā)展藍圖。本次演講覆蓋芯片架構、AI基礎設施、軟件生態(tài)、應用落地四大核心板塊。
一、核心芯片架構:三代產品布局,突破算力與延遲邊界
演講中重點發(fā)布/披露了三款核心芯片相關產品,形成“前瞻+當前+專用”的三層布局,全面覆蓋訓練、推理及特種場景需求:
1. Feynman 下一代芯片架構(前瞻發(fā)布)
原定2028年發(fā)布,此次提前兩年曝光技術原型,是全球首款專為“世界模型”(支撐AI理解、預測物理世界)設計的GPU架構,核心面向具身智能、通用人工智能等高端場景。其核心亮點包括:
工藝突破:采用臺積電A16 1.6nm制程,是英偉達首款邁入1nm時代的量產級架構,晶體管密度較前代提升1.1倍,搭載GAA全環(huán)繞柵極晶體管與背面供電技術,同性能功耗降15%,同電壓速度提升8%-10%;
互連革新:首次大規(guī)模采用硅光子光互連技術,帶寬密度提升10倍、傳輸能耗下降90%,打破超大規(guī)模AI集群“互連墻”;同時采用3D堆疊加混合鍵合技術,將LPU語言處理單元與GPU核心堆疊,大幅降低推理延遲;
性能躍升:推理性能較前代Blackwell架構提升5倍,單GPU算力達50 PFLOPS,針對AI任務的能效比是前代3.2倍,計劃2028年正式量產。
2. Rubin 平臺(當前旗艦,2026下半年量產)
作為Blackwell架構的繼任者,定位當前高端AI算力核心,已完成客戶樣品交付,OpenAI、DeepMind等已鎖定訂單。核心參數(shù)包括:采用臺積電3nm EUV工藝,搭載HBM4內存(288GB,帶寬是HBM3e的2.75倍),推理性能是H100的5倍、訓練性能提升3.5倍,單Token成本降低10倍;配套800V HVDC供電,單機柜功耗240-260kW,全液冷為標配。此外,其太空版NVIDIA Space-1 Vera Rubin模塊,在太空推理任務中算力是H100的25倍,支撐軌道數(shù)據(jù)中心等太空AI應用。
3. LPU 推理專用芯片(落地級產品)
專為推理場景優(yōu)化,推出Groq 3 LPX機架,單機柜可搭載256顆LPU芯片,采用純SRAM存算一體設計,無HBM/DRAM,單芯片片上SRAM達230MB,帶寬80TB/s,首Token延遲<0.1秒,推理性能是H100的10倍,OpenAI為首批大客戶,將于2026下半年上市。
二、AI基礎設施:定義“AI工廠”,升級全鏈路算力底座
黃仁勛提出“人工智能工廠”概念,核心是將AI基礎設施從“單GPU采購”升級為“整柜部署”,聚焦大規(guī)模智能生產(Token生產),構建從能源到應用的五層AI框架(能源→芯片→基礎設施→模型→應用),核心升級包括:
機柜與冷卻:推出NVL72/NVL576液冷機柜,單機柜算力較前代提升4倍、功耗提升5倍,全液冷成為高密度算力標配,適配LPU/Rubin機柜的高功耗需求;
硬件配套:采用52層超高精密PCB,升級為M10材料、Q玻璃低介電設計,單機柜PCB價值量大幅提升,解決高密度算力的硬件支撐難題;
互連升級:推出NVLink-CXL 6.0互聯(lián)技術,跨節(jié)點數(shù)據(jù)傳輸帶寬突破1.2TB/s,同時發(fā)布Quantum3400 CPO交換機,采用CPO/NPO共封裝光學技術,解決集群帶寬瓶頸。
黃仁勛展示最新CPO
CPO(Co-Packaged Optics,共封裝光學)是當前光通信領域的核心革新技術,其行業(yè)背景源于AI算力的爆發(fā)式增長——隨著Rubin、LPU等高性能芯片規(guī)?;瘧茫笠?guī)模AI集群的數(shù)據(jù)傳輸需求激增,傳統(tǒng)可插拔光模塊在功耗、帶寬密度上逐漸觸及“物理天花板”,無法匹配兆瓦級“AI工廠”的互連需求,CPO技術應運而生并成為突破瓶頸的關鍵選擇。
從技術定義來看,CPO并非簡單的技術改良,而是一場架構革命,核心是將光引擎(PIC/EIC)與交換ASIC芯片通過先進封裝技術集成于同一基板,實現(xiàn)百微米級的光電互連,相當于將原本“異地辦公”的光模塊與交換芯片改為“同桌協(xié)作”,大幅縮短電信號傳輸距離,降低信號損耗與能耗。
本次發(fā)布的Quantum3400 CPO交換機,延續(xù)英偉達CPO技術“雙代遞進”策略,采用深度共封裝形態(tài),將電信號傳輸距離從傳統(tǒng)方案的厘米級縮短至1毫米以內,傳輸損耗降低60%,較傳統(tǒng)可插拔方案能耗降低30%,系統(tǒng)帶寬可支撐超大規(guī)模AI集群的高效互連,同時適配全液冷機柜的散熱需求,與NVLink-CXL 6.0互聯(lián)技術形成協(xié)同,進一步鞏固英偉達在AI互連領域的優(yōu)勢地位,也契合2026年CPO規(guī)模化落地的行業(yè)趨勢——目前Broadcom、Intel等巨頭均在加速推進CPO技術迭代,推動產業(yè)鏈價值向上游硅光芯片、先進封裝等領域遷移,而英偉達的布局的核心是將CPO與自身AI全棧生態(tài)深度綁定,解決“AI工廠”的互連瓶頸,助力Token生產成本進一步降低。
黃仁勛強調,AI基礎設施的核心瓶頸已從單GPU算力轉向兆瓦級“AI工廠”的整體能力,Token作為AI時代的經濟單位,其成本將成為行業(yè)核心競爭力,而英偉達憑借全棧布局實現(xiàn)全球最低Token成本。
三、軟件與生態(tài):開源破局,構建全生命周期AI生態(tài)
本次演講重點推出軟件生態(tài)與開源布局,打破硬件綁定,降低AI落地門檻,同時鞏固CUDA生態(tài)壁壘:
1. NemoClaw 開源AI智能體平臺
填補OpenClaw被收購后的市場空白,定位企業(yè)級開源AI智能體解決方案,核心優(yōu)勢體現(xiàn)在三點:
硬件中立:無需依賴英偉達GPU,全面兼容AMD、Intel芯片及企業(yè)自研芯片、純CPU環(huán)境,適配各類云環(huán)境與邊緣設備,企業(yè)無需更換硬件即可低成本部署;
企業(yè)級安全:內置行為審計、權限隔離、智能熔斷三層防護,0.3秒內可觸發(fā)風險緊急停止,滿足金融、醫(yī)療等合規(guī)行業(yè)需求,實現(xiàn)智能體操作全程可追溯、可管控;
全生命周期覆蓋:依托NeMo生態(tài),支持零代碼拖拽編排、多智能體協(xié)同,兼容多模態(tài)數(shù)據(jù)與主流大模型,預置HR、財務等垂直場景模板,可對接Salesforce、思科等企業(yè)軟件,實現(xiàn)“查詢-分析-執(zhí)行-反饋”業(yè)務閉環(huán),安裝僅需兩行命令,開箱即用。
2. CUDA 20周年與數(shù)據(jù)處理軟件升級
黃仁勛用近十分鐘回溯CUDA架構20年演進,將其定義為英偉達業(yè)務的核心壁壘——通過“安裝基數(shù)→開發(fā)者→算法突破→新市場→擴大安裝基數(shù)”的飛輪效應,構建了覆蓋數(shù)千種工具、數(shù)十萬個開源項目的龐大生態(tài),支撐數(shù)億塊GPU的全球部署,實現(xiàn)算力成本持續(xù)下降,六年前出貨的Ampere架構仍在云上保持價格上漲。
同時發(fā)布兩大核心數(shù)據(jù)處理軟件庫:cuDF用于加速結構化數(shù)據(jù)(DataFrame)計算,cuVS用于處理非結構化數(shù)據(jù)(向量、PDF、視頻等),助力AI將90%的非結構化數(shù)據(jù)轉化為可計算資源,目前已與IBM等企業(yè)合作,融入全球數(shù)據(jù)處理生態(tài)。
3. 其他生態(tài)亮點
舉辦開源圓桌論壇,邀請Perplexity、Mira Murati等行業(yè)大咖,探討開源大模型未來與“開放vs封閉”的行業(yè)趨勢;發(fā)布DLSS 5,作為實時光線追蹤以來圖形領域的重大突破,通過實時神經渲染實現(xiàn)電影級視覺效果,將于2026秋季推出,獲得騰訊、育碧等廠商支持,并計劃拓展至企業(yè)計算領域;同時宣布加速量子+AI融合,目標2028年前推出實用級融合系統(tǒng)。
四、應用落地:聚焦物理AI,推動多行業(yè)規(guī)?;涞?/strong>
本次演講強調AI從“造模型”向“用模型”轉型,聚焦物理AI(具身智能),推動技術在四大核心領域落地,同時釋放萬億美金市場預期:
自動駕駛:推出AlphaMale端到端可解釋AI方案,支撐L4+級自動駕駛量產,實現(xiàn)AI對交通場景的物理規(guī)律理解與實時決策;
機器人:通過Omniverse數(shù)字孿生平臺,為機器人提供端到端物理AI開發(fā)方案,預計2-3年實現(xiàn)大規(guī)模落地,覆蓋工業(yè)自動化、人形機器人等場景;
企業(yè)應用:依托NemoClaw平臺,實現(xiàn)AI智能體在辦公自動化、數(shù)據(jù)分析、業(yè)務流程管控等場景的落地,成為企業(yè)“數(shù)字員工”,降低中小企業(yè)AI應用門檻;
科學計算與太空應用:加速醫(yī)療、能源、氣候、材料科學等領域的計算效率,同時將AI計算拓展至軌道數(shù)據(jù)中心、自主太空作業(yè),實現(xiàn)地面與太空AI應用無縫銜接。
黃仁勛預測,至2027年,英偉達AI芯片(Blackwell與Rubin系列)的收入機會將至少達到1萬億美元,彰顯其對AI基建市場的信心,受此影響,英偉達股價一度拉升4.8%。
五、核心結論與行業(yè)影響
本次GTC 2026 Keynote的核心的是“全棧布局、開源破局、落地為王”:英偉達通過Feynman、Rubin、LPU的三代芯片布局,夯實算力底座;通過NemoClaw開源平臺打破硬件綁定,擴大生態(tài)邊界;通過“AI工廠”概念整合基礎設施,推動AI從技術研發(fā)走向規(guī)?;瘧?,正式完成從“芯片提供商”到“AI全?;A設施服務商”的轉型。
對行業(yè)而言,此次發(fā)布不僅定義了下一代AI算力與智能體的發(fā)展標準,降低了企業(yè)AI應用門檻,也加劇了AI行業(yè)“全棧競爭”的格局;對中國市場而言,黃仁勛提及的合作案例的同時,也暗示算力國產化的時間窗口有限,為國內AI產業(yè)發(fā)展提供了參考與警示。整體來看,本次演講所描述的AI產業(yè)從“參數(shù)競賽”進入“落地競賽”的新階段,英偉達憑借全棧優(yōu)勢,持續(xù)鞏固其在AI領域的主導地位。
新聞來源:訊石光通訊網
相關文章