ICC訊 如果把全球AI產(chǎn)業(yè)比作一片超級(jí)雨林,這里物種豐富、生態(tài)完備——海外巨頭憑借數(shù)十年積累,構(gòu)建了從算力架構(gòu)到開發(fā)工具的閉環(huán)體系,成為雨林規(guī)則的制定者。而當(dāng)國產(chǎn)大模型團(tuán)隊(duì)帶著算法創(chuàng)新與場景需求沖進(jìn)這片“雨林”時(shí),卻陷入了一場尷尬的困境。算力、框架、工具鏈依賴外部供給,規(guī)則與技術(shù)標(biāo)準(zhǔn)由他人主導(dǎo),硬件底座與框架支撐的自主話語權(quán)也嚴(yán)重缺失。
或許,真正的破局之路從來不是“當(dāng)更好的客人”,而是帶著我們自己培育的“熱帶雨林”去全球AI賽道會(huì)師。
2月10日,由光合組織牽頭的“國產(chǎn)萬卡算力賦能大模型發(fā)展研討會(huì)暨聯(lián)合攻關(guān)啟動(dòng)儀式”正式啟幕——全國最大單體國產(chǎn)AI算力池的落地,不僅標(biāo)志著國產(chǎn)AI算力規(guī)模的里程碑式突破,更宣告中國AI產(chǎn)業(yè)從“單點(diǎn)突圍”邁入“生態(tài)協(xié)同”的關(guān)鍵階段。會(huì)上,光合組織攜手模型廠商、模型加速廠商及重點(diǎn)行業(yè)用戶,共同啟動(dòng)“國產(chǎn)大算力+國產(chǎn)大模型聯(lián)合攻關(guān)專項(xiàng)計(jì)劃”并向?qū)m?xiàng)企業(yè)授牌。
當(dāng)海外巨頭以垂直閉環(huán)體系主導(dǎo)行業(yè)規(guī)則時(shí),中國 AI 產(chǎn)業(yè)正依托光合組織這類生態(tài)協(xié)同平臺(tái),聚集中科曙光等龍頭企業(yè),用開放架構(gòu)打造共建共生的產(chǎn)業(yè)生態(tài),讓創(chuàng)新力量在兼容共生的土壤中自然生長。
01三套萬卡超集群,最大單體國產(chǎn)AI算力池啟用
自主生態(tài)的根基,永遠(yuǎn)是硬核的算力支撐。對(duì)于AI產(chǎn)業(yè)而言,算力就如同農(nóng)業(yè)時(shí)代的耕地、工業(yè)時(shí)代的能源,是所有創(chuàng)新的前提與基礎(chǔ);而超算互聯(lián)網(wǎng)作為“一體化的算力調(diào)度網(wǎng)絡(luò)、算力領(lǐng)域的生態(tài)協(xié)作網(wǎng)絡(luò)”,則是連接算力服務(wù)供給與產(chǎn)業(yè)需求的關(guān)鍵——二者共同構(gòu)成了國產(chǎn)AI生態(tài)的“雙引擎”。
中國信通院人工智能研究所軟硬件與創(chuàng)新生態(tài)部主任李論表示,大模型時(shí)代,模型原始創(chuàng)新與底層軟硬件高度耦合,底層設(shè)施的重要性愈發(fā)凸顯。智算已從“堆數(shù)量”轉(zhuǎn)向“以應(yīng)用為導(dǎo)向的精細(xì)化發(fā)展”,未來將走向行業(yè)細(xì)分化、信推一體化。
國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)的三萬卡算力池正是這一轉(zhuǎn)型的典型實(shí)踐。2月5日,國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)在鄭州正式上線試運(yùn)行,節(jié)點(diǎn)部署三套高效耦合的曙光scaleX萬卡超集群系統(tǒng)。該系統(tǒng)是中科曙光面向萬億參數(shù)大模型、科學(xué)智能等復(fù)雜任務(wù)場景,打造的大規(guī)模智能算力基礎(chǔ)設(shè)施解決方案。值得注意的是,2025年12月,曙光scaleX萬卡集群在光合組織HAIC大會(huì)完成首次真機(jī)展示;時(shí)隔不到兩個(gè)月,該系統(tǒng)便實(shí)現(xiàn)三萬卡規(guī)模的工程化落地與運(yùn)行。
國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)運(yùn)維主任安磊表示,核心節(jié)點(diǎn)已完成數(shù)百個(gè)應(yīng)用的深度適配,覆蓋23個(gè)行業(yè)領(lǐng)域,形成了多元化的應(yīng)用落地格局。在應(yīng)用規(guī)模層級(jí)上,平臺(tái)實(shí)現(xiàn)了全棧覆蓋:近百個(gè)應(yīng)用通過千卡級(jí)測試,數(shù)十個(gè)應(yīng)用完成萬卡級(jí)測試,還儲(chǔ)備了5個(gè)具備戈登貝兒獎(jiǎng)潛力的重大高端應(yīng)用,實(shí)現(xiàn)了從中小規(guī)模到超大規(guī)模計(jì)算任務(wù)的全場景支撐。國家超算互聯(lián)網(wǎng)的生態(tài)賦能,進(jìn)一步拓寬了這些應(yīng)用的落地場景。目前,超算互聯(lián)網(wǎng)應(yīng)用商城已吸引600多家服務(wù)商入駐,發(fā)布7200多款算力服務(wù)商品,累計(jì)完成近20萬次服務(wù)交付,逐步構(gòu)建起類“京東、淘寶”平臺(tái)模式的算力供需對(duì)接生態(tài)。同時(shí),超算互聯(lián)網(wǎng)AI社區(qū)已上線、適配近1100個(gè)開源大模型和240多個(gè)智能體應(yīng)用,為各行業(yè)開發(fā)者提供了豐富的技術(shù)資源與支撐,吸引超32000位開發(fā)者。截至2026年2月,超算互聯(lián)網(wǎng)平臺(tái)已接入包括核心節(jié)點(diǎn)在內(nèi)的30+計(jì)算中心下,整合形成400萬核心與25萬加速卡的全國最大異構(gòu)算力資源池,用戶規(guī)模超110萬,日均處理與調(diào)度作業(yè)超25萬,單日作業(yè)峰值突破110萬;自超算互聯(lián)網(wǎng)成立以來,累計(jì)完成作業(yè)數(shù)超2億條,平臺(tái)月均訪問量突破1100萬次。
當(dāng)前業(yè)內(nèi)也有不少企業(yè)推出了萬卡集群概念或方案。曙光萬卡集群與其他萬卡集群方案的核心差異,在于開放架構(gòu)與包容生態(tài)。曙光聚焦算力底座,其萬卡集群可兼容多款主流國產(chǎn)AI芯片,支持異構(gòu)算力混合部署與統(tǒng)一調(diào)度,相較以多數(shù)以單一芯片為核心構(gòu)建萬卡集群的方案,這種跨品牌兼容的模式賦予萬卡集群部署落地和未來擴(kuò)展更高彈性。曙光依托高密度設(shè)計(jì)、高速無損互聯(lián)與液冷技術(shù),具備大規(guī)模擴(kuò)展與高效運(yùn)行能力,更適配多元算力需求場景。
豐富的應(yīng)用場景,都建立在全國產(chǎn)化的硬件基礎(chǔ)之上。三萬卡算力的落地,不僅是此次研討會(huì)最核心的亮點(diǎn),更是國產(chǎn)算力生態(tài)從“能用”走向“好用、規(guī)?;谩钡年P(guān)鍵一躍。
02三重關(guān)隘,擋在萬卡落地前
在通往大規(guī)模智能化的征途上,國產(chǎn)算力生態(tài)并非一帆風(fēng)順。在萬卡級(jí)算力落地成為現(xiàn)實(shí)之前,產(chǎn)業(yè)界普遍面臨著三重亟待攻克的系統(tǒng)性關(guān)隘,它們相互交織,構(gòu)成了制約創(chuàng)新的系統(tǒng)性瓶頸。
第一個(gè)痛點(diǎn),技術(shù)面的層層壁壘。業(yè)內(nèi)人士向半導(dǎo)體產(chǎn)業(yè)縱橫表示,“大模型,尤其是萬億參數(shù)級(jí)別的訓(xùn)練與推理,是一項(xiàng)對(duì)底層軟硬件協(xié)同要求極高的系統(tǒng)工程。長期以來,國產(chǎn)AI芯片與主流AI框架、復(fù)雜模型之間,存在著一道深深的‘適配鴻溝’。這并非單純是芯片算力指標(biāo)的問題,更在于整個(gè)軟件棧的成熟度。國際巨頭憑借其長達(dá)十?dāng)?shù)年的迭代,構(gòu)建了從芯片指令集、驅(qū)動(dòng)程序、編譯器到高度優(yōu)化的算子庫(如CUDA)的完整垂直生態(tài),為開發(fā)者提供了相對(duì)統(tǒng)一且穩(wěn)定的開發(fā)環(huán)境。”
反觀國產(chǎn)生態(tài),該人士進(jìn)一步補(bǔ)充:“芯片廠商眾多,架構(gòu)各異,其配套的算子庫往往聚焦于特定場景或常用算子,對(duì)于千億、萬億參數(shù)模型訓(xùn)練所需的復(fù)雜、定制化算子支持不足。這導(dǎo)致科研機(jī)構(gòu)或企業(yè)在將成熟模型遷移至國產(chǎn)平臺(tái)時(shí),常常面臨‘功能缺失’、‘精度損失’或‘性能驟降’的困境,更進(jìn)一步的形成‘硬件發(fā)布-缺乏應(yīng)用-無法迭代’的負(fù)向循環(huán)?!?
第二個(gè)痛點(diǎn),產(chǎn)業(yè)鏈“孤島化”。技術(shù)壁壘的背后,是更深層次的產(chǎn)業(yè)協(xié)同困境。業(yè)內(nèi)人士向半導(dǎo)體產(chǎn)業(yè)縱橫表示,過去幾年國產(chǎn)AI算力產(chǎn)業(yè)鏈的“孤島化”現(xiàn)象十分突出:“芯片設(shè)計(jì)公司專注于提升單卡性能,服務(wù)器廠商致力于硬件集成,軟件框架團(tuán)隊(duì)優(yōu)化算法效率,而最終用戶則疲于在不同技術(shù)路線間進(jìn)行選擇和整合。各方之間缺乏統(tǒng)一的技術(shù)接口、互聯(lián)標(biāo)準(zhǔn)和性能評(píng)測體系?!边@種“煙囪式”的發(fā)展模式,導(dǎo)致大量重復(fù)性適配工作,資源嚴(yán)重內(nèi)耗,整體生態(tài)效能不僅遠(yuǎn)低于“1+1+1”的簡單疊加,甚至呈現(xiàn)出“1+1+1<3”的尷尬局面。標(biāo)準(zhǔn)割裂成為阻礙產(chǎn)業(yè)形成合力的關(guān)鍵枷鎖。
第三個(gè)痛點(diǎn),高端算力的缺位。萬億參數(shù)規(guī)模大模型訓(xùn)練、千億級(jí)數(shù)據(jù)實(shí)時(shí)推理等前沿技術(shù)探索,對(duì)算力集群的并行處理能力、高速互連效率、持續(xù)穩(wěn)定運(yùn)行提出嚴(yán)苛要求,必須依托萬卡級(jí)及以上高端算力集群作為基礎(chǔ)支撐。但在此前的產(chǎn)業(yè)發(fā)展階段,國產(chǎn)算力基礎(chǔ)設(shè)施普遍停留在千卡級(jí)部署規(guī)模,高端算力供給形成明顯斷層,使得許多前沿研究機(jī)構(gòu)和頭部企業(yè),在源頭創(chuàng)新上便受到制約?!案叨怂懔Φ娜蔽?,讓國產(chǎn)AI在源頭創(chuàng)新階段就陷入被動(dòng)?!痹摌I(yè)內(nèi)人士向半導(dǎo)體產(chǎn)業(yè)縱橫表示,“缺少自主的萬卡級(jí)算力支撐,國內(nèi)科研團(tuán)隊(duì)在開展超大模型訓(xùn)練、前沿算法驗(yàn)證時(shí),往往受限于算力規(guī)模,無法進(jìn)行全周期、高強(qiáng)度的迭代試驗(yàn),創(chuàng)新節(jié)奏與技術(shù)深度均受到直接影響?!?
03從技術(shù)突破,到生態(tài)共生
破解上述三重困境,從來不是單一企業(yè)的“單點(diǎn)突圍”,而是需要以開放架構(gòu)為紐帶、以系統(tǒng)攻關(guān)為路徑的生態(tài)協(xié)同 —— 這正是光合組織自 2025 年 9 月提出開放架構(gòu)理念、成立 AI 計(jì)算開放架構(gòu)聯(lián)合實(shí)驗(yàn)室的核心初衷,而曙光 scaleX 萬卡超集群的規(guī)?;涞?,正是這場生態(tài)重構(gòu)的關(guān)鍵實(shí)踐。
在技術(shù)架構(gòu)層面,面對(duì)高端算力缺位與性能損耗的痛點(diǎn),曙光scaleX萬卡超集群創(chuàng)新實(shí)現(xiàn)“算、存、網(wǎng)、電、冷、管、軟”一體化緊耦合設(shè)計(jì),搭載自主研發(fā)的原生RDMA高速網(wǎng)絡(luò),相較傳統(tǒng)IB網(wǎng)絡(luò)性能直接提升2.33倍,同時(shí)將網(wǎng)絡(luò)建設(shè)成本降低30%,實(shí)現(xiàn)“高性能與低成本”的雙重突破;通過存儲(chǔ)、計(jì)算、傳輸全鏈路深度協(xié)同優(yōu)化,AI加速卡資源利用率大幅提升55%。
在生態(tài)兼容層面,針對(duì)技術(shù)壁壘與產(chǎn)業(yè)鏈“孤島化”困境,曙光以開放架構(gòu)重構(gòu)產(chǎn)業(yè)協(xié)同邏輯。作為國內(nèi)首個(gè)AI計(jì)算開放架構(gòu)的牽頭者,曙光scaleX萬卡超集群全面兼容CUDA等主流軟件生態(tài),讓開發(fā)者無需大幅重構(gòu)代碼即可完成模型遷移,顯著降低開發(fā)門檻;通過“軟硬解耦+統(tǒng)一算子庫+中間件適配”的創(chuàng)新方案,化解不同國產(chǎn)芯片的“適配鴻溝”,打破“硬件發(fā)布-缺應(yīng)用-難迭代”的負(fù)向循環(huán),讓多元芯片都能快速接入生態(tài)、發(fā)揮價(jià)值。
如果說開放架構(gòu)的兼容性為生態(tài)奠定了技術(shù)底座,產(chǎn)業(yè)協(xié)同網(wǎng)絡(luò)為創(chuàng)新鋪就了連接路徑,那么這兩者共同積蓄的勢能,最終必然指向?qū)?qiáng)大、自主的高端算力的迫切需求。而破解高端算力斷層痛點(diǎn),關(guān)鍵在于打造共建共生的萬卡級(jí)及以上高端算力集群,掌握高端算力的定義權(quán)與供給權(quán)。
在高端算力落地層面,國產(chǎn)布局萬卡級(jí)集群的核心邏輯,并非簡單追求數(shù)量優(yōu)勢,而是基于中國產(chǎn)業(yè)特色與算力需求痛點(diǎn),走出的一條差異化創(chuàng)新路徑,為滿足中國市場“大規(guī)模、普惠化、高彈性”的算力剛需而生。此次全球最大單體算力池的落地,便是最好的詮釋。其不僅實(shí)現(xiàn)了高端算力的國產(chǎn)化,更通過開放生態(tài)讓更多企業(yè)能低成本使用。而算力使用過程中產(chǎn)生的場景反饋,又能反向推動(dòng)國產(chǎn)核心硬件的技術(shù)迭代,形成“算力供給-場景應(yīng)用-技術(shù)優(yōu)化”的正向循環(huán),讓國產(chǎn)高端算力不斷向價(jià)值鏈高端躍升。
04三萬卡的落地,只是序章
雨林不會(huì)一夜長成。但當(dāng)?shù)谝黄~子開始進(jìn)行光合作用,整片森林就有了可能。
中國AI產(chǎn)業(yè)的自主化之路,注定不是對(duì)現(xiàn)有巨頭的簡單模仿與替代,而是一場關(guān)于產(chǎn)業(yè)組織范式、技術(shù)發(fā)展和生態(tài)建設(shè)邏輯的深刻探索。以曙光scaleX萬卡超集群和國家超算互聯(lián)網(wǎng)為代表的全國一體化算力網(wǎng)實(shí)踐,正在描繪一條以開放架構(gòu)打破壁壘、以系統(tǒng)協(xié)同凝聚合力、以場景驅(qū)動(dòng)加速迭代的特色路徑。
這場征程的目標(biāo),不是建造一個(gè)整齊劃一、僅供觀賞的精致花園,而是開墾一片肥沃、開放、遵循自然法則的“產(chǎn)業(yè)雨林”。
三萬卡算力的落地,是這片科技雨林破土新生的開篇之章。它預(yù)示著,在中國自主的科技土壤上,一場基于多元共生、開放協(xié)同的AI生態(tài)演進(jìn),已然按下加速鍵。未來,這片雨林能長多高、能有多茂盛,取決于無數(shù)參與者的智慧、耐心與協(xié)作。但唯一可以確定的是,只有根植于自主土壤的森林,才能無懼風(fēng)雨,生生不息。