大模型企業(yè)分化算力成買方市場

沈怡然周悅 2024-10-12 12:54

經(jīng)濟觀察報記者沈怡然周悅 2024年至今，人工智能產(chǎn)業(yè)發(fā)生了階段性轉(zhuǎn)變。

根據(jù)經(jīng)濟觀察報統(tǒng)計，截至2024年10月9日，網(wǎng)信辦共通過188項生成式人工智能備案，也就是有188個大模型可以上線提供生成式人工智能服務(wù)。超過三成的大模型在通過備案后未進一步公開其進展情況；僅有約一成的大模型仍在加速訓(xùn)練模型；接近一半的大模型則轉(zhuǎn)向了AI應(yīng)用的開發(fā)。

這與過去一年多來的“百模大戰(zhàn)”形成鮮明對比。

這一變化也傳導(dǎo)至上游的算力市場。2024年9月27日—29日中國算力大會召開期間，經(jīng)濟觀察報從算力運營方、建設(shè)方和芯片供應(yīng)商處獲悉，國內(nèi)算力的供需關(guān)系已不再緊張。

2022年以來，互聯(lián)網(wǎng)公司、人工智能企業(yè)爭相采購算力設(shè)備，以運營商為代表的央國企投入巨資建設(shè)算力中心。供應(yīng)鏈上的AI服務(wù)器經(jīng)常缺貨，算力GPU一卡難求，數(shù)月內(nèi)價格翻倍。

從2024年開始，采購和租用算力設(shè)備的企業(yè)減少了；2024年下半年以來，算力中心的機架出現(xiàn)了一定程度的空置；曾被炒到15萬元一塊的英偉達(dá)高性能加速卡A100的價格不再上漲，另一款性能配置相對較低的4090顯卡被算力企業(yè)頻繁采購用作算力加速芯片。

一位中國電信人士稱，算力已經(jīng)轉(zhuǎn)入買方市場。

大模型企業(yè)分化

算力的使用者——大模型企業(yè)正出現(xiàn)分化。

截至2024年8月底，網(wǎng)信辦共通過188項生成式人工智能備案。然而，根據(jù)經(jīng)濟觀察報統(tǒng)計，有60個（32%）大模型在備案通過后，沒有再公布過提升大模型參數(shù)量級或應(yīng)用落地的進展，有9個（5%）大模型更新了版本，但未說明參數(shù)量級及預(yù)訓(xùn)練數(shù)據(jù)量變化。

這些模型絕大多數(shù)來自中小型企業(yè)或機構(gòu)，例如深言科技、聆心智能等企業(yè)的多個開源社區(qū)項目近一年沒有更新。

這188個大模型中，仍有22個模型在加速訓(xùn)練，在今年更新了版本并增加參數(shù)量及預(yù)訓(xùn)練數(shù)據(jù)量。

這些模型主要來自大型互聯(lián)網(wǎng)公司、運營商、AI大模型企業(yè)，其中只有4家企業(yè)發(fā)布萬億級參數(shù)的大模型，且大規(guī)模增加了預(yù)訓(xùn)練的數(shù)據(jù)量，包括騰訊、中國電信以及兩家大模型創(chuàng)業(yè)公司MiniMax和階躍星辰。

這些企業(yè)對用于訓(xùn)練大模型的算力明顯增加了需求。2024年以來，騰訊、中國電信已經(jīng)建成萬卡集群算力池，MiniMax則是在3月首批入駐中國電信上海臨港國產(chǎn)萬卡算力池。

另外18個模型的參數(shù)量在百億至千億級別，參數(shù)量和預(yù)訓(xùn)練數(shù)據(jù)量的增加較為有限，這些模型來自百度、阿里巴巴、科大訊飛、商湯科技、華為等企業(yè)。

這些廠商也在加速更新基礎(chǔ)模型。阿里巴巴發(fā)布了通義千問2.5版本，參數(shù)量達(dá)到千億級別，這是繼去年10月2.0版本后的一次重大更新。2024年上半年，商湯科技將“日日新”大模型推進至6000億參數(shù)規(guī)模。相比之下，去年更新較快的百度步伐有所放緩，其文心4.0大模型自去年10月以來未有新版本發(fā)布。

一位百度技術(shù)人士告訴經(jīng)濟觀察報，百度的基礎(chǔ)模型一直在進行最前沿的AI訓(xùn)練，只是目前還沒公布成果，“大廠肯定不會放棄訓(xùn)練模型的，否則就徹底分不到蛋糕了”。

表1：188個已備案大模型在2024年（截至10月9日）的變化情況

微信截圖_20241012124908

數(shù)據(jù)來源：經(jīng)濟觀察報整理

根據(jù)經(jīng)濟觀察報統(tǒng)計，在通過備案的大模型中，有接近50%在今年轉(zhuǎn)向AI應(yīng)用。

大多數(shù)模型已落地到已有應(yīng)用中或推出了新應(yīng)用。例如，360瀏覽器接入360智腦大模型后，增加了AI搜索功能，能夠根據(jù)提問生成深度回答并進行多輪追問；金山辦公在WPS辦公套件中增加了AI生成PPT和文案的功能。

這些模型通常用于實際任務(wù)，即從訓(xùn)練階段進入推理階段，所需算力會明顯減少。

一家大模型廠商的基礎(chǔ)模型在達(dá)到百億參數(shù)量后轉(zhuǎn)向了行業(yè)應(yīng)用，為避免后期使用成本過高就沒有擴充參數(shù)量，因此也不需要過大的算力。

該模型廠商人士認(rèn)為，大模型并非越大越好，更大參數(shù)量意味著使用成本更高，千億、萬億參數(shù)規(guī)模的模型主要是為了刷榜。

IDC中國副總裁兼首席分析師武連峰對經(jīng)濟觀察報稱，“百模大戰(zhàn)”開啟一年多以來，市場出現(xiàn)了分化現(xiàn)象：少數(shù)模型繼續(xù)沿著通用大模型的路徑，邁向千億或萬億參數(shù)量級；另一些從基礎(chǔ)模型研發(fā)轉(zhuǎn)向了應(yīng)用層面的開發(fā)，市場上也涌現(xiàn)出一批基于大模型技術(shù)的工具類應(yīng)用。這些應(yīng)用同質(zhì)化明顯，沒有出現(xiàn)廣泛使用的爆款案例。

根據(jù)第三方數(shù)據(jù)服務(wù)商AI產(chǎn)品榜發(fā)布的9月數(shù)據(jù)，全球排名前十的AI應(yīng)用中有7個來自美國，2個來自中國——百度搜索AI智能回答和360AI搜索。美國AI應(yīng)用ChatGPT的月訪問量為32.3億，百度搜索AI智能回答的月訪問量約為ChatGPT的八分之一，360AI搜索的訪問量不到ChatGPT的十分之一。

算力變成買方市場

大模型市場與算力市場關(guān)聯(lián)密切。按照規(guī)模定律（Scaling law）的原理，如果要訓(xùn)練更大的大模型，首先要增加參數(shù)量或預(yù)訓(xùn)練數(shù)據(jù)量，如果模型的參數(shù)量增加10倍，所需算力可能增加100倍甚至更多。

當(dāng)前，一些大模型停留在了訓(xùn)練階段，另一些轉(zhuǎn)向了應(yīng)用和實際交付階段，但尚未被廣泛使用。從需求方看，相關(guān)企業(yè)對訓(xùn)練算力的需求明顯減少，對推理算力的需求也沒有出現(xiàn)爆發(fā)式增長，而從供給方看，中國已建和正在建設(shè)的智算中心超250個，算力持續(xù)供給仍未停止。

建造一座算力設(shè)施通常需要投資方、運營方、建設(shè)方的合作。投資方主要是地方政府和央國企；運營方包括電信運營商以及互聯(lián)網(wǎng)公司、華為等企業(yè)，還有少數(shù)房地產(chǎn)等傳統(tǒng)企業(yè)跨界參與；建設(shè)方通常包含服務(wù)器提供商和GPU芯片提供商。

超聚變是一家提供服務(wù)器和算力服務(wù)的供應(yīng)商，客戶主要是金融、互聯(lián)網(wǎng)、電力企業(yè)。這家公司在最近幾個月感受到了行情轉(zhuǎn)變，去年的互聯(lián)網(wǎng)廠商都來搶服務(wù)器，買家需求非常急迫，確認(rèn)有貨就能下單，談價過程很快，有時甚至不用談價。2024年以來，前來采購的客戶變少，詢價和談判時間更長，買方更注重產(chǎn)品的性價比和技術(shù)規(guī)格。

此外，智算中心也出現(xiàn)了一定程度的空置。中國電信在全國各地投產(chǎn)了10個智算中心。前述中國電信人士發(fā)現(xiàn)，很多算力中心都沒有被充分利用，很多機架是空置的。

根據(jù)中國信息通信研究院數(shù)據(jù)，中國算力設(shè)施中的機架數(shù)量在2024年上半年僅增長2.5%，而2023年全年增長了25%。算力設(shè)施中的機架數(shù)量間接反映了實際的算力規(guī)模。

今年的《政府工作報告》提出，適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施，加快形成全國一體化算力體系，培育算力產(chǎn)業(yè)生態(tài)。諸多地區(qū)當(dāng)下的算力建設(shè)規(guī)模是根據(jù)未來2—3年的算力需求來規(guī)劃的，在模型計算尚未爆發(fā)的階段，必然出現(xiàn)利用率不足的情況。

前述中國電信人士對經(jīng)濟觀察報稱，現(xiàn)在的算力已經(jīng)是買方市場，用戶有更多算力價格的議價權(quán)。投資方的態(tài)度也更為謹(jǐn)慎和理性，開始對運營方提出相應(yīng)的回報要求與考核。運營方一方面轉(zhuǎn)向采購性價比更高的算力設(shè)備，另一方面，正采用更靈活的策略，比如按需建設(shè)算力，在產(chǎn)能規(guī)劃上布置了上千臺機架，接到明確的用戶需求和訂單才會真正采購算力設(shè)備并上架運行。“作為運營方，我們已經(jīng)不能像原來一樣不計成本地投入，要想盡快回收成本，必須考慮成本投入和投資回報周期。”該中國電信人士稱。

產(chǎn)業(yè)對算力芯片的采購也更注重性價比。2024年以來，國內(nèi)對英偉達(dá)4090顯卡的需求正在上升，目前，這款頂級游戲顯卡的價格從年初的12000元漲至18000元。

一位英偉達(dá)代理商告訴經(jīng)濟觀察報，下半年以來，4090顯卡的周轉(zhuǎn)率非常高，到貨3天就賣出去了。相比之下，A100的單價不再上漲，維持在15萬元不變，周轉(zhuǎn)率卻在下降。

4090和A100都屬于GPU芯片，在英偉達(dá)產(chǎn)品線中，4090是一款面向玩家的高端游戲顯卡，A100則是賣給算力中心的高性能加速卡。4090在部分性能上弱于A100，但也能滿足一部分模型的推理任務(wù)，最重要的是，其價格是A系列和H系列加速卡的十分之一。

這一波4090顯卡的買家絕大多數(shù)是企業(yè)，大多是智算中心的建設(shè)方或者技術(shù)提供方，用平價顯卡替代高價的A100或H100芯片。

商湯科技正推動大模型進入端側(cè)、交付客戶。但在模型進入商業(yè)閉環(huán)階段，這家企業(yè)對算力的需求也在變化，包括采用智能算力調(diào)度等技術(shù)來提升算力效能。商湯科技智能產(chǎn)業(yè)研究院院長田豐稱，過去公司不計成本地采購算力，如今更追求算力的性價比。

（本報記者錢玉娟、任曉寧對本文亦有貢獻(xiàn)）

版權(quán)聲明：以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品，版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電：【010-60910566-1260】。