來源:數(shù)智前線 作者:周享玥 11月底,北京召開的一場以“智算力就是創(chuàng)新力”為主題的人工智能計(jì)算大會(huì)上,擠滿了來自各行各業(yè)的數(shù)千位參會(huì)者。 在算力緊缺問題依舊未解的當(dāng)下,大家關(guān)心的問題,普遍圍繞大模型最新創(chuàng)新和落地成果,以及由其帶來的算力、AI infra(AI軟件基礎(chǔ)設(shè)施)等方面的創(chuàng)新和變化。 業(yè)界人士觀察,今年很可能會(huì)是從移動(dòng)互聯(lián)網(wǎng)時(shí)代邁向智能時(shí)代的關(guān)鍵一年。過去從互聯(lián)網(wǎng)轉(zhuǎn)向移動(dòng)互聯(lián)網(wǎng),大家一開始在手機(jī)上使用網(wǎng)頁,后來iPhone開創(chuàng)了手機(jī)APP進(jìn)行交互。而在智能時(shí)代,未來很可能不再是點(diǎn)開APP,而是直接彈出一個(gè)個(gè)AI Agent(人工智能代理),去實(shí)現(xiàn)交流互動(dòng)。 “我們現(xiàn)在就在所謂智能時(shí)代的iPhone時(shí)刻前期,智能的iPhone時(shí)刻隨時(shí)可能發(fā)生。”IDC中國副總裁周震剛做了一個(gè)比喻。 在這種背景下,國際數(shù)據(jù)公司(IDC)與浪潮信息在大會(huì)現(xiàn)場聯(lián)合發(fā)布的《2023-2024年中國人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》(以下簡稱報(bào)告)也受到不少關(guān)注。 01 大模型輻射面遠(yuǎn)比想象要豐富 中國企業(yè)對(duì)生成式AI的接受程度,可能已超出你的想象。比如在一些想象不到的行業(yè)和領(lǐng)域已經(jīng)開始投入大模型。 近期,手機(jī)公司在大模型上動(dòng)作頻頻,包括小米、vivo、OPPO、三星等在短短一個(gè)月內(nèi),接連亮出了10個(gè)以上的AI大模型,參數(shù)規(guī)模從十億級(jí)、百億級(jí)到1300億不等。但你可能很難想象,手機(jī)背后的芯片公司,也在嘗試引入大模型。 比如上海的一家手機(jī)芯片上市公司,嘗試?yán)么竽P徒鉀Q傳統(tǒng)客服問答系統(tǒng)智能程度不高的問題。過去,因?yàn)樾酒贩N有上千種,且涉及大量技術(shù)專有名詞、參數(shù)信息,技術(shù)服務(wù)團(tuán)隊(duì)在本職工作外,需要投入大量時(shí)間幫助確認(rèn)細(xì)節(jié)。而現(xiàn)在,他們通過大模型的語義理解和判斷推理能力,解放一線技術(shù)工程師,實(shí)現(xiàn)降本提效。 生物醫(yī)療領(lǐng)域同樣是對(duì)大模型探索較多的行業(yè),有數(shù)據(jù)顯示,今年以來,國內(nèi)已發(fā)布近50款醫(yī)療大模型。醫(yī)學(xué)科研、藥物研發(fā)、智慧診療、醫(yī)院管理等都是被探索的方向。但你可能很難想象,國內(nèi)一些花卉研究所,正基于大模型打造花卉AI育種大模型。 汽車界對(duì)大模型的探索也不少,包括吉利、奇瑞、紅旗、智己等多家車企都曾宣布接入大模型產(chǎn)品,大家都在爭奪誰能首先在智能座艙、自動(dòng)駕駛等場景實(shí)現(xiàn)大模型落地。就連摩托車公司也不甘寂寞。比如成立于1993年的國內(nèi)摩托車龍頭企業(yè)——隆鑫通用,正在利用大模型的能力,打造面向消費(fèi)者的“AI騎行助理”,并試圖探索大模型在摩托車發(fā)動(dòng)機(jī)的生產(chǎn)質(zhì)量管控、全地形車的智能化改造等方面的應(yīng)用。 IDC和浪潮信息發(fā)布的《報(bào)告》,也從數(shù)據(jù)層面印證了這一點(diǎn)——67%的中國企業(yè)已經(jīng)開始探索生成式AI在企業(yè)內(nèi)的應(yīng)用機(jī)會(huì)或進(jìn)行相關(guān)資金投入。 ![]() “中國企業(yè)尤其認(rèn)可生成式AI在加速?zèng)Q策、提高效率、優(yōu)化用戶和員工體驗(yàn)等維度帶來的價(jià)值,并將在未來三年持續(xù)提高投入力度,超過七成企業(yè)增幅達(dá)到20%-40%。”IDC中國副總裁周震剛介紹。 當(dāng)然,在這波大模型建設(shè)熱潮中,擁有更多的先發(fā)優(yōu)勢和投入動(dòng)力的,還是原先就在AI上積累更深、AI滲透度更高的行業(yè)。 可以看到,在2023年人工智能行業(yè)滲透度排名中,Top5的行業(yè)依次為互聯(lián)網(wǎng)、電信、政府、金融和制造。交通、服務(wù)、教育等行業(yè)在人工智能領(lǐng)域的投資力度也可圈可點(diǎn),分別位列第六至八名。 ![]() 其中,高居首位的互聯(lián)網(wǎng)行業(yè),在最新的生成式AI熱潮中,依然是大模型和AIGC技術(shù)應(yīng)用和研發(fā)的主戰(zhàn)場。李彥宏一度表示,百度要用大模型把全部產(chǎn)品重新做一遍,且“不是整合,也不是接入,是重做和重構(gòu)。” 而滲透度排行榜上最大的“黑馬”——電信行業(yè),反超政府和金融,躍升至第二名。在最近一兩個(gè)月,電信業(yè)加快了在大模型上的進(jìn)程,三大運(yùn)營商也都亮出各自“最新的基礎(chǔ)大模型+多個(gè)行業(yè)大模型”。 至于“財(cái)大氣粗”且一向?qū)夹g(shù)有著較高追求的金融行業(yè),更是從今年初ChatGPT一火起來,就對(duì)大模型技術(shù)進(jìn)行投入。 這一火爆,直接帶來智能算力的“暴增”。IDC的數(shù)據(jù)顯示,2023年,中國通用算力規(guī)模預(yù)計(jì)達(dá)到59.3EFLOPS,同比增長8.8%;智能算力預(yù)計(jì)達(dá)到414.1EFLOPS,同比增長59.3%,6.7倍于通用算力增速。 02 算力新挑戰(zhàn) 大模型時(shí)代,“賣鏟人”的生意先紅火起來。 典型如英偉達(dá),因手握大量GPU資源,今年以來,一直在“開掛式”大豐收,不僅年初在資本市場首次突破萬億美元市值,之后更是拿到了雪花般的訂單,收獲了真金白銀。 最新財(cái)報(bào)顯示,8月到10月的單季度內(nèi),英偉達(dá)總共向全球大量的數(shù)據(jù)中心,出售145.1億美元的芯片,遠(yuǎn)高于去年同期的38億美元,也高于市場預(yù)期的127億美元,同比增長324%。 國內(nèi)的“百模大戰(zhàn)”,也為英偉達(dá)帶去不少生意。2024財(cái)年第二財(cái)季財(cái)報(bào)會(huì)上,英偉達(dá)高管曾透露,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入的20%至25%都來自中國市場,已創(chuàng)下歷史新高。 不止是底層芯片廠商,算力產(chǎn)業(yè)鏈上其他各個(gè)環(huán)節(jié)的提供商們也都嘗到了不少紅利。比如服務(wù)器端,《報(bào)告》顯示,2023年上半年,中國人工智能服務(wù)器市場規(guī)模達(dá)到30億美元,同比增長了55.4%,預(yù)計(jì)全年將達(dá)91億美元,同比增長82.5%。 與此同時(shí),由于大模型對(duì)計(jì)算能力和數(shù)據(jù)的高需求,2023年至2026年,全球用于運(yùn)行生成式AI的服務(wù)器市場規(guī)模在整體人工智能服務(wù)器市場的占比將從11.9%增長到31.7%。 ![]() “今年的一個(gè)特殊情況是,大家搶卡比較厲害,導(dǎo)致服務(wù)器的支出增長非常快 。”IDC周震剛告訴數(shù)智前線,隨著供需關(guān)系趨于平衡,這種高增速預(yù)計(jì)將在明年放緩,但鑒于算力需求持續(xù)上漲,中國AI服務(wù)器市場規(guī)模還將在未來五年以21.8%的年復(fù)合增長率持續(xù)增長。 機(jī)遇陡升的同時(shí),這個(gè)市場也在面臨一些新挑戰(zhàn)。一方面,單芯片算力已經(jīng)遇到瓶頸,提升空間有限;另一方面,算力依舊緊缺。這兩點(diǎn)上,全球市場無一例外。 當(dāng)然,中國市場的情況可能還要更嚴(yán)峻一點(diǎn)。一位資深人士告訴數(shù)智前線,國內(nèi)市場今年幾乎九成加速計(jì)算的能力都由英偉達(dá)所提供,僅一成由國產(chǎn)芯片廠商提供,算力短缺問題,依然待解。 此外,各行各業(yè)在進(jìn)行大模型探索和應(yīng)用的過程中,也存在各種意想不到的挑戰(zhàn)和問題。比如,有企業(yè)在使用AI集群,對(duì)面向場景的AI大模型進(jìn)行訓(xùn)練時(shí),發(fā)現(xiàn)服務(wù)器中的CPU到GPU之間的通信帶寬,和存儲(chǔ)到服務(wù)器之間的通信帶寬沒法同時(shí)跑滿,導(dǎo)致模型數(shù)據(jù)不能及時(shí)從存儲(chǔ)讀取,GPU空閑和訓(xùn)練性能低下。 如何在有限的算力下,更高效、低成本、少差錯(cuò)地進(jìn)行大模型及生成式AI的應(yīng)用和落地,已經(jīng)成為許多企業(yè)都要面對(duì)的問題。 在此背景下,報(bào)告認(rèn)為,國內(nèi)有關(guān)智能算力供給能力的衡量標(biāo)準(zhǔn)正在加速演變——用戶在獲得算力服務(wù)的過程中,會(huì)更加以應(yīng)用為導(dǎo)向進(jìn)行綜合考量,增加對(duì)于諸如單位時(shí)間可處理Token數(shù)量、可靠性、時(shí)延、訓(xùn)練時(shí)間和資金成本、數(shù)據(jù)集質(zhì)量等指標(biāo)的關(guān)注,而不再是僅考慮硬件性能。 這也要求算力供應(yīng)商做出相應(yīng)改變。《報(bào)告》指出,算力供應(yīng)商需要“以應(yīng)用為導(dǎo)向、系統(tǒng)為核心”,構(gòu)建算力基礎(chǔ)設(shè)施平臺(tái),提高算力利用率,提升諸如卡間互聯(lián)、多節(jié)點(diǎn)間互聯(lián)等水平,支持靈活穩(wěn)定擴(kuò)展和彈性容錯(cuò),積極打造通用的人工智能軟件和硬件平臺(tái),以先進(jìn)的系統(tǒng)性能力滿足市場的應(yīng)用需求。 換句話說,與其過分關(guān)注單一芯片的性能強(qiáng)弱,不如根據(jù)人工智能業(yè)務(wù)場景需求,設(shè)計(jì)更具針對(duì)性的算力系統(tǒng),實(shí)現(xiàn)整體性能最優(yōu)。換一種思維,打破算力困境。 03 業(yè)界的新解法 面對(duì)算力市場的新機(jī)遇和新挑戰(zhàn),包括云廠商、服務(wù)器廠商等在內(nèi)的諸多算力供應(yīng)商,正在快速反應(yīng)。 “基本上幾個(gè)大的云服務(wù)商,都已經(jīng)意識(shí)到大模型時(shí)代,智能計(jì)算的經(jīng)營模式會(huì)和過去傳統(tǒng)的云計(jì)算模式發(fā)生比較大的改變,因此都在重新去組織自己的計(jì)算能力。”周震剛告訴數(shù)智前線。 比如,百度云、華為云、阿里云都表示,將通過從底層算力到AI平臺(tái)再到模型服務(wù)的全棧技術(shù)創(chuàng)新,升級(jí)云計(jì)算體系。MaaS(Model as a Service)已成為云廠商的服務(wù)體系的重要一層。 而在更底層的服務(wù)器端,同樣帶來了服務(wù)需求的變化,甚至需要廠商的轉(zhuǎn)身。“我們認(rèn)為,應(yīng)該從算力系統(tǒng)、AI軟件基礎(chǔ)設(shè)施(AI infra)、算法模型和產(chǎn)業(yè)生態(tài)4個(gè)方面來進(jìn)行綜合考量,加速智能產(chǎn)業(yè)的落地。”浪潮信息高級(jí)副總裁劉軍表示。 業(yè)界觀察,服務(wù)器企業(yè)也在加速AI infra的進(jìn)展,這是一個(gè)新動(dòng)向。浪潮信息在今年8月推出了大模型智算軟件棧OGAI“元腦生智”(Open GenAI Infra)。 它包括L0的基礎(chǔ)設(shè)施層(智算中心OS)、L1的系統(tǒng)環(huán)境層(PODsys)、L2的調(diào)度平臺(tái)層(AIStation),L3的模型工具層(YLink)和L4的多模納管層(MModel)。各層對(duì)應(yīng)不同的應(yīng)用場景,且分層解耦,用戶需要哪些工具,就能調(diào)用哪些。 ![]() 這也是算力供應(yīng)商“以應(yīng)用為導(dǎo)向、系統(tǒng)為核心”的典型例證。類似的還有百度在千帆大模型平臺(tái)上提供的工具鏈。騰訊、阿里等也都有相應(yīng)服務(wù)出來。各家大廠的普遍思路是,持續(xù)更新迭代自己大模型的能力,同時(shí)又為大模型的訓(xùn)練和推理,提供訓(xùn)推經(jīng)驗(yàn)、數(shù)據(jù)、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等涉及方方面面的全套工具鏈和服務(wù)。 另外,在算力系統(tǒng)層面,打造開放多元的AI算力平臺(tái),解決目前多元算力共存的問題,也是未來幾年產(chǎn)業(yè)大趨勢。如浪潮信息發(fā)布的G7算力平臺(tái),采用開放多元的架構(gòu)設(shè)計(jì),支持最廣泛的通用處理器和加速芯片,同時(shí)將整個(gè)集群的性能加速比提升至超過90%,從而保障更大規(guī)模的集群擴(kuò)展性能。 大模型的浪潮還在繼續(xù),移動(dòng)互聯(lián)網(wǎng)時(shí)代邁向智能時(shí)代的大門即將打開,在這個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)上,反應(yīng)速度的快慢往往決定了誰能更快搶得先機(jī)。周震剛建議,用戶應(yīng)該要盡早去擁抱這個(gè)趨勢,供應(yīng)商也應(yīng)盡早適應(yīng)和跟上算力市場的改變。 |