來源:虎嗅網(wǎng) 如果能給人工智能與科學(xué)計算產(chǎn)業(yè)設(shè)一個熱搜榜,那么從昨晚到今天,榜單只有兩個熱詞: 英偉達停貨,AMD停貨。 作為全球頂級計算芯片企業(yè),兩家的公告幾乎一夜之間刷遍算法工程師的朋友圈:英偉達的云端加速器系列A100與H100,以及AMD的數(shù)據(jù)中心級GPU MI100與MI200,都將暫停向中國客戶發(fā)貨,等待下一步通知。 ![]() 圖片由產(chǎn)業(yè)提供 虎嗅第一時間聯(lián)系了英偉達與AMD官方聯(lián)系渠道,得到的回答均為“不予回復(fù)”。但這個消息,已經(jīng)得到了國內(nèi)產(chǎn)業(yè)相關(guān)采購人士的證實。 昨日,一份由英偉達在8月26日提交給美國證券交易委員會(SEC)的報告里明確顯示,出口英偉達的服務(wù)器GPU A100與H100系列,需要向政府申請新許可證。 “未來峰值性能與芯片I/O性能等于或大于A100的任何英偉達產(chǎn)品,以及包含這些電路的任何系統(tǒng),都需要遵照新的許可要求。” 文件里特意標(biāo)注出受限的產(chǎn)品型號。 換句話說,代際在A100之后的高端AI加速卡系列(包括A100、H100以及與這些硬件產(chǎn)品密切相關(guān)的DGX系統(tǒng)),都將在中國市場受到更加嚴苛的銷售限制。 英偉達接受美國媒體采訪時承認,自己正在與中國客戶做替代產(chǎn)品相關(guān)的交涉。雖然在申請新的許可證以延續(xù)中國出口項目,但并不清楚政府能否給予豁免。 從中國市場規(guī)模來看,英偉達遭受的打擊不小。 據(jù)英偉達自己估算,2022年第三季度,他們在中國的潛在銷售額會減少4億美元,而此前的預(yù)估收入為59億美元。消息一出,其股價在周三的盤后交易中跌幅達6.5%。 毋庸置疑,英偉達各系列GPU產(chǎn)品一直都是產(chǎn)業(yè)焦點。特別是數(shù)據(jù)中心級加速卡,基本代表著全球圖形處理器軟硬件的最高水準(zhǔn)。 而A100,是在V100發(fā)布4年后,于2020年才推出的新一代數(shù)據(jù)中心級云端加速芯片。 如果說2019年前后,國內(nèi)華為等中國企業(yè)陸續(xù)發(fā)布了可對標(biāo)V100系列的產(chǎn)品(很明顯,參數(shù)上的超越不代表實際應(yīng)用的超越),那么A100無論從制程(7nm)、架構(gòu)(Ampere)還是“運算與浮點性能”,都對市面上的其他產(chǎn)品進行了全方位碾壓。 ![]() 4年時間,每個系列的高性能運算能力迭代 “A100比V100強太多,這不單單是絕對性能的問題,而是在于‘怎么用’。” 一位虎嗅芯片分析師表示,A100在應(yīng)用層面有很大的想象力,而其配套的算法組件、算法庫方面都是頂級的,在軟件層面建立的全壁壘優(yōu)勢太難打破。 而基于Hooper架構(gòu)的H100,則是2022年2月發(fā)布可取代A100的新一代異步計算巨獸。 除了比A100多出至少250億個晶體管,它也在FP16、FP32和FP64計算上比A100快三倍。英偉達曾特別指出,它非常適用于當(dāng)下流行且訓(xùn)練難度高的“大模型”。 “國內(nèi)還沒有能與這兩代加速器相對標(biāo)的硬件產(chǎn)品與系統(tǒng)能力。” 盡管國內(nèi)優(yōu)秀團隊與創(chuàng)業(yè)公司看起來很多,但一位分析師指出,研發(fā)周期跨度至少有3年。 商用影響不大 與強悍性能相對應(yīng)的,則是昂貴的價格。 以英偉達A100為例,單臺 DGX A100 服務(wù)器的售價高達19.9萬美元,大部分學(xué)術(shù)機構(gòu)負擔(dān)不起,取而代之的是V與T系列的廣泛應(yīng)用。 另一方面,從人工智能覆蓋的多產(chǎn)業(yè)(人臉、攝像頭、金融、客服等等)與自動駕駛的企業(yè)級商用市場反饋來看,英偉達與AMD的頂配線一直不在他們的考慮范圍內(nèi)。 “性能雖強大,但對于城市道路級別的感知和規(guī)劃,就過于大材小用了。自動駕駛對精度的要求,英偉達RTX(游戲)系列與Tesla系列的顯卡足以應(yīng)對。” 多位自動駕駛從業(yè)者表示,“性價比”是絕對的第一考量因素。 而近年來,在逐步往汽車市場下沉的過程中,過去不計成本追求高端算力芯片與高端工控機的L4自動駕駛公司,最終在車規(guī)級與高性能之間找到了平衡。 譬如在2021年,自動駕駛公司最喜歡做的事情,就是曬“與英偉達車規(guī)級Orin芯片的合作證書”。這是一款英偉達專門面向車規(guī)級自動駕駛市場開發(fā)的“可調(diào)節(jié)”計算芯片。 ![]() 2019年底英偉達正式發(fā)布Orin 而英偉達數(shù)據(jù)中心云端加速器產(chǎn)品的絕對大客戶——服務(wù)器廠商與云計算廠商們,或許會喜憂參半。 一方面,2021年規(guī)模達到53.9億美元的中國加速器市場還在不斷壯大,GPU服務(wù)器占絕對主導(dǎo)。其中,加速卡的采購型號主要集中在英偉達的T4、V100、V100S以及A100系列上,外加少量的AMD與英特爾。 2021年,中國加速卡數(shù)量出貨超過80萬片,其中英偉達占據(jù)超過80%市場份額(數(shù)據(jù)來自IDC)。 “A100的采購量沒有那么多,主要還是T4與V100。” 一位云計算產(chǎn)業(yè)人士告訴虎嗅,從2021年下半年后,包括云計算和服務(wù)器廠商在內(nèi),為了應(yīng)對不斷變化的市場環(huán)境,在主動降低這類GPU的采購需求。 但另一方面,A100在更多復(fù)雜模型訓(xùn)練上的吸引力仍然極大。云巨頭和一些有財力的科技公司加起來的購買量至少有萬臺規(guī)模。譬如,國內(nèi)某家人工智能獨角獸企業(yè),采購了上千塊A100。 不過值得注意,他們購買A100的理由并非只為商用,而是與“超算”“高性能運算”等領(lǐng)域有密切關(guān)系。 “頂配”的科學(xué)貢獻 就像上面那位虎嗅分析師所說,享用A100與H100這類高端線的機構(gòu)也需要擁有更多“想象力”。或者說,使用者也需要具備與之相匹配的系統(tǒng)級實力。 2022年5月30日,第59屆的全球超算TOP500榜單上,美國橡樹嶺國家實驗室開發(fā)的超級計算機Frontier以絕對優(yōu)勢稱霸。值得注意,F(xiàn)rontier 有9408個節(jié)點,每個節(jié)點配置了1個 AMD Epyc CPU 和 4個AMD MI250X GPU。 而橡樹嶺另一臺超算 Summit 排名第四,有4356 個節(jié)點,每個節(jié)點配置了2個 IBM Power9 CPU和 6個英偉達 V100;而美國能源研究科學(xué)計算中心發(fā)布的AI超級計算機 Perlmutter 則排名第7,GPU 采用了英偉達的A100。 有趣的是,全球排名第8的超級計算機由英偉達公司自己開發(fā),其每個節(jié)點由AMD Epyc CPU與A100組成。 ![]() 圖片來自TOP500超級計算機榜單 “毋庸置疑,英偉達的高端加速器對大規(guī)模科學(xué)運算的研究有重大影響力。” 一位國內(nèi)專攻芯片性能調(diào)優(yōu)的技術(shù)大佬指出,在這個市場,英偉達和AMD暫時還沒有對手。 而有趣的是,越來越多的商業(yè)巨頭也開始參與到“高性能運算”領(lǐng)域的技術(shù)競演中。 就在2022年初,轉(zhuǎn)型元宇宙的Meta公開承認,自己正在秘密建設(shè)一臺名叫“AI研究超星團”(RSC)的AI超級計算機。 雖然Meta建造這臺機器的理由,主要集中在“避免受到芯片與零部件供應(yīng)鏈的太多牽連”。但實際上,他們早在2017年就建立了一個由2.2萬片V100組成的超級計算集群,每天執(zhí)行3.5萬個算法訓(xùn)練任務(wù)。 而這次,RSC的任務(wù)范圍也相應(yīng)擴大——除了訓(xùn)練與自然語言處理與計算機視覺相關(guān)的大模型,也會探索更多未知的科學(xué)任務(wù)。 “大規(guī)模并行運算的研究覆蓋面非常廣泛,絕不僅僅是人工智能方面的應(yīng)用。或者說,通過人工智能,可以‘解密’更多自然科學(xué)層面的研究。” 一位產(chǎn)業(yè)人士表示,“并行計算”也是仿真學(xué)、空氣動力學(xué)、磁學(xué)等學(xué)科不可或缺的研究工具。譬如,高端工業(yè)仿真軟件,便需要高性能計算架構(gòu)的強有力支撐。 |