根據(jù)去年在IEEESpectrum上發(fā)布的《深度學(xué)習(xí)受益遞減》一文中提到,隨著機(jī)器學(xué)習(xí)的發(fā)展,到了2025年,最強(qiáng)的深度學(xué)習(xí)系統(tǒng)在ImageNet數(shù)據(jù)集中進(jìn)行物體識(shí)別時(shí),錯(cuò)誤率最高只有5%。但訓(xùn)練這樣一個(gè)系統(tǒng)所需要的算力和能耗都是龐大的,更糟糕的是,其排放的二氧化碳將是紐約市一整個(gè)月的排放量。![]() 至于如何記錄碳排放,這也很簡(jiǎn)單,只需要將訓(xùn)練/推理的時(shí)長(zhǎng)x處理器數(shù)量x每個(gè)處理器的平均功耗xPUEx每千瓦時(shí)的二氧化碳排放即可。除了最后一項(xiàng)參數(shù)需要從數(shù)據(jù)中心那獲取外,其他的數(shù)據(jù)基本都是公開(kāi),或取決于機(jī)器學(xué)習(xí)研究者自己的選擇。 如何減少機(jī)器學(xué)習(xí)的碳足跡 圖靈獎(jiǎng)得主、谷歌杰出工程師DavidPatterson教授對(duì)現(xiàn)有的機(jī)器學(xué)習(xí)的研究和工作提出了以下幾點(diǎn)建議。首先,從模型開(kāi)始著手,機(jī)器學(xué)習(xí)研究者需要繼續(xù)開(kāi)發(fā)效率更高的模型,比如谷歌去年發(fā)布的GLaM通用稀疏語(yǔ)言模型,相較GPT-3,它多出了7倍的參數(shù),在自然語(yǔ)言推理等任務(wù)上都要優(yōu)于GPT-3。但同樣重要的是它的能耗和碳足跡指標(biāo),根據(jù)谷歌公布的數(shù)據(jù),與使用V100的GPT-3相比,使用TPUv4的GLaM二氧化碳排放減少了14倍,可見(jiàn)模型對(duì)于碳足跡的影響。其次,在發(fā)布新模型的時(shí)候,他建議也把能耗和碳足跡這樣的數(shù)據(jù)公開(kāi),這樣有助于促進(jìn)機(jī)器學(xué)習(xí)模型在質(zhì)量上的良性競(jìng)爭(zhēng)。 接著是硬件,他指出我們需要像TPUv4或者A100GPU等,這類機(jī)器學(xué)習(xí)能效比更高的硬件。其實(shí)這一點(diǎn)反倒是最不需要擔(dān)心的,這幾乎是每個(gè)初創(chuàng)AI芯片公司都在嘗試的做法,即便在峰值上不敵這些硬件,也絕對(duì)會(huì)在能效比上盡可能做大極致。 還有就是常見(jiàn)的能效衡量指標(biāo)PUE,大型機(jī)器學(xué)習(xí)負(fù)載往往要在數(shù)據(jù)中心上運(yùn)行,而要讓數(shù)據(jù)中心的PUE接近1并不是一件簡(jiǎn)單的事。根據(jù)UptimeInstitute的統(tǒng)計(jì),各家廠商旗下最大數(shù)據(jù)中心的年度PUE為1.57,就連我國(guó)工信部印發(fā)的《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023)》中提出的最終目標(biāo)也只是將新建大型數(shù)據(jù)中心PUE降低至1.3以下。但好在新建的數(shù)據(jù)中心往往都不會(huì)只滿足于這個(gè)目標(biāo),而是往1.1乃至1.06這樣的指標(biāo)推進(jìn)。 可這個(gè)指標(biāo)并不是一個(gè)死數(shù)據(jù),隨著負(fù)載和用量的變動(dòng),PUE是在持續(xù)波動(dòng)的,不少數(shù)據(jù)中心僅僅在建成時(shí)發(fā)布了能效指標(biāo),之后就再未公布過(guò)任何數(shù)據(jù)了。在這塊做得最好的也還是谷歌,谷歌每年都會(huì)發(fā)布年度能效報(bào)告,將各個(gè)數(shù)據(jù)中心每個(gè)季度的PUE公布出來(lái)。 不過(guò)僅僅只有極低的PUE只能體現(xiàn)出高能耗比,DavidPatterson教授認(rèn)為還必須一并公布每個(gè)地區(qū)數(shù)據(jù)中心的清潔能源占比。比如阿里巴巴首次發(fā)布的《2022阿里巴巴環(huán)境、社會(huì)和治理報(bào)告》中就提到了2021年,阿里巴巴在中國(guó)企業(yè)可再生能源購(gòu)買(mǎi)者中排名第一,2022財(cái)年阿里云21.6%的電力來(lái)自清潔能源。 在雙碳目標(biāo)的提出下,我國(guó)其實(shí)已經(jīng)落實(shí)到了機(jī)器學(xué)習(xí)的硬件上,但在軟件和碳足跡透明度這方面還有可以改善的空間。機(jī)器學(xué)習(xí)要想做到消耗更低的算力來(lái)實(shí)現(xiàn)更優(yōu)的效果,就必須從各個(gè)環(huán)節(jié)做到節(jié)能減排。 |