電工為完成這些計算,芯片設(shè)計中,會增加很多運(yùn)算單元,如幾千到幾萬個運(yùn)算單元。隨著運(yùn)算單元數(shù)目的增加,每個運(yùn)算單元能夠使用的存儲器的帶寬和大小都在減小。因此,存儲器會成為計算瓶頸。
由于深度學(xué)習(xí)并不屬于通用計算的范疇,馮·諾伊曼(John von Neuman)架構(gòu)的存儲和計算分離,已經(jīng)不適合數(shù)據(jù)驅(qū)動的人工智能應(yīng)用需求。頻繁的數(shù)據(jù)搬運(yùn),導(dǎo)致的算力瓶頸以及功耗瓶頸,已經(jīng)成為更先進(jìn)算法探索的限制因素。類似于腦神經(jīng)結(jié)構(gòu)的存內(nèi)計算架構(gòu),將數(shù)據(jù)存儲單元和計算單元融合為一體,這樣能顯著減少數(shù)據(jù)搬運(yùn),提高計算并行度和能效。而計算存儲一體化,在硬件架構(gòu)方面的革新,也將突破AI算力瓶頸。筆者在《神龍飛天,國士王堅》中,曾經(jīng)介紹過在阿里神龍服務(wù)器和飛天操作系統(tǒng)的加持下,阿里、乃至整個云服務(wù)中的虛擬化層,所帶來的損耗,正在被不斷降低。
云服務(wù)憑借其標(biāo)準(zhǔn)化、彈性化的優(yōu)勢,使得用戶只需專注應(yīng)用開發(fā),無需關(guān)注基礎(chǔ)設(shè)施及基礎(chǔ)服務(wù)。而且,通過云原生的資源交付方式,計算效率、易用性、用戶的計算和運(yùn)維成本都會得到優(yōu)化??梢哉f,云服務(wù)變得像電力和自來水一樣無處不在,它還會成為數(shù)字經(jīng)濟(jì)時代基礎(chǔ)設(shè)施。