文檔幫助中心
模擬電路人工智能神經(jīng)網(wǎng)絡(luò)的前景
模擬電路人工智能神經(jīng)網(wǎng)絡(luò)的前景
來源:IEEE電氣電子工程師學會
在驅(qū)動AI當前爆炸的深層神經(jīng)網(wǎng)絡(luò)中,最基本的計算是乘法累加(MAC)運算。深度神經(jīng)網(wǎng)絡(luò)由人工神經(jīng)元層組成,在MAC操作中,每一層的輸出乘以它們與下一層連接的強度或“權(quán)重”值,然后將這些貢獻相加。
現(xiàn)代計算機有專門用于MAC操作的數(shù)字元件,但從理論上講,模擬電路可以用更少的能量進行這些計算。這種被稱為模擬AI、內(nèi)存中計算或內(nèi)存中處理的策略通常使用非易失性存儲器設(shè)備(如閃存、磁阻RAM(MRAM)、電阻RAM(RRAM)、相變存儲器(PCM)和更為深奧的技術(shù))來執(zhí)行這些乘法累加操作。
然而,韓國的一個團隊正在探索基于鐠鈣錳氧化物電化學RAM(ECRAM)設(shè)備的神經(jīng)網(wǎng)絡(luò),這種設(shè)備就像微型電池,以電導變化的形式存儲數(shù)據(jù)。研究在韓國浦項科技大學的主要作者ChuljunLee指出,神經(jīng)網(wǎng)絡(luò)硬件在訓練期間和應(yīng)用期間經(jīng)常有不同的需求。例如,低能量屏障有助于神經(jīng)網(wǎng)絡(luò)快速學習,但高能量屏障有助于它們保留所學知識,以便在應(yīng)用過程中使用。
德國尤利希研究中心彼得·格倫伯格神經(jīng)形態(tài)計算節(jié)點研究所所長、電氣工程師JohnPaulStrachan沒有參加這項研究。他說:“在訓練過程中,將設(shè)備加熱到100攝氏度左右,可以產(chǎn)生有利于訓練的特性。當它冷卻下來時,他們獲得了更長的保留時間和更低的電流操作的優(yōu)勢。只需調(diào)整一個旋鈕,熱量,他們就可以在多個計算維度上看到改進。”研究人員于12月14日在舊金山舉行的IEEE國際電子設(shè)備會議(InternationalElectronDevicesMeeting(IEDM))上詳細描述了他們的發(fā)現(xiàn)。
Strachan指出,這項工作面臨的一個關(guān)鍵問題是,經(jīng)過多次加熱和冷卻后,ECRAM可能會面臨何種劣化。不過,“這是一個非常有創(chuàng)意的想法,他們的工作證明了這種方法可能有一些潛力?!?br/>
另一組研究了鐵電場效應(yīng)晶體管(FEFET)。研究主要作者、圣母大學的KhandkerAkifAabrar解釋說,F(xiàn)EFET在每個晶體管內(nèi)以電極化的形式存儲數(shù)據(jù)。
FEFET面臨的一個挑戰(zhàn)是,當它們縮小時,它們是否仍然可以顯示對AI應(yīng)用程序有價值的模擬行為,或者它們是否會突然切換到只存儲一位信息的二進制模式,極化狀態(tài)為一種狀態(tài)或另一種狀態(tài)。
“這個團隊工作的優(yōu)勢在于他們對所涉及材料的洞察,”Strachan說,他沒有參與這項研究,“鐵電材料可以被認為是由許多小磁疇組成的塊體,就像鐵磁體可以被認為是上下磁疇一樣。為了實現(xiàn)他們所希望的模擬行為,他們希望所有這些磁疇在外加電場的作用下緩慢地向上或向下排列,而不是出現(xiàn)一個失控的過程,在這個過程中它們都會向上或向下移動?!币虼耍麄冇枚鄠€介電層物理分解了鐵電超晶格結(jié)構(gòu),以減少這種失控過程。
該系統(tǒng)實現(xiàn)了94.1%的在線學習準確率,這與其他FEFET和RRAM技術(shù)相比非常好,科學家在12月14日的IEDM會議上詳細介紹了這一發(fā)現(xiàn)。Strachan指出,未來的研究可以尋求優(yōu)化屬性,如當前水平。
來自日本和臺灣科學家的一種新型微芯片,采用c軸定向晶體氧化銦鎵鋅制成。這項研究的合著者、日本半導體能源實驗室公司的SatoruOhshita指出,他們的氧化物半導體場效應(yīng)晶體管(OSFET)的超低電流操作低于每個電池1毫安,操作效率為143.9萬億次/秒/瓦,這是迄今為止模擬AI芯片中報道得最好的,12月14日在IEDM會議上詳細介紹了調(diào)查結(jié)果?!斑@些都是極低電流的設(shè)備,”Strachan說,“由于所需的電流非常低,您可以將電路塊變大,從而獲得512×512個存儲單元的陣列,而RRAM的典型數(shù)字更像是100×100。這是一個巨大的勝利,因為較大的電路塊在存儲權(quán)重方面具有二次優(yōu)勢?!碑擮SFET與電容器結(jié)合時,它們可以以90%以上的準確度保留信息30小時。Strachan說:“這可能是一段足夠長的時間,可以將這些信息轉(zhuǎn)移到一些波動性較小的技術(shù)上。幾十小時的保留時間并不是交易的破壞者?!笨傊把芯咳藛T正在探索的這些新技術(shù)都是概念驗證案例,提出了關(guān)于他們未來可能面臨的挑戰(zhàn)的新問題,”Strachan說,“他們還指出了通往代工廠的道路,這是他們生產(chǎn)大批量、低成本商業(yè)產(chǎn)品所需要的?!?/span>