大腦為何如此耗能? 比較計算與通訊的代謝能效

大腦為何如此耗能? 比較計算與通訊的代謝能效

點選載入圖片

為什麼人腦僅佔2%的體重,卻消耗了人體20%的能量?人腦與計算機之間誰的能耗更高?大腦的代謝模式怎樣啟發計算機與人工智慧設計?最近的研究發現,大腦在處理計算與通訊兩種任務時,代謝模式不同,且大腦通訊的代謝成本遠高於計算。大腦能耗研究也為下一代高效能低功耗計算機的研發提供了啟示。

研究領域:大腦能量消耗,最優計算,神經計算,資訊處理

1。 大腦能量消耗之謎

人腦僅佔體重的 2%,卻占人體代謝負荷的 20% [1-3],單位質量的代謝成本是肌肉的10倍。另一方面,大腦能在大約 20 W 的能量預算下創作詩歌、藝術以及設計航天器——考慮到用來寫作這篇文章的計算機就需要 80 W 的能耗,大腦的能耗簡直微不足道。大腦中何處消耗能量,能量被用來做什麼?為什麼大腦的代謝成本相對於其它生命活動如此高昂?大腦又是如何實現遠高於矽基產品的能量效率?許多經典論文都研究過這些問題。Attwell 和 Laughlin [4] 進行了詳細的生物物理估計,表明神經訊號傳導和神經遞質釋放的突觸後效應合起來佔大腦三磷酸腺苷(ATP,生物體最直接的能量來源)消耗的 80%,這一結論也得到了神經生理學和解剖學的支援 [5, 6]。許多研究探討了這種能量消耗的結構及功能後果,包括限制大腦尺寸和縮放規律(size and scaling)、有效連線模式、模擬(分級電位)與數字(尖峰)訊號、分散式神經程式碼、沿神經束的資訊流量分佈及其規模分佈,還有計算異質性和效率等[8-17]。Sterling 和 Laughlin [18] 對這些想法進行綜合,得出一系列大腦的設計原則。Levy 和 Calvert [19] 提出了哺乳動物大腦功率預算的功能解釋,表明通訊的代謝成本比計算高得多,並探索了神經迴路組織的功能後果。

2。 大腦中的通訊和計算

Levy 和 Calvert [19] 以早期文獻為基礎,主要關注人腦中不同資訊處理模式的相對能耗,而不是細胞層面不同功能的能耗。它們對通訊和計算做出了關鍵的區分:“通訊”一般是指資訊點到點的傳輸(可能以某種方式編碼),不包括表徵轉換、特徵提取或決策的對映。大腦中通訊的一個例子是視覺資訊沿視神經從眼睛到中央大腦的傳輸,這個過程中視覺資訊保持不變。“計算”是一個更微妙的概念,通常從輸入-輸出轉換的角度來理解。Levy 和 Calvert 在先前工作的基礎上,將每個

神經元

視為對自身輸入中的潛在變數進行“微觀估計或預測”,並在脈衝間隔內(神經元兩次傳輸訊號的動作電位之間)對輸出進行編碼。微觀估計和預測是極其一般化的框架,能夠包含神經計算的其他觀點(如將神經元視為動力系統或邏輯閘),並且還包含了單個神經元在神經網路中的計算功能。同樣,脈衝間隔中資訊編碼的形式也包含多種可能性,如速率編碼和模式編碼。因此,大腦中神經元“計算”的一個例子可以是 V1 區(見圖1)中的一個細胞對視神經輸入訊號的估計或預測,並將其編碼為視覺上某個物體(如一條水平線)的存在。

大腦為何如此耗能? 比較計算與通訊的代謝能效

點選載入圖片

圖1。初級視覺皮層(V1),位於大腦內側枕葉的距狀溝中(後腦勺左右側)。V1是皮層中的“第一個”視覺處理區域, LGN(外側膝狀體核,位於丘腦,接受視網膜大部分視覺資訊輸入)將大部分軸突訊號傳送至V1皮層。

從這個角度出發,作者對比了計算中涉及的單位脈衝間隔的興奮性電流中恢復離子梯度的 ATP 成本,以及通訊中涉及的諸如軸突靜息電位、動作電位和囊泡回收等成本,最終得出結論:通訊相關的生物物理過程消耗的能量是計算相關過程的 35 倍(生物相關單位以每秒消耗 ATP 分子計,物理單位以每秒消耗焦耳計)[19]。通訊與計算能耗的巨大差異為參考文獻 [4] 中隱含的發現正名,其作者表明神經訊號傳導和神經遞質釋放的突觸後效應支配著大腦的功耗。來自參考文獻 [15] 的另一條證據表明,神經元中的線粒體分佈會追蹤放電率和突觸傳遞,因此軸突的粗細很可能取決於突觸終端的能耗需求,它佔哺乳動物大腦能耗的 65% [20]。在先前建立的框架中,文獻[4]與[15]中描述的高能耗過程都是通訊過程,不包括文獻[19]中的計算過程。有趣的是,Levy 和 Calvert 還估計,27% 的皮層能量支出是用於與突觸發生相關的過程,例如透過肌動蛋白聚合、膜合成和摻入,以及相關的細胞內運輸的生長。這進一步細化了先前的能量預算,表明大腦將四分之一以上的能量用於促進持續學習,這與我們對大腦的印象相一致。

大腦為何如此耗能? 比較計算與通訊的代謝能效

點選載入圖片

圖2。一個典型的神經元由胞體(cell body),樹突(dendrite)和軸突(axon)組成,軸突的最遠端是突觸(synapse),神經元可以透過突觸將訊號傳輸到另一個細胞。

3。 大腦耗能對計算機設計的啟發

在物理層面,Levy 和 Calvert 計算出皮層灰質消耗了大約 3 W 的功率,而根據大腦葡萄糖攝取量,估計大腦功率消耗為 17~20 W [1 , 2],其中 10% 在正常情況下未被使用,大約 9W 以熱量形式耗散,剩餘能量為大腦其餘部分供能。對皮層灰質 3 W 的功耗估計與 Lennie [21] 早期工作的結果一致。但 Lennie 使用 20 年前可用的資料,發現大腦能量預算的劃分略有不同——大腦50%的功耗用於與神經電訊號活動(即計算和通訊)無關的過程。該結論與當前研究的差異部分來自於生物物理資料,包括對突觸數量及其接通率(success rate)的估計。新的估計還表明,灰質中每個神經元的能耗大約為W,這與 Herculano-Houzel的工作一致[22] 。Levy 和 Calvert 根據噪聲神經積分器輸入和輸出之間的互資訊,來估計大腦每焦耳能耗所計算的資訊位元數。在這個定義下,他們發現神經元每位元的計算能耗是 Landauer 理想熱力學極限*[23] 的倍。他們認為這一巨大差異源於通訊成本(Landauer 忽略了這一點)和生物需要快速響應行為的計算需求。通訊成本和快速計算需求這兩個約束無疑是相關的,研究人員希望在未來仔細檢驗關於計算的定義,以及由活細胞計算施加的生物物理約束。

*譯註:Landauer 原理表明,擦除1位元資訊在理論上至少要產生kBTln2 的能量耗散,這被稱為Landauer極限。

在 Levy 和 Calvert 的分析中,能量預算和每焦耳能耗所計算的位元數都取決於一個引數:皮質錐體神經元的平均輸入突觸數乘以它們的接通率。他們發現,當這個引數大約為 2000 時,每焦耳能耗所計算的位元數估值將最大化,接近於他們從資料中得出的值。這個有趣的結果讓人想起之前使用能源效率來理解神經放電應該如何組織的研究 [11, 13],以及資訊應該如何在大腦中的細胞和結構之間進行分配的研究 [14, 17]。這項新工作為更精細地分析大腦中的迴路結構以及大腦如何劃分計算任務打開了大門。

大腦為何如此耗能? 比較計算與通訊的代謝能效

點選載入圖片

圖3。 大腦中的計算分佈在網路中通訊的特定元件之間。綠色圓圈表示皮質區域網路,每個區域執行不同的功能。橙色三角形表示錐體細胞網路,它們透過協作計算單個皮質區域的功能。Levy 和 Calvert 認為基本單元的計算成本相比於它們之間的通訊成本而言微不足道。

Levy 和 Calvert 的結果與在持續計算和通訊方面解釋區域腦代謝的功能性磁共振成像(fMRI)測量值是相關的。新資料也適用於對大腦演化的研究,如針對大腦代謝成本高昂 [7] 及代謝生理上限制大腦結構 [8, 22] 的研究。Levy 的研究結果也會引發工程師對設計下一代低功耗智慧計算裝置的興趣。研究指出由大腦灰質完成的計算和通訊僅需3W的功率,即使加上用於保溫的9W功率,這一功耗也比典型的膝上型電腦低出近一個數量級。先前的工作表明,資訊處理速率和能耗間存在的收益遞減規律將推動計算機向異構架構發展,在這種架構中,整體功能在各尺度上透過大量特定單元間的協作湧現,每個特定單元以物理基質決定的最高效率處理資訊[17]。Levy 和 Calvert 的論文表明,這種向異構架構的轉變必須平衡好不同元件之間的網路學習成本和通訊成本,因為儘管每個單元的計算成本相對較低,但單元間的通訊成本將是高昂的。

相關文章