騰訊|如何突破存儲與運算之間的“內存墻”，這項新技術給出了更具性價比的選擇

2026-04-09 騰訊數字化轉型

文章圖片

深度學習和人工智能的興起，對數據運算的要求越來越高。最開始數據中心通過提高CPU、GPU的性能進而提高算力，在馮·諾伊曼架構中，計算單元要先從內存中讀取數據，計算完成后，再存回內存，這樣才能輸出。由于半導體產業的發展和需求的差異，處理器和存儲器二者之間走向了不同的工藝路線。由于處理器與存儲器的工藝、封裝、需求的不同，從1980年開始至今二者之間的性能差距越來越大。數據顯示，從1980年到2000年，處理器和存儲器的速度失配以每年50%的速率增加。
存儲器數據訪問速度跟不上處理器的數據處理速度，數據傳輸就像處在一個巨大的漏斗之中，不管處理器灌進去多少，存儲器都只能“細水長流” 。兩者之間數據交換通路窄以及由此引發的高能耗兩大難題，在存儲與運算之間筑起了一道“內存墻” 。
隨著數據的爆炸增長，內存墻對于計算速度的影響正在顯現。為了減小內存墻的影響，提升內存帶寬一直是存儲芯片關注的技術問題。黃仁勛曾表示計算性能擴展最大的弱點就是內存帶寬。集成了大量的并行運算單元的處理器，如果內存帶寬跟不上，無疑會成為整個運算的瓶頸。
在過去的七年里， GDDR5在業界發揮了重要作用。迄今為止，這項顯存技術中的海量存儲功能幾乎應用在每個高性能顯卡上。 DDR的出現實現了在一個時鐘周期內進行兩次數據傳輸，從而使之前的標準SDR（單次數據傳輸）的性能提高了一倍。
但是隨著顯卡芯片的快速發展，人們對快速傳輸信息的要求也在不斷提高。 GDDR5已經漸漸不能滿足人們對帶寬的需要，技術發展也已進入了瓶頸期。每秒增加1GB的帶寬將會帶來更多的功耗，這不論對于設計人員還是消費者來說都不是一個明智、高效或合算的選擇。因此， GDDR5將會漸漸阻礙顯卡芯片性能的持續增長。

憑借TSV方式，相對于GDDR ， HBM技術可以提供更高的帶寬，更高的性價比。 GDDR技術需要將DRAM芯片直接放置在PCB上并散布在處理器周圍。 HBM位于GPU本身上，并且堆棧相互疊在一起。這種方法無疑更快。
以目前國內在高帶寬顯存技術上做的比較好的芯動科技來看，他們的HBM已經能夠提供7.2Gbps的HBM3和3.6Gbps的HBM2e ，基本對標國際最新標準。其最大技術優勢就是在帶寬最大化的重要改進。

此外， TSV技術可以在增加帶寬的同時降低封裝尺寸，同時降低功耗。在傳統架構下，數據從內存單元傳輸到計算單元需要的功耗是計算本身的約200倍，因此真正用于計算的能耗和時間占比很低，數據在存儲器與處理器之間的頻繁遷移帶來嚴重的傳輸功耗問題，稱為“功耗墻” 。
【騰訊|如何突破存儲與運算之間的“內存墻”，這項新技術給出了更具性價比的選擇】有研究指出，單個HBM2e設備的功耗幾乎是GDDR6解決方案的一半。 HBM2e能提供與GDDR6相同或更高的帶寬和類似的容量，但功耗幾乎GDDR6的一半。 TOPS是在給定內存設備帶寬的情況下衡量最大可實現吞吐量的指標，用于評估神經網絡和數據密集型AI應用程序等應用程序的最佳吞吐量。 HBM2e的設備的TOPS/W 比GDDR6技術的吞吐量增加了一倍。
在算力時代， CPU、GPU性能總是技術關注的焦點， HBM技術登臺后，哪個技術會是儲存行業的突破口呢？

相關經驗推薦

上一篇：充電寶|年省4萬小妙招（騰訊會議電話入會指南）

下一篇：小米科技|雙飛燕血手幽靈mr710的問世，是游戲愛好者的福音。