騰訊|如何突破存儲與運算之間的“內存墻”,這項新技術給出了更具性價比的選擇

騰訊|如何突破存儲與運算之間的“內存墻”,這項新技術給出了更具性價比的選擇

文章圖片


深度學習和人工智能的興起 , 對數據運算的要求越來越高 。 最開始數據中心通過提高CPU、GPU的性能進而提高算力 , 在馮·諾伊曼架構中 , 計算單元要先從內存中讀取數據 , 計算完成后 , 再存回內存 , 這樣才能輸出 。 由于半導體產業的發展和需求的差異 , 處理器和存儲器二者之間走向了不同的工藝路線 。 由于處理器與存儲器的工藝、封裝、需求的不同 , 從1980年開始至今二者之間的性能差距越來越大 。 數據顯示 , 從1980年到2000年 , 處理器和存儲器的速度失配以每年50%的速率增加 。
存儲器數據訪問速度跟不上處理器的數據處理速度 , 數據傳輸就像處在一個巨大的漏斗之中 , 不管處理器灌進去多少 , 存儲器都只能“細水長流” 。 兩者之間數據交換通路窄以及由此引發的高能耗兩大難題 , 在存儲與運算之間筑起了一道“內存墻” 。
隨著數據的爆炸增長 , 內存墻對于計算速度的影響正在顯現 。 為了減小內存墻的影響 , 提升內存帶寬一直是存儲芯片關注的技術問題 。 黃仁勛曾表示計算性能擴展最大的弱點就是內存帶寬 。 集成了大量的并行運算單元的處理器 , 如果內存帶寬跟不上 , 無疑會成為整個運算的瓶頸 。
在過去的七年里 , GDDR5在業界發揮了重要作用 。 迄今為止 , 這項顯存技術中的海量存儲功能幾乎應用在每個高性能顯卡上 。 DDR的出現實現了在一個時鐘周期內進行兩次數據傳輸 , 從而使之前的標準SDR(單次數據傳輸)的性能提高了一倍 。
但是隨著顯卡芯片的快速發展 , 人們對快速傳輸信息的要求也在不斷提高 。 GDDR5已經漸漸不能滿足人們對帶寬的需要 , 技術發展也已進入了瓶頸期 。 每秒增加1GB的帶寬將會帶來更多的功耗 , 這不論對于設計人員還是消費者來說都不是一個明智、高效或合算的選擇 。 因此 , GDDR5將會漸漸阻礙顯卡芯片性能的持續增長 。

憑借TSV方式 , 相對于GDDR , HBM技術可以提供更高的帶寬 , 更高的性價比 。 GDDR技術需要將DRAM芯片直接放置在PCB上并散布在處理器周圍 。 HBM位于GPU本身上 , 并且堆棧相互疊在一起 。 這種方法無疑更快 。
以目前國內在高帶寬顯存技術上做的比較好的芯動科技來看 , 他們的HBM已經能夠提供7.2Gbps的HBM3和3.6Gbps的HBM2e , 基本對標國際最新標準 。 其最大技術優勢就是在帶寬最大化的重要改進 。

此外 , TSV技術可以在增加帶寬的同時降低封裝尺寸 , 同時降低功耗 。 在傳統架構下 , 數據從內存單元傳輸到計算單元需要的功耗是計算本身的約200倍 , 因此真正用于計算的能耗和時間占比很低 , 數據在存儲器與處理器之間的頻繁遷移帶來嚴重的傳輸功耗問題 , 稱為“功耗墻” 。
【騰訊|如何突破存儲與運算之間的“內存墻”,這項新技術給出了更具性價比的選擇】有研究指出 , 單個HBM2e設備的功耗幾乎是GDDR6解決方案的一半 。 HBM2e能提供與GDDR6相同或更高的帶寬和類似的容量 , 但功耗幾乎GDDR6的一半 。 TOPS是在給定內存設備帶寬的情況下衡量最大可實現吞吐量的指標 , 用于評估神經網絡和數據密集型AI應用程序等應用程序的最佳吞吐量 。 HBM2e的設備的TOPS/W 比GDDR6技術的吞吐量增加了一倍 。
在算力時代 , CPU、GPU性能總是技術關注的焦點 , HBM技術登臺后 , 哪個技術會是儲存行業的突破口呢?

    相關經驗推薦