置身事內:騰訊的造芯之路( 二 )


2016年前后 , 由Alpha Go引爆的AI熱潮更把FPGA拉入了主流視野 。團隊通過FPGA對深度學習模型的CNN算法進行加速后,處理性能達到通用CPU的4倍,而單位成本僅為1/3 。
FPGA效果雖好,但技術門檻比較高,“如果把FPGA云化,是不是一個能夠擴大應用的解決路徑?”
帶著這樣的期待,2017年1月20日,騰訊云推出了國內首款FPGA云服務器 , 希望以云計算的方式,將FPGA能力推廣到更多企業 。
從效果上來說,在FPGA云服務器上進行FPGA硬件編程的企業 , 確實能將性能提升至通用CPU服務器的30倍以上,而只需支付相當于通用CPU約40%的費用 。以一家著名的基因檢測公司為例,傳統用CPU需要檢測一周的基因序列 , FPGA可以壓縮到數小時完成 。
然而云化后的FPGA,沒能如預期般迅速席卷整個行業 。
一方面,FPGA畢竟是一種“半定制”的電路 , 許多企業還是無法獨立勝任FPGA開發,需要更加上層的服務;另一方面,通用芯片成本的迅速下降,也讓FPGA的性價比優勢逐漸喪失 。
云端商業化的受挫潑來一盆冷水 , 把團隊的熱情從巔峰一下子打到了谷底,同時也把兩個問題赤裸裸地拋到整個團隊的眼前:FPGA對業務的價值究竟有多大?FPGA還能繼續做嗎?
受此打擊,團隊在2018年也近乎分崩離析,人員開始集中式地離開 。騰訊在“造芯”上的第一次探索,畫上了一個遺憾的逗號 。
02
柳暗花明,“蓬萊”問世
在FPGA云服務器受挫后 , 騰訊需要重新思考硬件之路要怎么走下去 。
在團隊幾乎解散的2018年,中國芯片行業迎來暖春:中美貿易摩擦給全民普及了芯片的重要性,科創板的設立為半導體企業上市開啟大門,而國家資金的進場更是讓大江南北一片熱火朝天 。
但是 , 對于互聯網公司來說,做芯片跟做云計算、數據庫、存儲系統等一樣,需要有具體的業務場景支撐,不能“為了做而做” 。在經歷過一場不算成功的探索后,騰訊要等待下一個真實需求帶來的機會 。
時間進入2019年 。那是人工智能規?;瘧玫脑?,內外部業務都提出了對AI芯片的強烈訴求 。AI芯片 , 要不要做?
這個問題被提出來的時候,騰訊的管理層有過反對的聲音,擔心技術人員只是頭腦發熱,只是為了追逐熱點 。但同時 , 管理層也給了足夠的灰度 , 沒有明令禁止小團隊級別的探索 。
以小規模、低成本、特定應用場景的方式先行試水,成了大家的共識 。
云架構平臺部將第一款芯片敲定AI推理方向,取名“蓬萊” , 希望這款芯片能像中國古代神話里的海外仙山一樣,穩固地立于洶涌波濤之上 。
這支硬件突圍小分隊,也被正式命名為“蓬萊實驗室” 。

置身事內:騰訊的造芯之路

文章插圖


有了FPGA探索時積攢的經驗,蓬萊實驗室對硬件編程語言已經相當熟練 , 也在標準接口、總線等方面積累了一些平臺化的設計 。然而,兩者的研發要求,不可同日而語 。
如果說做FPGA是搭現成的積木,那么做芯片就是直接從伐木開始來著手來制造積木 。FPGA出了問題可以重新編程,而芯片只有一次流片機會,一旦出錯,所有的努力便付諸東流 。
此外, FPGA的資源是現成固定的 , 芯片的資源卻是由自己定義的 。一個字,就是要“摳”:用最小的資源做最大的事 。
芯片架構工程師Rick用“裝修”改“重建”來形容整個蓬萊項目 。一開始,團隊以為能把之前FPGA的技術較為簡單地轉成芯片 。做著做著發現,以為終歸只是以為——FPGA架構在芯片中能直接復用的并不多 , 團隊只能把原來的架構整個拆掉,重寫的代碼量高達85% 。

相關經驗推薦