偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經歷


偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經歷

文章插圖

偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經歷

文章插圖

40年前偶然走上程序員道路的Jack Dongarra , 是今年的圖靈獎得主 。
獎項設立機構美國計算機協會(ACM)表示,Dongarra的算法與軟件成果推動了高性能計算(HPC)的發展 。
正是他在數值算法和庫上的開創性貢獻,使得過去40年里,高性能計算軟件追上了指數級硬件發展的節奏 。
偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經歷

文章插圖



這位老爺子,還弄出了個TOP500的超算排行榜,每年兩次幫超算跑跑分啥的 。
剛剛,今年71歲的老爺子還參加了中國計算機學會舉辦的CNCC 2022 , 做了次特邀報告演講 。
演講的主題,也與高性能計算息息相關 。
為什么人類需要超算?
高性能計算,是指通過聚合計算能力來提供比傳統計算機和服務器更強大的計算性能 。
再通俗點來講,就是用超級計算機來并行處理復雜問題 。
為什么要用上超算?Jack Dongarra舉了個例子 。
他提到,科學和工程都通過理論和實驗來推進,但兩者常常遭遇限制,尤其是實驗部分 。
會遭遇的“攔路虎”非常多,有可能是制造儀器很難搞,有可能是所觀察的事物發展太過迅猛,又或者是沒有辦法在實驗室里完成實驗 。
比如,假設有兩個星系會發生碰撞,這個過程會是什么?
與其只靠漫長的觀測 , 不如在計算機上進行仿真模擬 。
計算科學增強著當下的種種理論和實驗,最快的超級計算機能為仿真模擬提供非常好的保真度和準確性,更重要的是 , 超算能夠覆蓋和支持仿真模擬過程中巨大的計算量 。
這就不得不提到超算的結構 。
超算由一堆CPU、GPU等異構芯片提供算力 。
此外,它擁有一個高度并行的系統和分布式內存 。為超算編程時,會用到MPI(用于編寫并行計算機的跨語言通訊協議),以及用于共享內存并行系統的多線程程序設計方案OpenMP 。
美國橡樹嶺國家實驗室的超級計算機Frontier取得了斐然的成績:在2022年第59屆國際超算Top500名單中位居榜首 。
Frontier大約有800萬個核,9408個節點,它在負載下的電力是21兆瓦 。
Jack Dongarra打了個頑皮的比方 。
他說,在美國,如果他家用掉1兆瓦的電力,一年得給電力公司繳納100萬美元的電費 。
也就是說,單是電費,Frontier一年就要花掉2100萬美元呢!
偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經歷

文章插圖



Frontier的最高性能是每秒2x1018次浮點運算 。
這是一個難以置信的計算量 。如果現在全球所有人停下手里的工作,開始每秒做一次計算,晝夜不停、不眠不休地計算四年,才能達到1018次浮點運算 。然而,這樣龐大的運算量 , 超算一秒就能完成 。
除了計算,超算還涉及異構數據在不同芯片間的搬運 , Jack Dongarra稱之為移動數據(data moving)
Jack Dongarra指出,現在的超算對已經對浮點運算做了大量優化,移動數據的成本已經比計算成本還高 。
降低移動數據的成本,將成為未來重點的研究方向 。
此外 , AI for Science已經在很多科學領域發揮重要作用,譬如DeepMind旗下的Alpha系列,如Alpha Zero、AlphaStar、AlphaTensor……
今年推出的Alphafold2,其蛋白質結構數據庫揭開了蛋白質宇宙,有人因此戲稱“結構生物學家要失業了” 。

相關經驗推薦