在最新出爐的《全球500強》(TOP500)超級計算機排行榜中,美國重新贏回超級計算機運算性能的龍頭地位,但能夠維持多久還有待觀察。而中國不僅在高性能系統(tǒng)數量方面持續(xù)領先,同時也在競爭最先推出每秒百萬兆浮點運算(exaflop;1018)計算機的排名。

最新的TOP500排名讓美國暫居上風,但也顯示中國在計算機技術方面持續(xù)精進。此外,這項最新排行榜發(fā)布時間,剛好就在中美兩國間的貿易戰(zhàn)升溫之際——引發(fā)兩國貿戰(zhàn)的部份原因就在于雙方對半導體政策的沖突。

從最新的TOP500排行榜還可看出,加速器繼續(xù)驅動著全世界最強大的計算機系統(tǒng),特別是英偉達(Nvidia)的圖像處理器(GPU)。除了Nvdia,英特爾(Intel)以及總部位于日本的加速器制造商Pezy Computing也在此排行榜中嶄露頭角。

在歷經沒有任何一臺系統(tǒng)擠進前四強的一年后,美國的超級計算機在這次的TOP500排行榜上分別名列第一和第三。美國橡樹嶺國家實驗室(Oak Ridge National Laboratory;ORNL)的“頂點”(Summit)超級計算機系統(tǒng)在Linpack基準檢驗上測得122.3 petaflops的運算效能,大幅領先之前中國“神威.太湖之光”(Sunway TaihuLight)的93 PFlops。

美國勞倫斯利弗莫爾國家實驗室(Lawrence Livermore National Laboratory;LLNL)的Sierra系統(tǒng),則以71.6 PFlops排名第三。Summit和Sierra都采用IBM Power 9處理器和Nvidia Tesla V100加速器,透過Mellanox Infiniband EDR互連4,300多個節(jié)點。

從Linpack的整體基準檢驗性能來看,美國的超級計算機以38.2%的整體表現(xiàn),超越中國的29.1%,重登排行首位。就在6個月前,雙方的排名位置還剛好相反。

如果采用新的高性能共軛梯度(HPCG)基準檢驗,測試結果還更加明確。Summit和Sierra系統(tǒng)分別以2.926 PFlops和1.79 PFlops領先在HPCG基準檢驗的排名。

相形之下,中國的太湖之光排名第六,成績?yōu)?.481 PFlops。中國第二大系統(tǒng)天河2號(Tianhe-2)則以0.038 PFlops排名第49。其他的中國系統(tǒng)使用該基準檢驗的排名均在100名之后。

Linpack長期以來一直被視為是相對粗糙的原始理論性能測量標準。相形之下,美國田納西大學教授Jack Dongarra說,HPCG使用的程序代碼則測量7種運算指標,“更能強調數據的動態(tài),特別是在許多實際應用中。”

cj

中國在全球最強大的超級計算機占有率不斷增加(來源:Top500.org)

盡管這次暫時在性能方面小輸,但中國目前在TOP500中擁有206臺系統(tǒng),較6個月前的202臺系統(tǒng)更多,持續(xù)在TOP500超級計算機數量方面領先。而美國這次創(chuàng)歷史新低僅有124臺超級計算機,較2017年11月時的145臺大幅減少。

此外,聯(lián)想(Lenovo)目前擁有最多臺計算機系統(tǒng)(119),這是中國供應商首次在這個項成績上脫穎而出。慧與科技(Hewlett Packard Enterprise;HPE)原本以122臺系統(tǒng)領先,目前則只有79臺。其后排名分別是浪潮集團(Inspur)、Cray和中科曙光(Sugon),分別擁有68、56和55套系統(tǒng)。

排名第六的IBM僅列出19臺系統(tǒng),但由于Summit和Sierra超級計算機的采用,使其擁有在Linpack整體性能排名中占19.9%。Cray和聯(lián)想則分別以16.5%和12%位居其后。

中國競逐Exaflop目標

Dongarra表示,雖然中國在這次最新的TOP500排行榜表現(xiàn)不如預期,但自2016年以來一直在加速下一階段的技術進展。預計中國將推出第一套在Linpack基準檢驗取得exaflop級運算效能的系統(tǒng),甚至可能比美國更提前一年。

目前,在中國的三支團隊正競相打造約512個節(jié)點的相對較小原型系統(tǒng),每個節(jié)點使用不同的架構。根據其開發(fā)結果可能決定哪一支團隊將獲得資金,打造最終的exaflop超級計算機,預計最早可能在2020年。

Dongarra表示,這三項計劃由中國服務器供貨商中科曙光以及天河、神威超級計算機背后的團隊為主導。多家大學院校、研究機構和國家超級計算機中心均參與了這項合作計劃。

中科曙光系統(tǒng)用于連接在6D環(huán)形網絡上的10,000多個節(jié)點,每個節(jié)點使用與AMD共同開發(fā)的x86處理器。預計天河團隊將采用同樣用于天河2A中的本土Matrix 2000版本,可能再增加基于Arm的處理器或加速器。神威原型則大致上沿用太湖之光的多核心途徑。

一年前,美國政府撥款了2.58億美元,計劃在2021年之前推出百萬兆級(exascale)的系統(tǒng)。Dongarra表示,中國和美國共同的目標都在于提供一個支持30GFlop/W效能和超過500Gbits的exaflop系統(tǒng)。

在全世界最強大的系統(tǒng)中有越來越多都使用了加速器——在目前TOP500系統(tǒng)中就有110臺系統(tǒng)采用加速器,比6個月前統(tǒng)計的101臺增加了。Nvidia GPU是迄今最普遍獲得采用的協(xié)同處理器,出現(xiàn)在其中的96臺系統(tǒng)中,其中包括前10大系統(tǒng)中就有5臺采用。

TOP500中有7臺系統(tǒng)使用了英特爾的Xeon Phi協(xié)同處理器,日本的4臺系統(tǒng)則使用相對較新的Pezy加速器。

有趣的是,在另一項測量節(jié)能效率最高的“全球前500強超級計算機”(Green 500)排行榜中,前三大系統(tǒng)都采用了Pezy加速器,而前十大的其余系統(tǒng)則使用Nvidia GPU作為加速器。

jsj

在最新的TOP500超級計算機排名中,Nvidia持續(xù)擴張其加速器芯片供應商的領先地位

Dongarra說:“Pezy系統(tǒng)采用液體冷卻方式——也就是說,整個系統(tǒng)浸沒在液體中[通常是3M的Fluorinert版本],這比透過板載空氣或水更具有節(jié)能效率。”

Top 500中的大多數系統(tǒng)都使用英特爾Xeon CPU作為主處理器。此外,目前有將近一半(247套系統(tǒng))都使用了10-Gbit/s以太網絡作為其互連,在6個月前這一數字為228。

TOP500中采用相對更昂貴的Infiniband作為互連的系統(tǒng),則從6個月前的163臺減少到目前約139臺。英特爾專有的Omni-Path互連在最新排行榜中則有38臺系統(tǒng),較6個月前的35臺略高。