隨著大數(shù)據(jù)和云計算的發(fā)展,傳統(tǒng)的計算模式并不能很好地處理由此帶來的應(yīng)用負載,服務(wù)器的性能、功耗和空間等受到了很大的挑戰(zhàn)。CPU+FPGA等異構(gòu)計算正成為行業(yè)重要的發(fā)展趨勢。我們也看到,近來各芯片巨頭在服務(wù)器市場的合縱連橫,動作頻頻,對中國市場更是視若珍寶。未來在服務(wù)器市場各廠商的較量將不可避免,但大家的方向又是如此一致,高性能、低功耗、省空間的服務(wù)器才能滿足日益增長的大數(shù)據(jù)、云計算等新應(yīng)用領(lǐng)域的需求。
三大陣營在服務(wù)器領(lǐng)域的動向 電子制作模塊
英特爾方面:
2014年6月,英特爾宣布將業(yè)界領(lǐng)先的Xeon處理器和FPGA封裝到一個單一結(jié)構(gòu)中,其插槽和標(biāo)準(zhǔn)的Xeon E5處理器兼容。FPGA將能為英特爾的客戶提供一個更強大的算法執(zhí)行能力和更高的性能,能給基于服務(wù)器的應(yīng)用帶來20倍以上的加速。
2015年11月,英特爾表示首款同時采用Intel Xeon處理器和Altera FPGA的芯片將于2016年第一季度發(fā)布。之前FPGA沒有被廣泛應(yīng)用于海量級數(shù)據(jù)中心的服務(wù)器。英特爾預(yù)計,截止2020年FPGA將會在30%的數(shù)據(jù)中心服務(wù)器中得以應(yīng)用。
2016年1月21日,清華大學(xué)、英特爾公司和瀾起科技(上海)有限公司在北京正式簽署協(xié)議,宣布聯(lián)手研發(fā)融合可重構(gòu)計算和英特爾x86架構(gòu)技術(shù)的新型通用CPU,以滿足市場和用戶需求。
IBM方面:
2013年10月宣布成立全球OpenPOWER基金會,致力于企業(yè)服務(wù)器生態(tài)系統(tǒng)的開放式創(chuàng)新。基金會發(fā)起成員僅有5家公司,包括IBM、谷歌等,而到現(xiàn)在為止已經(jīng)有超過150個成員,其中20個成員在中國。基于Power處理器的強大性能,谷歌在2016年將會采用Power處理器進行其主板的規(guī)格定義,運行Linux所有的應(yīng)用程序。
2015年7月,OpenPOWER基金會宣布正式推出全新硬件加速ISV支持計劃,為本地ISV(獨立軟件開發(fā)商)免費提供基于RedPOWER服務(wù)器以及賽靈思FPGA的云端開發(fā)及測試環(huán)境,幫助ISV提升大數(shù)據(jù)、云計算等新興技術(shù)研發(fā)能力。
9月16日成立第二代分布式計算聯(lián)盟,構(gòu)建了由處理器技術(shù)廠商、服務(wù)器廠商、應(yīng)用加速器廠商、ISV和行業(yè)用戶等組成的生態(tài)鏈,以推動以應(yīng)用加速器技術(shù)為重要特征的新一代計算模式的技術(shù)和應(yīng)用的發(fā)展。2015年底,IBM與OpenHW開源硬件社區(qū)、Xilinx公司聯(lián)合啟動了首屆IBM-Xilinx異構(gòu)計算大賽,共同推動第二代分布式計算的落地應(yīng)用。
ARM陣營及高通:
ARM作為服務(wù)器領(lǐng)域的后來者,一直很努力地證明自己。例如巴塞羅那超級計算中心采用ARM架構(gòu)服務(wù)器,就是ARM在服務(wù)器方面很好的例證。ARM還與美國的一些機構(gòu)做有關(guān)超級計算的事情。全球知名的提供云服務(wù)的廠商和服務(wù)供應(yīng)商都在使用ARM技術(shù)相關(guān)的一些服務(wù)器技術(shù)。ARM的眾多芯片合作伙伴包括海思、博通、Cavium、AppliedMicro以及系統(tǒng)商GIGABYTE、HP等。
2015年10月,最近高通宣布正將一個基于新的系統(tǒng)芯片開發(fā)平臺送交頂級服務(wù)器制造商試用,從此正式進入服務(wù)器市場。這是高通與賽靈思、Mellanox公司合作做出了一款24核心的ARM服務(wù)器芯片。
2016年1月,AMD正式推出首款基于ARM架構(gòu)的處理器Opteron A1100。
應(yīng)對服務(wù)器的挑戰(zhàn),不能沒有FPGA
“云計算和大數(shù)據(jù)帶來了很多新型負載,如分布式數(shù)據(jù)庫、鍵值存儲、視頻圖像處理、認(rèn)知計算、機器學(xué)習(xí)、基因計算等應(yīng)用。傳統(tǒng)的計算模式無法以較低功耗滿足這些應(yīng)用對于服務(wù)器吞吐量和時延的要求。” IBM大中華區(qū)科技戰(zhàn)略合作總經(jīng)理姜錫岫表示。
IBM大中華區(qū)科技戰(zhàn)略合作總經(jīng)理姜錫岫
Intel可編程解決方案事業(yè)部數(shù)據(jù)中心架構(gòu)師Mike Strickland 認(rèn)為計算和存儲領(lǐng)域出現(xiàn)了新的發(fā)展趨勢,需要一個全新模型來優(yōu)化效率、成本以及功耗。CPU無法獨自處理所有工作負載,而GPGPU功耗太大。FPGA可以應(yīng)對的趨勢包括:在業(yè)務(wù)中經(jīng)濟地支持云計算和虛擬化(同時包括服務(wù)器和存儲)。
另外一個動向則是,在云計算中采用分布式存儲和高速緩存,并通過融合降低功耗和提高密度。我們的客戶極為關(guān)心閃存技術(shù)在隨機訪問條件下提供的引人注目的單位成本每秒I/O操作次數(shù) (IOPS/$),以及它的低功耗特性。而且在存儲市場上也可以提供采用閃存技術(shù)的高速緩存和DIMM。 借助FPGA,您還可以提供中間存儲技術(shù),也能夠推動新的云架構(gòu)。這方面的一個例子是,Intel為Grantley提供了35個定制Xeons。
我們還非??春密浖x數(shù)據(jù)中心(SDDC),可以將資源(計算、網(wǎng)絡(luò)、存儲)池化,并自動進行配置和監(jiān)控。Intel Xeon + FPGA多芯片封裝(MCP) & 微軟必應(yīng)支持FPGA等公開發(fā)布都是這方面的實例。
芯片廠商力推CPU+FPGA異構(gòu)計算
的確,服務(wù)器芯片廠商都在采用CPU+FPGA的模式提升性能,這將是一個發(fā)展趨勢。
針對這種CPU+FPGA體系結(jié)構(gòu),Mike Strickland對國際電子商情記者表示,當(dāng)前我們還無法對芯片做過多的評論,但是總體上看優(yōu)點包括:同時擁有PCIe和QPI接口使得帶寬更大,延時更低;QPI更容易實現(xiàn)OpenCL編程模型;而其封裝與普通的Xeon CPU插槽兼容因此易于部署實現(xiàn)。FPGA加速對數(shù)據(jù)中心的貢獻主要集中在三個方面:
算法加速:仿真、CNN、識別、圖像處理、重建包括:并行/流水線處理、位操作、匹配;靈活的數(shù)據(jù)通路和存儲器訪問,邏輯恰好滿足需求,硬核浮點;我們以最低功耗實現(xiàn)了最佳性能。
網(wǎng)絡(luò)加速:虛擬化、過濾/分析、壓縮、兼容、DPI
數(shù)據(jù)訪問加速:過濾/分析、壓縮、加密、閃存高速緩存管理;O/S旁路
人們會非常關(guān)注業(yè)界領(lǐng)先的芯片制造商(Intel)采用一流的FPGA技術(shù)——我們的優(yōu)勢包括:率先進入下一工藝尺寸節(jié)點,通過CPU與FPGA更緊密的集成而實現(xiàn)更好的性能和更低的功耗?;贗ntel 14nm工藝的Intel FPGA也增強了云計算能力,比如硬核浮點提高云中圖像搜索等。而從FPGA創(chuàng)新的角度看,與以前的FPGA系列相比,采用Intel 14nm工藝開發(fā)的Stratix 10 FPGA的Hyperflex新體系結(jié)構(gòu),時鐘速率提高了近2倍,而且功耗更低。
IBM也與領(lǐng)先的FPGA企業(yè)Xilinx合作,利用IBM POWER和OpenPOWER處理器優(yōu)異的性能和先進的CAPI(Coherent Accelerator Processor Interface,一致性處理器加速器接口)技術(shù),積極化解云計算大數(shù)據(jù)應(yīng)用給服務(wù)器帶來的挑戰(zhàn)。
姜錫岫表示,利用OpenPOWER處理器先進的CAPI技術(shù),F(xiàn)PGA能實現(xiàn)與處理器的高效連接,從而充分利用FPGA可編程硬件強大的硬件加速能力,實現(xiàn)軟硬結(jié)合的異構(gòu)計算,大幅提高對數(shù)據(jù)應(yīng)用的處理性能:根據(jù)應(yīng)用的不同可以實現(xiàn)十倍甚至百倍的性能增速。
由于FPGA的低功耗特性(與CPU相比),這種解決方案能夠大幅降低整體系統(tǒng)的功耗,減少服務(wù)器數(shù)量及其占用的數(shù)據(jù)中心寶貴空間。
CPU+FPGA方案降低了系統(tǒng)功耗,大幅提升了應(yīng)用性能,使得云計算和大數(shù)據(jù)等新型應(yīng)用負載的高吞吐量和低延時需求得到了滿足,從而極大促進了相關(guān)應(yīng)用的發(fā)展。
IBM的POWER處理器和OpenPOWER處理器通過高效的CAPI接口將FPGA與CPU連接起來。這種解決方案有幾個明顯的好處:
首先是這個方案目前就可以用。CAPI+FPGA的方案現(xiàn)在就是Ready的,也不需要用戶對現(xiàn)有的服務(wù)器、處理器做任何調(diào)整,將FPGA板卡插到通用的PCIe插槽上即可使用。降低了用戶部署的成本和時間。
由于CAPI先進的技術(shù)特性,CAPI+FPGA方案很好地解決了對處理器內(nèi)編程地址空間尋址的問題,降低了編程難度。
通過POWER和OpenPOWER處理器的CAPI接口與FPGA連接,擴展FPGA卡的數(shù)量(PCIe)取決于用戶的需求,這樣比較靈活,比將接口嵌入進CPU的方案具有更大的靈活性。
云計算等新應(yīng)用正改變服務(wù)器市場
數(shù)據(jù)顯示,到2018年時,云計算將占服務(wù)器市場的40%,與2013年比增長110%;到2020年時,云計算有機會達到150億美元的規(guī)模。
高通的數(shù)據(jù)中心事業(yè)部高級副總裁Anand Chandrasekher表示,“服務(wù)器行業(yè)正在發(fā)生各種我從未見過的變化,其根本原因是云計算。云計算在不斷增長,是一個全球性的現(xiàn)象,在所有的工作負載領(lǐng)域都是這樣。服務(wù)器市場業(yè)務(wù)正在經(jīng)歷一次海嘯,是新玩家進入該市場的好時機。如果能拿出一個低功耗解決方案,會非常有吸引力。”
姜錫岫認(rèn)為服務(wù)器市場正經(jīng)歷著巨大的變革,未來服務(wù)器市場的增長需求很大一部分來自云計算、移動互聯(lián)網(wǎng)、大數(shù)據(jù)等新型應(yīng)用,這些應(yīng)用的爆發(fā)式增長不但給服務(wù)器和數(shù)據(jù)中心技術(shù)帶來了新的挑戰(zhàn),也給相關(guān)企業(yè)抓住歷史機遇彎道超車提供了舞臺。以CPU+FPGA等異構(gòu)計算為主要特征的第二代分布式計算正在成為行業(yè)的重要發(fā)展趨勢,能夠抓住計算技術(shù)變革的歷史機遇將有機會在新一輪的信息革命大潮中爭得先機。
我們知道2015底英特爾完成167億美元收購Altera,Altera將作為英特爾的新業(yè)務(wù)部門即可編程解決方案事業(yè)部進行運營。開發(fā)規(guī)劃包括集成解決方案和分立FPGA等。被Intel收購后,Altera不會再與ARM在服務(wù)器市場上展開合作,是這樣嗎?Mike Strickland 表示,Intel計劃支持和開發(fā)Altera基于ARM的產(chǎn)品線,目標(biāo)是提供更優(yōu)的體系結(jié)構(gòu)解決方案,以更好的滿足客戶的需求。
Mike Strickland還表示,我們的策略是繼續(xù)與微軟的必應(yīng)和Azure團隊以及其他的全球搜索和網(wǎng)絡(luò)提供商合作,他們需要大規(guī)模數(shù)據(jù)中心,通過基于FPGA的服務(wù)器降低成本,卸載CPU,充分發(fā)揮虛擬化以及轉(zhuǎn)向SDDC方法的優(yōu)勢。
服務(wù)器芯片巨頭一致看好中國市場。預(yù)計到2020年服務(wù)器芯片市場的規(guī)模將達到150億美元,其中有60億美元來自中國市場,中國也成為全世界數(shù)據(jù)中心技術(shù)的第二大市場,同時也是這個領(lǐng)域增長最快的一個市場。
由云計算和大數(shù)據(jù)帶來的市場機會使得服務(wù)器市場的競爭格局發(fā)生著微妙變化。無論是X86架構(gòu),還是POWER架構(gòu)以及ARM架構(gòu),都在各自的生態(tài)圈中力拓服務(wù)器市場。IBM憑借高性能的POWER以開放的心態(tài)集結(jié)更多的合作伙伴,以低功耗占優(yōu)的ARM架構(gòu)以及生態(tài)圈伙伴也奮起直追。他們無不挑戰(zhàn)該市場的絕對霸主英特爾的地位,盡管影響力還不足夠,但大家都看準(zhǔn)了移動互聯(lián)、云計算等帶來的有可能改寫服務(wù)器格局的契機。而英特爾近來的收購或者合作之舉也無疑在鞏固其優(yōu)勢地位。隨著三大陣營以CPU+FPGA等異構(gòu)計算為主,更緊密地與業(yè)界合作,未來服務(wù)器領(lǐng)域尤其是中國市場的競爭將更趨激烈
。