過去四年中,計算領域發(fā)生了令人驚嘆的發(fā)展。以ARM為例,在已經出貨的1000億顆基于ARM的芯片中,有500億顆是由ARM的合作伙伴在2013年到2017年間完成出貨的。“這個數字充分反映了整個行業(yè)目前對于更多計算的需求。”ARM副總裁暨計算產品事業(yè)部總經理Nandan Nayampally說,ARM的成功緣于良好的生態(tài)系統(tǒng)和自身架構的高拓展性,能夠覆蓋從傳感器到服務器的廣泛應用,他們將其稱之為全面計算(Total Computing)。

20170405-ARM-1Nandan Nayampally預計其合作伙伴將在2021年完成下一個1000億顆基于ARM的芯片出貨,在很大程度上這將歸功于人工智能在人們日常生活中的廣泛應用。“未來,人工智能將無處不在,數據處理能力不能完全依賴于云端,設備本身也要具有人工智能的計算能力,功耗還要更低。”為此,ARM在big.LITTLE技術基礎之上,推出了全新的DynamIQ技術。

與其將DynamIQ稱之為一種技術,倒不如將其稱之為“微架構”。ARM對DynamIQ給出的官方定義是:作為未來ARM Cortex-A系列處理器的基礎,DynamIQ代表了多核處理設計行業(yè)的轉折點,其靈活多樣性將重新定義更多類別設備的多核體驗,覆蓋從端到云的安全、通用平臺。該技術未來將被廣泛應用于汽車、家庭以及各種互聯設備中,這些設備所產生的以澤字節(jié)(ZB,一澤字節(jié)大約等于1萬億GB)為計算單位的數據,會在云端或者設備端被用于機器學習,以實現更先進的人工智能,從而帶來更自然、更直觀的用戶體驗。

2005年,ARM在業(yè)界推出了革新式的產品—多核ARM11,第一次實現了在單一群集中支持四個內核用于嵌入式系統(tǒng);6年后,big.LITTLE技術問世,為主要計算設備的多

核特性帶來了革新。但它的弊端在于不能夠對單一計算集群上的大小核進行配置,例如就無法實現1+3或者1+7的SoC設計配置,這對異構計算和具有人工智能的設備來說是非常不利的。而最新的DynamIQ微架構則突破了這一瓶頸,被視作big.LITTLE技術的一次重要演進。

ARM給出的相關數據顯示,第一代采用DynamIQ技術的Cortex-A系列處理器在優(yōu)化應用后,將可實現比基于Cortex-A73的設備高50倍的人工智能性能,并最多可提升10倍CPU與SoC上指定硬件加速器之間的反應速度。究其原因,是因為在新架構中,每個核都可以有各自不同的性能特性,SoC設計者可以通過對每一個處理器進行獨立的頻率控制,高效地在不同任務間切換最合適的處理器。同時,全新設計的內存子系統(tǒng)也幫助實現了更快的數據讀取和全新的節(jié)能特性。

考慮到DynamIQ微架構允許在單個群集中最多部署8個內核,Nayampally更看好其在企業(yè)級應用中的潛力。他解釋說,由于硬件尺寸和軟件線程的限制,移動應用方面應該不再需要超過8個核以上的計算能力了,單一群集已經足夠。但企業(yè)級應用對于內存容量、I/O吞吐量和帶寬是有高要求的,而DynamIQ正好解決了這一問題。接下來,SoC設計人員完全可以利用Corelink和Cache Coherent Interconnect等技術形成3-8個集群的多核設計,充分釋放其強大的計算能力,從而為機器學習和人工智能應用帶來更快的響應速度。

那么,DynamIQ技術能不能夠幫助ARM在服務器芯片市場做得更好?“這是個好問題,但我們可能還得再等等。”Nayampally回應稱,目前的云端服務器通常采用多芯片架構,因此通用型處理器加專用AI加速器模塊的組合,可能會是更佳的選擇,DynamIQ的優(yōu)勢會更多體現在青睞片上系統(tǒng)設計的智能手機等設備中。當然,他也特別強調了安全,比如DynamIQ微架構除了能為ADAS解決方案帶來更快的響應速度外,也能同時增強安全性,確保合作伙伴能夠設計ASIL-D合規(guī)系統(tǒng),即使在故障情況下仍可以快速恢復并能夠安全運行。

在回答媒體“一些專用的人工智能芯片(SoC/ASIC)是否會對DynamIQ帶來挑戰(zhàn)?”這一問題時,Nayampally稱,人工智能技術目前還在快速的演進發(fā)展中,包含了各種各樣的多元化算法,場景應用也很多元化。DynamIQ更強調兩方面的價值:一是能夠實現通用處理器在AI性能方面的提升,二是能夠實現通用處理器和專用加速模塊之間快速的響應和連接。所以,整個片上系統(tǒng)本身針對AI的性能就能夠得到提升,這對那些體積受限的小設備而言是非常重要的。言外之意,ARM新架構與專用AI加速器模塊的組合,有可能是未來SoC設計比較好的選擇之一。

DynamIQ技術將在今年晚些時候正式推出,2018年將率先被用于智能手機、汽車以及其它嵌入式系統(tǒng)中。