越來越重要的GPU

在傳統GPU市場中,永遠都存在著對更佳視覺用戶體驗的追求,包括更高的顯示分辨率、更新率和更佳的像素效果,所以很多設備都要求采用更佳的GPU。而在部分新興領域,GPU IP的應用同樣不可避免,比如VR/AR的成功就依賴于高質量圖形性能,而且必須具備顯示功能。在這樣的領域中,沒有GPU是不行的,所以GPU應用延伸至這些行業(yè)也不足為奇。

但在Imagination業(yè)務開發(fā)高級工程經理Rys Sommefeldt看來,更加有趣的話題是GPU在IoT和可穿戴設備等領域中的應用。這些應用雖然也可能具有顯示性能,但其分辨率需求低,CPU就足以實現相應的性能。有些設備甚至可能都沒有顯示功能,比如海量的IoT產品和服務器應用等。

GPU的利用往往取決于以下兩個關鍵因素:功耗以及CPU無法滿足的計算性能需求。Rys Sommefeldt認為,對于具備顯示功能的可穿戴設備(例如智能手表),使用GPU可在滿足性能需求的同時降低設備功耗,從而改善可穿戴設備中最重要的因素—電池壽命;而對于沒有顯示功能的應用來說,使用GPU基本意味著設備有相應的計算需求,而這些需求與GPU架構和它的運行方式高度契合。在這些應用場景中,對像素的追求并不是使用GPU的主要目的。

“圖形密集的游戲、動畫和應用已經成為消費者移動體驗中的重要部分,視覺互動是他們與所依賴的移動終端之間的主要聯系界面,而圖形正是該界面的核心。”Qualcomm產品市場總監(jiān)王宇飛說,這正是為什么一體化設計的驍龍?zhí)幚砥髦邪珹dreno GPU的原因,因為它能加速復雜幾何結構的渲染,從而在低功耗下提供相片級逼真的圖形和豐富的用戶體驗。20161028-GPU-3Qualcomm 產品市場總監(jiān)王宇飛

集成于驍龍820處理器中的Adreno 530是Qualcomm迄今為止所設計的性能最佳的GPU,可用于智能手機、無人機、機器人等眾多領域。例如,Qualcomm驍龍TM650 IP攝像頭參考設計是一款完整的4K聯網攝像頭,支持64位異構計算,支持包括從以太網到X8 4G LTE的全面廣泛的連接,還支持先進的視頻分析,包括運動與面部檢測、面部識別、物體追蹤和Zeroth目標分類。

在另一個案例中,得益于驍龍800系列集成的Adreno視覺處理、Hexagon數字信號處理、Spectra計算機視覺和全新的慣性傳感器內核,Qualcomm在一款由驍龍820處理器支持的頭戴式顯示器(HMD)上首次展示了六自由度(6DOF)運動追蹤。

ARM多媒體處理部門GPU產品經理Espen Oybo對此給出的觀點是,此前,在設備中配置GPU并不認為是必需或是高性價比的,因為CPU本身可以處理一些簡單的圖形任務,而減少芯片體積和降低功耗顯得更加重要。然而,隨著GPU技術的不斷進步,人們發(fā)現GPU不僅能提供更佳的用戶體驗,也能釋放CPU的處理能力,使其更專注于關鍵任務,并顯著的減少了芯片體積、功耗和帶寬消耗。

Mali超低功耗GPU是ARM產品家族中的重要成員,能夠幫助設備在有限功耗條件下,完美的實現性能和功耗平衡,從而在可穿戴和物聯網市場獲得出色的圖形體驗。而全新推出的Mali-G71高性能GPU則采用新一代Bifrost架構,適用于AR/VR等需要高性能的領域。

除了圖形處理,GPU要不要嘗試一下通用計算?

Rys Sommefeldt在接受采訪時稱,承擔更多計算任務將是GPU發(fā)展的必然趨勢。相比于主要應用于通用目標計算上的傳統渲染場景,AR/VR帶來了更多整體渲染和視覺處理系統的需求。盡管它仍舊是圖形相關的通用目標計算,但已經不屬于傳統光柵化。因此,具備在單一渲染框架中混合GPU和計算負荷的GPU微架構,來滿足不同水平的需求,這一點非常重要。

應用在PowerVR Wizard GPU中的光線追蹤技術是Imagination的“殺手锏”之一,尤其適合于AR/VR等非傳統應用場景的使用。它可以將渲染完成的圖像根據人眼效果進行調整,并將之扭曲提供恰當的輸出,以適應特定的視覺系統—無論是鏡頭還是人眼。相比于在單獨GPU上運行同樣的負載,該技術具備在硬件光線追蹤器上運行扭曲平臺,并與GPU一道形成獨特的優(yōu)勢。20161028-GPU-1ARM多媒體處理部門GPU產品經理Espen Oybo

每個產品對GPU的要求都不盡相同,一些只需顯示簡單的用戶界面,而另一些產品則需要支持高端3D游戲的運行。有鑒于此,ARM Mali系列GPU滿足了低功耗可穿戴設備、高端智能手機和要求高性能且獨立的虛擬現實頭盔這三大類產品的不同需求,并通過在核心數量和配置選項方面的可擴展性,賦予合作伙伴在設計特定產品時實現功耗和效率的平衡。

“AR/VR的復雜性確實對移動SoC組件提出了很高的要求,我們希望通過Brifrost GPU架構來滿足這些要求。”Espen Oybo說盡管目前數量有限,但ARM已經看到一些采用通用圖形處理器(GPGPU)來進行任務處理的案例,這是因為在現有API和硬件條件下實現GPU和CPU之間的數據共享較為困難,很難淋漓盡致的發(fā)揮GPU的作用。但隨著OpenCL 2.0的出現,在高性能Bifrost架構中增加全系統一致性,將便于GPU和CPU通過高效的共享內存實現彼此“溝通”,讓GPU和CPU在各種規(guī)模計算任務中的合作更加高效,避免了CPU緩存清理的間接費用。

性能與功耗,兩者必須得兼

上述這些細分領域有些屬于快速變化的高存量市場,有些屬于擁有很大創(chuàng)新空間的新興市場,但它們都依賴于高性能GPU在最低功耗下的性能表現。換句話說,如何在帶給用戶最佳性能體驗的同時更兼顧低功耗特性,正成為各家公司實力比拼的焦點。

根據多年來提供GPU授權設計的經驗,Rys Sommefeldt說自己認識到很多時候市場所需要的與實際創(chuàng)造出來的產品并不一致。“每個人都希望看到一定的改變,即使只是很小的變化,但我們又無法準確預測客戶所期望的目標性能水平、功耗和領域,這就是這個行業(yè)的本質。所以,可擴展的、模塊化的可調節(jié)GPU設計是必須的。”

對于GPU來說,最關鍵的可擴展因素永遠是性能,例如浮點數量和GPU可處理的像素數量。因此,通過在設計中提供多種水平的性能,用戶就有機會以最少的精力和時間來應對市場中新的配置需求,并使自己得以跳出原本的領域和產品計劃。

Imagination最新推出的塊狀延遲渲染微架構是專為在渲染過程中降低工作量而設計的。該架構不對隱藏的像素內容進行著色內容處理,意味著無需耗費電源來運行ALU和獲取寄存器組,從而帶來了功耗方面的大幅降低;也無需提供紋理模型和寫出用于中繼緩沖或最終圖形的像素,極大地節(jié)省了存儲需求。20161028-GPU-2Imagination業(yè)務開發(fā)高級工程經理Rys Sommefeldt

“就算是不靠電池供電工作的終端,也需要出于散熱和工業(yè)設計的考慮去盡量減小功耗。” 王宇飛表示,Adreno GPU的關注點一直是要提供每一份能量(每毫瓦)的絕對最佳性能,這也是所有移動市場細分領域的根本推動力。最新的Adreno 5xx GPU既支持Khronos最新圖形API Vulkan,能在CPU低消耗狀況下實現高級圖形內容,也支持最新計算API OpenCL 2.0 FP的所有特性,以應對各種GPGPU應用。

幫助合作伙伴在功耗和效能間取得適宜其產品的最佳平衡,對于ARM而言是至關重要的。最初設計時,Mali-400是首款配置Mali-200 GPU的多核GPU,市場的反饋很快證明了這個策略是正確的。在隨后的設計中,基于高端Midgard架構的GPU,諸如Mali-T880,可以從單核拓展至16核,而全新的Mali-G71基于Bifrost架構,更能夠支持32核。

當今最高端的智能手機已經實現了12個內核的配置,用以支持AR/VR等新興應用,它們的嚴苛要求正在不斷推動電源功耗突破極限。所以Espen Oybo認為,額外的可用核是非常有必要的,它不僅能輕松的支持高端應用,同時也為其應對日益增加的內容復雜性預留了空間。除了數量外,內核在配置方面還有很多靈活空間,如何在這一過程中實現功率、性能和效能的平衡,從而能夠提供另一個層面的可定制選項,幫助用戶根據自己的市場需求進行自由調整,也是非常關鍵的要素。

設計增值,才能活下去

GPU IP屬于設計復雜,離開生態(tài)系統就無法生存的IP類型,所有受訪者也均對此表示認可。王宇飛說,Qualcomm的主要目標之一就是為移動開發(fā)者提供盡可能多的價值。通過與生態(tài)系統中的合作伙伴密切合作,以保證中間件引擎是高效的,且針對Adreno實現優(yōu)化。高通還為開發(fā)者們開發(fā)資源,縮短他們在Adreno GPU上的開發(fā)時間:既有像驍龍Profiler這樣特性豐富的工具,在開發(fā)周期的所有方面提供幫助;也有SDK來幫助開發(fā)者獲得先進的技術,驍龍VR SDK就是一個例子,能讓開發(fā)者們利用它開發(fā)HMD和面向專用HMD的內容。

近年來,Imagination在為客戶提供硬件、軟件和市場方面的產品支持上也取得了巨大的成就。包括提供專門的硬件設計團隊與客戶、晶圓代工長溝通合作,以確保實現最佳的片上性能;戰(zhàn)略軟件團隊與客戶和開發(fā)者共同創(chuàng)建可為PowerVR提供明確策略優(yōu)勢的軟件產品;細分市場營銷專家充分理解客戶的目標應用細節(jié),展示PowerVR在相應領域的巨大價值等。

ARM是一家依托龐大生態(tài)系統生存的公司,這一特點無論對于GPU還是CPU來說都至關重要。一方面,ARM與EDA合作伙伴和代工廠緊密協作,幫助芯片伙伴便捷的實施GPU。另一方面,通過軟件生態(tài)系統為程序員提供最好的Mali體驗。“正因我們擁有如此龐大的生態(tài)系統(包括實施和軟件),ARM的合作伙伴們能在眾多生態(tài)系統所提供的不同選擇中自由選取,從而實現他們產品的差異化。”Espen Oybo說。