2015年,正是人工智能在中國剛剛熱起來的時候。在這一年,百度智能駕駛的創(chuàng)始人余凱選擇離開百度,找了一群業(yè)界大牛,包括百度IDL主任架構(gòu)師黃暢、Facebook Fair創(chuàng)始人楊銘、前諾基亞副總裁方懿、前華為芯片架構(gòu)師周峰共同創(chuàng)辦了地平線機器人,要做中國產(chǎn)的人工智能芯片。這個團隊做出了很多世界級的研究成果,包括在2014年,作出世界第一款人臉檢測芯片,被80%的數(shù)碼相機的廠商,包括索尼、蘋果等在采用。科學實驗?zāi)K
人工智能已經(jīng)成為未來5~10年最具顛覆性的產(chǎn)業(yè)機會,從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),先后成長起來了CSCO、雅虎、谷歌、Facebook、蘋果這樣的科技巨頭。而人工智能時代,又有新的玩家可能會走上業(yè)界巔峰。2015年,正是人工智能在中國剛剛熱起來的時候。在這一年,百度智能駕駛的創(chuàng)始人余凱選擇離開百度,找了一群業(yè)界大牛,包括百度IDL主任架構(gòu)師黃暢、Facebook Fair創(chuàng)始人楊銘、前諾基亞副總裁方懿、前華為芯片架構(gòu)師周峰共同創(chuàng)辦了地平線機器人,要做中國產(chǎn)的人工智能芯片。這個團隊做出了很多世界級的研究成果,包括在2014年,作出世界第一款人臉檢測芯片,被80%的數(shù)碼相機的廠商,包括索尼、蘋果等在采用。地平線機器人技術(shù)創(chuàng)始人余凱
余凱表示,地平線的團隊很多來自互聯(lián)網(wǎng)軟件行業(yè),以前是做深度學習和機器學習,但是軟件到一定階段硬件成為了瓶頸,于是自己來做硬件。
成立兩年之后,余凱在今年年初的發(fā)布會上說出了地平線的目標:地平線將主攻ADAS和自動駕駛解決方案,同時要建設(shè)業(yè)界最大的駕駛數(shù)據(jù)庫,預(yù)計到201年數(shù)據(jù)變現(xiàn)業(yè)務(wù)將會變成千萬美金級別的生意。
在日前舉行的青城山中國IC生態(tài)高峰論壇上,余凱闡述了他眼中的人工智能產(chǎn)業(yè)以及芯片的未來趨勢。
人工智能芯片的工作原理?
科技行業(yè)的人都熟悉摩爾定律,但是我們今天要講的是新摩爾定律。由于人工智能的應(yīng)用、場景的驅(qū)動導(dǎo)致在軟件架構(gòu)方面會產(chǎn)生重構(gòu),使得應(yīng)用到人工智能的處理器被重新定義。更強大的工藝和更先進的性能在人工智能芯片領(lǐng)域不再奏效,人工智能芯片需要許多特殊的計算模式,比如卷積計算、低規(guī)計算。相比傳統(tǒng)的數(shù)據(jù)中心,人工智能芯片最大的不同是模仿人腦。人的大腦的處理速度是很慢的,但是為什么可以一心二用,可以進行復(fù)雜的問題思考,可以針對不同的特殊問題做特殊處理呢?舉一個例子:大腦對漢字的識別順序是不敏感的,上圖的字讀到最后才知道這個順序是亂的,為什么會這樣?大腦對一些特殊的問題,做了特殊的加速。在空間上是并行處理,所以對這個順序是不敏感的。由于人工智能芯片針對特定問題進行專門的算法及設(shè)計,使得芯片處理效率獲得兩到三個數(shù)量級的提升,這恰恰是最近幾年芯片業(yè)的一個趨勢。從2011年開始,Google采用CPU來做人工智能算法,到2012年百度用GPU,2014年百度和微軟用FPGA做深度神經(jīng)網(wǎng)絡(luò)的加速同時部署了上萬臺的服務(wù)器。2015年2016年地平線創(chuàng)立要做BPU,2016年谷歌說要做第一代TPU。從這里看到的趨勢就是人工智能應(yīng)用的牽引下,使得整個處理器不斷的重構(gòu)。從時間維度來看,我們看到PC到移動終端到IOT,對PC和移動的要求越來越高。所以處理器的趨勢是從中心到邊緣,以前很多人工智能的計算是在數(shù)據(jù)中心,以后大量的計算在邊緣計算。所以未來業(yè)界的發(fā)展趨勢是可以在移動終端進行本地的人工智能計算。而這些計算需要低延時、低功耗、低成本、數(shù)據(jù)安全性,相比傳統(tǒng)的處理器要求更高。第三個趨勢是邊緣的競賽是更高、更快、更強。比如特斯拉的車每輛車8~12個camera,探測距離和對像素解析越來越高,所以會不斷從720P到1080P到4K視頻,對于處理性能要求越來越高。
為何要使用專門的人工智能芯片?
“自動駕駛是一個比下圍棋更復(fù)雜的過程,下圍棋是只有兩個人在博弈,而自動駕駛是你跟道路環(huán)境博弈,這里面的決策導(dǎo)致的計算復(fù)雜度,是超出我們的想象,”余凱表示。這張圖是目前人工智能芯片的競爭格局。英偉達是最先收益的公司,在2年內(nèi)市值從100億美金變成了900億美金。相對而言英特爾的CPU對于人工智能應(yīng)用的處理效率太低。而專用的芯片如谷歌的TPU以及地平線的BPU都具有很大的優(yōu)勢??梢钥吹絅vidia的處理能力是最高的,但是效率其實并不怎么樣?,F(xiàn)在整個業(yè)界都在往效率方面提高。這個領(lǐng)域我們的處理器包括google的TPU都做到了。地平線的BPU邏輯是跟谷歌的TPU思路很像。與很多硬件公司不一樣,地平線特別注重軟件系統(tǒng),地平線就構(gòu)造了面向自動駕駛建設(shè)的軟件平臺Hugo,這是一個基于深度學習的系統(tǒng)。提供從感知一直到動態(tài)的決策,從端到端的深度學習,到后面面向增強學習的決策。
中國本土的人工智能芯片:盤古
這是地平線跟INTEL在今年CES上展示的基于處理器架構(gòu)的FPGA平臺,用8瓦功耗做到在復(fù)雜環(huán)境下超時幀的處理。目前沒有一款其它的處理器能支持實時的計算。與IP提供商芯原一起合作,地平線推出的盤古處理器應(yīng)用非常廣泛。包括處理的Mobile eye的軟件,跟Nivdia的芯片相比,盤古處理器可以針對中國的復(fù)雜路況進行處理。相比英偉達的處理器可以做到30個人臉的實時的抓拍,地平線可以做到250個人臉,而功耗是其十分之一。這是地平線的第二代芯片,要做到像素級的識別。對遮擋和形變,各種不規(guī)則的形狀和物體,都有非常準確的識別。據(jù)介紹,盤古第三代的處理器不光是像素級的,而是動態(tài)、3維的場景。這個對于自動駕駛的路徑規(guī)劃是至關(guān)重要的。包括在高速公路上,包括可行駛區(qū)域,包括車道線和車輛,包括在晚上的場景精確識別汽車,包括各種不規(guī)則的形狀的物體,都有非常準確的識別性。而這種超級復(fù)雜的情況里,大概用16毫秒就可以進行處理。