請看《國際電子商情》記者第一時(shí)間為您帶來魏教授的現(xiàn)場演講實(shí)錄:20170714-ICai-2人工智能是一個(gè)老的新話題。之所以現(xiàn)在人工智能的話題又火起來,是因?yàn)閮蓚€(gè)事情,谷歌研發(fā)的阿爾法Go和世界兩位頂尖棋手的對弈。第一件事是與韓國棋手李世的對弈,李世石成為唯一戰(zhàn)勝阿爾法Go的棋手。半年后,世界排名第一的柯潔說李世石不行,我來下。結(jié)果是0:3,柯潔痛哭流涕。所以這兩件事對人工智能的推動(dòng)非常重要。

我們很多人認(rèn)為阿爾法狗代表人工智能取代人腦的重要證據(jù)。這個(gè)事情沒有這么悲觀,最開始阿爾法狗是希望在沒有人類干預(yù)的情況下戰(zhàn)勝人類棋手。但其實(shí)在兩場棋局中還是有人干預(yù)。還有一件事是,IBM的人工智能計(jì)算機(jī)做了一場知識競賽。上個(gè)月我去了一趟IBM看了一下這個(gè)計(jì)算機(jī),它的智力遠(yuǎn)遠(yuǎn)高于阿爾法狗。20170714-ICai-3一個(gè)是人工智能的初創(chuàng)企業(yè)在大大增加,第二個(gè)是人工智能企業(yè)的融資額達(dá)到了50億美元。我們集成電路除了并購之外,要想在初創(chuàng)企業(yè)融資增速非常快。所以可以看到風(fēng)險(xiǎn)投資很活躍,說明這個(gè)行業(yè)是在上升期。

人工智能最重要的是預(yù)測未來

20170714-ICai-4盡管如此,人工智能是老的新話題。因?yàn)樯蟼€(gè)世紀(jì)50年代人工智能就開始提出了。主要是為了讓機(jī)器展示智能模仿認(rèn)知功能,如感知、推理、學(xué)習(xí)、及問題解決。1980年出現(xiàn)了機(jī)器學(xué)習(xí),這是實(shí)現(xiàn)人工智能的主要途徑,主要是學(xué)習(xí)并開展數(shù)據(jù)驅(qū)動(dòng)的經(jīng)驗(yàn)預(yù)測。2010年出現(xiàn)了深度學(xué)習(xí),這是機(jī)器學(xué)習(xí)的一個(gè)分支,他是要模仿人腦通過人工神經(jīng)網(wǎng)絡(luò)獲得高階學(xué)習(xí)機(jī)會(huì)。

傳統(tǒng)的數(shù)據(jù)挖掘主要是描述發(fā)生了什么,比如問一個(gè)問題,哪個(gè)產(chǎn)品在過去一年最賺錢,這個(gè)是最容易統(tǒng)計(jì)的。還有一個(gè)機(jī)器學(xué)習(xí)是預(yù)測,通過外推數(shù)據(jù)以預(yù)測行為和事件,是通過概率來分析。比如某個(gè)客戶在未來一年中最可能買哪個(gè)產(chǎn)品?而到了最后的一個(gè)環(huán)節(jié)就是決策,主要是領(lǐng)先的數(shù)據(jù)被互聯(lián)網(wǎng)公司應(yīng)用。比如為了最大化下一年的銷售,產(chǎn)品的最佳售價(jià)是多少?

通過這三個(gè)清晰的問題可以看到三者之間的差距。所以人工智能最重要的是要預(yù)測未來,所以我們在對人工智能的理解要有正確的認(rèn)識。

人工智能的基礎(chǔ)和根本是芯片

20170714-ICai-5目前非常多的初創(chuàng)企業(yè)進(jìn)入人工智能領(lǐng)域,機(jī)器學(xué)習(xí)的創(chuàng)業(yè)空間正在擁擠起來。20170714-ICai-6工欲善其事必先利其器,人工智能的根本是智能芯片。離開芯片你沒辦法找到第二種人工智能的實(shí)現(xiàn)方法,未來的至少10年內(nèi)你找不到可替代芯片的方法。如果你能找到,那我恭喜你。

從計(jì)算能力看,目前主要的人工智能芯片是GPU。GPU的計(jì)算能力比CPU大概提高了5倍,存儲(chǔ)能力是2倍到4倍。目前Intel占了71%的市場,Nvidia占了16%。Nvidia在分立式GPU上占據(jù)主要優(yōu)勢。而人工智能主要應(yīng)用于分立式GPU。但是目前任何一種方案無法用于本地移動(dòng)終端,因?yàn)楣奶蟆?img src="http://assets-stash.oss-cn-shanghai.aliyuncs.com/f9a52e6d-3f54-445a-a481-f52890779831.png" alt="20170714-ICai-7" style="box-sizing: border-box; border: 1px solid rgb(233, 233, 233); vertical-align: middle; display: block; margin: 1.97em auto 0.97em; max-width: 93.75%;" />還有一種芯片方案是通過FPGA,與純CPU/SW相比性能提高5~10倍,功耗下降到了GPU環(huán)境的20%。

另一種是Google提出的TPU概念,與GPU相比,用較低的精度提高性能,功耗下降到GPU環(huán)境的10%。20170714-ICai-8還有一個(gè)是NeuRAM,我個(gè)人認(rèn)為這個(gè)學(xué)習(xí)方式很可能是未來的發(fā)展方向。還有一個(gè)是Micron,用的是MISD的并行架構(gòu),DRAM的工藝,這個(gè)開始有點(diǎn)意思。

類人腦芯片才是最終方向?

20170714-ICai-9我更愿意介紹是IBM的TrueNorth。這樣一顆芯片,我在IBM訪問的時(shí)候有很大的震撼。這個(gè)完全仿照大腦的做法,能力相當(dāng)高,功耗只有65毫瓦,它的學(xué)習(xí)能力極強(qiáng)。20170714-ICai-10下一步IBM的最終目標(biāo)是希望建立一個(gè)完全仿照大腦的類鬧計(jì)算機(jī)。如果這能實(shí)現(xiàn),成本不高,這有可能真正實(shí)現(xiàn)所謂人形機(jī)器人。今后對我們進(jìn)入老齡化的時(shí)代影響是非常大的。這個(gè)方面會(huì)實(shí)現(xiàn)最大的計(jì)算量。20170714-ICai-11談到智能芯片,什么是智能芯片呢?是不是IBM的這個(gè)就是智能芯片?首先我們要看如何來理解智能或者智慧?智慧是人特有的一項(xiàng)東西,它包括思考和解決問題的能力。20170714-ICai-12人類的智能整個(gè)環(huán)節(jié)包括感知、傳輸、存儲(chǔ)、處理、決策、傳輸、執(zhí)行。決策這個(gè)環(huán)節(jié)又分為分休、計(jì)算、判斷、經(jīng)驗(yàn)知識。前后兩端從感知、傳輸?shù)胶蠖说膫鬏敗?zhí)行都不是智慧。而中間的才算是智慧。20170714-ICai-13首先我們看人類大腦,140億個(gè)神經(jīng)元。IBM要做的類腦芯片大概100多億個(gè)神經(jīng)元,我們看到兩者之間有很接近的地方。工作頻率兩百赫茲,也不高。最奇怪的是,我們吃點(diǎn)什么米飯、豆腐、白菜,20瓦的功耗也可以完成這些功能。我們的大腦皮層面積是0.25平方米,這是自然進(jìn)化而來的。

我們得過世界第一的天河計(jì)算機(jī),用了27億個(gè)芯片,比人腦還要小一點(diǎn)。傳輸速度是每秒中30萬公里,它的頻率是4.2GHz,由于可以把很多運(yùn)算堆在一起,可以做很多的運(yùn)算,但是功耗、占地面積都非常驚人。所以這兩個(gè)對比,人腦和機(jī)器之間,要真正用機(jī)器實(shí)現(xiàn)人腦功能恐怕不容易。20170714-ICai-14我們猜想人腦怎么工作的呢?出現(xiàn)一個(gè)事件怎么辦?首先要想象特征,我們怎么認(rèn)出一個(gè)人?他的特征牢牢的出現(xiàn)在我的腦海中。我出現(xiàn)了記憶,做出決策,然后做出行動(dòng)。這個(gè)過程是一個(gè)循環(huán)往復(fù)的過程。

當(dāng)然,有可能我們見到的是一個(gè)陌生人,我記憶中不存在,我現(xiàn)需要做一個(gè)決策。然后把行動(dòng)驗(yàn)證我的記憶是否是對的。所以在不斷的往復(fù)過程中,我們在不斷的學(xué)習(xí)加深印象。這個(gè)過程中也許我見一個(gè)人,幾分鐘就有印象。所以學(xué)習(xí)中會(huì)有長久的迭代過程。所以計(jì)算是非常重要的。

什么芯片才算人工智能芯片?

20170714-ICai-15人工智能芯片的幾個(gè)要素:

首先一定要可編程,這樣才能適應(yīng)算法的演進(jìn)和應(yīng)用的多樣性。

架構(gòu)的動(dòng)態(tài)可變性,沒有一個(gè)芯片可以百分之百石英所有的算法。

要有架構(gòu)的變化能力,最好小于10個(gè)時(shí)鐘周期,最好小于1個(gè)時(shí)鐘周期。

高計(jì)算效率,指令這樣的低效率架構(gòu)就不要做了。

最重要的是,高能量的效率,我覺得理想情況下,每瓦功耗低于5萬億次。如果做不到這一點(diǎn),真正做起來就會(huì)很難受。

有些應(yīng)用功耗要小于1mw,有些東西要求速度足夠快,比如視頻識別,一些監(jiān)控識別要做到每秒鐘大于25幀。

最后是低成本,你要做消費(fèi)類產(chǎn)品價(jià)格不能搞。

體積小,也是為了能在移動(dòng)設(shè)備上。

應(yīng)用開發(fā)要簡便,不要讓做應(yīng)用開發(fā)的工程師學(xué)習(xí)芯片設(shè)計(jì)知識。20170714-ICai-16我們首先不知道人腦是怎么完成計(jì)算的,我們現(xiàn)在是用軟件+芯片構(gòu)成的類腦軟件。包括智能軟件和智能芯片。以前我們做芯片跟軟件關(guān)系不大,但現(xiàn)在的一個(gè)方向是通過軟件來定義芯片。

大家說了,F(xiàn)PGA不行嗎?我們把FPGA的10大缺陷,1,細(xì)粒度,必須實(shí)現(xiàn)比特級的運(yùn)算,第二配置信息量大,配置時(shí)間需要十幾毫秒到即使毫秒。另外是靜態(tài)編程以及邏輯不可復(fù)用。面積效率低。能量效率也很低,大量邏輯利用率低,需要特種工藝。FPGA需要最先進(jìn)的制造工藝。另外應(yīng)用者必須具備電路設(shè)計(jì)經(jīng)驗(yàn)。最后是成本高昂,所以FPGA價(jià)格在及時(shí)到幾萬美元一片。20170714-ICai-17所以目前的標(biāo)準(zhǔn)來看,目前CPU+GPU、CPU+FPGA、CPU+ASIC的芯片結(jié)構(gòu)都不是最好的人工智能芯片方法。我們認(rèn)為FPGA的人工智能目前最主要的客戶現(xiàn)階段應(yīng)該是互聯(lián)網(wǎng)企業(yè),而互聯(lián)網(wǎng)企業(yè)基本上沒有什么量。你要用ASIC還是FPGA你一定要通過電路設(shè)計(jì)這條關(guān)。所以這個(gè)過程中大量的降低了大家的應(yīng)用門檻。

軟件定義芯片成方向,AI芯片要讓手機(jī)能用

20170714-ICai-18那么到底該怎么做?這里是一個(gè)硬件和軟件的拓?fù)浼軜?gòu),這個(gè)時(shí)候從計(jì)算的效率最好。功耗不見得最好。軟件的規(guī)模可以仁義達(dá),但硬件規(guī)??偸怯邢薜?。我們只好將硬件分塊,不斷將軟件一塊塊進(jìn)來運(yùn)行。這就要求解決不同的問題,要求計(jì)算硬件架構(gòu)和功能動(dòng)態(tài)的、實(shí)時(shí)地跟隨軟件的變化而變化。最好能在一個(gè)時(shí)鐘周期,最多不超過10個(gè)時(shí)鐘周期改變。20170714-ICai-19數(shù)據(jù)會(huì)根據(jù)控制單元的要求來配置計(jì)算單元,這樣的結(jié)構(gòu)是通過C語言來實(shí)現(xiàn)計(jì)算,跟傳統(tǒng)的計(jì)算機(jī)語言是一樣的,但是編譯器有很大的不同。20170714-ICai-20這是非常經(jīng)典的馮諾依曼的計(jì)算結(jié)構(gòu)。我們把Memory放進(jìn)去,把I/O分開,我們到現(xiàn)在為止沒有改變?nèi)魏务T諾依曼體系的結(jié)構(gòu)。20170714-ICai-21所以如果把可重構(gòu)計(jì)算與經(jīng)典計(jì)算進(jìn)行比較,經(jīng)典結(jié)構(gòu)是剛性的,而可重構(gòu)計(jì)算是函數(shù)化的柔性的。在性能上偏重于ASIC,靈活性上偏重于處理器。兩者兼而有之。20170714-ICai-22我們利用這樣的結(jié)構(gòu)實(shí)現(xiàn)了可重構(gòu)的神經(jīng)網(wǎng)絡(luò)計(jì)算。Thinker這是去年在深圳高交會(huì)上發(fā)布的??赡茉龠^半個(gè)月會(huì)有一些新的消息出現(xiàn)。利用這個(gè)結(jié)構(gòu),來相應(yīng)不同應(yīng)用的神經(jīng)架構(gòu)網(wǎng)絡(luò)。這樣一個(gè)結(jié)構(gòu)是什么樣的?我們的芯片用了TSMC 65nm的LP工藝,很小的Memory,很低的工作頻率,峰值性能做到409個(gè)GOPS。所以這樣一個(gè)小小的東西實(shí)現(xiàn)的性能如此之高,如果跟其它相比,可以發(fā)現(xiàn)能量效率至少高了5倍。

我們認(rèn)為目前的人工智能芯片還不能進(jìn)入手機(jī),如果讓芯片進(jìn)入手機(jī),才真正能獲得新生。如果只給互聯(lián)網(wǎng)企業(yè)用,一定沒有量。所以不解決進(jìn)入手機(jī)、家庭,人工智能芯片沒有希望。所以要解決功耗、成本問題。

國內(nèi)的人工智能芯片和國外到底有多大差距?

20170714-ICai-23最后總結(jié),芯片是軟件性能載體,一定要滿足軟件不斷變化的計(jì)算需求。有人問我,目前國內(nèi)的人工智能芯片跟國際上有多大差距? 我的回答是:應(yīng)用上跟國際同行一個(gè)水平線。方法上落后。芯片上差半步。

但這個(gè)差半步并不意味著快成功了,中國有句古話叫“行百里而半九十”。也就是最后這10%要花費(fèi)的精力可能要花費(fèi)一半甚至以上的精力。可能就差這10%,我們就永遠(yuǎn)無法實(shí)現(xiàn)。所以我們應(yīng)用關(guān)注芯片的基礎(chǔ)技術(shù),我們在芯片的能力上還有差距。如果克服不了這個(gè)差距,不要想超越人家。