在AlphaGo阿法狗第一局戰(zhàn)勝圍棋高手李世石后,英國《金融時報》中文版頭條文章為:互聯(lián)網(wǎng)終結(jié),人工智能崛起。此時此刻,互聯(lián)網(wǎng)時代的領(lǐng)先者和弄潮兒不落窠臼,一場革命就要到來,他們似乎正在拋棄互聯(lián)網(wǎng):
2015年和2016年,整個Google都在推動一件事——改名Alphabet,希望徹底脫掉互聯(lián)網(wǎng)公司的標(biāo)簽,在原來的搜索引擎、YouTube和Android之外,將Calico(生命工程相關(guān))、Google Ventures(創(chuàng)新投資部門)、GoogleX(研發(fā)自動駕駛汽車、智能隱形眼鏡和提供互聯(lián)網(wǎng)服務(wù)的熱氣球等)都歸到Alphabet旗下。Google似乎已經(jīng)意識到“互聯(lián)網(wǎng)”時代正在終結(jié)。
同樣在此刻,全球最頂尖的精英也在拋棄互聯(lián)網(wǎng)——斯坦福、MIT(麻省理工)、CMU(卡內(nèi)基梅隆)、伯克利四所名校人工智能專業(yè)的博士生第一份offer(工作合同)已經(jīng)可以拿到200-300萬美金。掠奪這些人才的公司大體上在一個比較小的范圍內(nèi),Google(現(xiàn)更名Alphabet)、Facebook、IBM、蘋果、微軟、亞馬遜、特斯拉…一長串的金光閃閃的公司。
互聯(lián)網(wǎng)的精英人才在硅谷現(xiàn)在的起薪應(yīng)該是20萬美金左右。10倍!還有什么比工資更敏感的價值判斷呢?這種人才軍備競賽情況在商業(yè)歷史上從來沒有發(fā)生過。
阿法狗和Atlas機器人的相繼出現(xiàn),把即將到來的人工智能從幕后推送到幕前,谷歌在為這個全新的“人機智能時代”蓄勢,一如當(dāng)年的美國集中西方最優(yōu)秀的科學(xué)家開啟了震驚全球的“曼哈頓計劃”。
AlphaGo在短短幾個月實現(xiàn)性能的大幅提升,用五個月走完了IBM“深藍”4年的路,這樣驚人的學(xué)習(xí)能力是人類可望而不可及的。美國啟動了“腦研究計劃”(BRAIN Initiative)、歐盟啟動了“人類大腦工程”(Human Brain Project),目前全球人工智能企業(yè)已經(jīng)超過了900家,總估值超過87億美元。
近年來,深度學(xué)習(xí)(deep learning)已經(jīng)在圖像識別、語音識別等領(lǐng)域獲得了一些應(yīng)用。目前深度學(xué)習(xí)技術(shù)應(yīng)用最多的還是視覺領(lǐng)域,即對圖像和視頻的分析。在圖像分析方面,比如人們熟悉的人臉識別、文字識別和大規(guī)模圖像分類等,深度學(xué)習(xí)大幅提升了復(fù)雜任務(wù)分類的準(zhǔn)確率,使得圖像識別、語音識別以及語義理解準(zhǔn)確率大幅提升。
Google已經(jīng)著手開發(fā)人工智能的實際應(yīng)用,多次公開場合討論過深度學(xué)習(xí)技術(shù),比如深度學(xué)習(xí)是如何幫助Android手機提高語音識別準(zhǔn)確率;谷歌自動駕駛通過深度學(xué)習(xí)識別道路、交通信號燈、路標(biāo)等。
據(jù)悉,谷歌與半導(dǎo)體新創(chuàng)企業(yè)Movidius展開合作,正在開發(fā)配備“深度學(xué)習(xí)(Deep Learning)”人工智能最新技術(shù)的智能手機。如果智能手機內(nèi)置圖像識別功能,就可以即時本地處理圖像和識別被攝體。人臉識別支付、標(biāo)識和招牌翻譯等手機的各種新用途將成為可能。
芯片商扎堆深度學(xué)習(xí),高通打出驍龍820
然而,對于半導(dǎo)體產(chǎn)業(yè)來說,最重要或許也最實際的問題是:深度學(xué)習(xí)將會深入智能手機、可穿戴設(shè)備或是自動駕駛汽車中使用的微型芯片嗎?也就說,我們得讓更小的設(shè)備具備深度學(xué)習(xí)的能力,使其得以實現(xiàn)高性能與低功耗才是關(guān)鍵。
結(jié)合用于偵測運動和音頻信號的傳感器、快速的存儲器訪問,以及高功效的數(shù)據(jù)處理方法,這些系統(tǒng)可以擁有真正的“認知”能力,甚至在不遠的將來構(gòu)成一個用于人工智能移動設(shè)備的平臺。同時,重要的是優(yōu)化現(xiàn)有的架構(gòu)來實現(xiàn)“智能視覺”功能,比如3D深度圖和感知、物體識別以及增強現(xiàn)實,還有一些核心的計算圖像學(xué)功能,比如圖像縮放、HDR、圖像再對焦,以及微光圖像增強。
現(xiàn)在已經(jīng)有充份的證據(jù)顯示芯片供貨商對深度學(xué)習(xí)的興趣不斷增加,卷積神經(jīng)網(wǎng)絡(luò)(CNN)正廣泛地應(yīng)用在影像與視頻辨識領(lǐng)域。
“毫無疑問地,深度學(xué)習(xí)確實是改變游戲規(guī)則的一大突破,”嵌入式視覺聯(lián)盟(EVA)創(chuàng)辦人Jeff Bier以計算機視覺為例表示,深度學(xué)習(xí)具有強大的影響力,“必須說的是,目前它還只是一種經(jīng)驗領(lǐng)域。人們正在嘗試不同的東西。”
高通去年推出了首款可‘模擬人腦’的Zeroth認知運算平臺——具有“計算機視覺、設(shè)備上深度學(xué)習(xí)、可辨識場景與對象的智能相機,以及閱讀文本與手寫”的能力,并宣稱驍龍820是一顆智能芯片。
Nvidia在去年三月的GPU技術(shù)大會上使用汽車和先進駕駛輔助系統(tǒng)(ADAS)作為應(yīng)用重點,配合Elon Musk的意見和評論,希望表明自動駕駛汽車的挑戰(zhàn)幾乎已被完全克服了。另一方面,隨著時間的推移,加上一些著眼于降低功耗的調(diào)整與改良,無處不在的3D感知、3D跟蹤,以及圖像搜索等許多技術(shù)和應(yīng)用正在快速進入智能手機,以及其他以電源或電池供電的嵌入式系統(tǒng)中。
DSP IP平臺授權(quán)廠商CEVA公司宣布推出實時神經(jīng)網(wǎng)絡(luò)軟件框架CEVA深層神經(jīng)網(wǎng)絡(luò),以簡化低功耗嵌入式系統(tǒng)中的機器學(xué)習(xí)部署。包括用于圖像分類、定位和目標(biāo)識別的實時示例模型,用于目標(biāo)和場景識別、先進駕駛輔助系統(tǒng)(ADAS)、人工智能(AI)、視頻分析、增強現(xiàn)實(AR)、虛擬現(xiàn)實(VR)和類似的計算機視覺應(yīng)用。
飛思卡爾收購計算機視覺IP供應(yīng)商CogniVue。CogniVue總部位于加拿大渥太華,是一家從事影像認知IP開發(fā)的企業(yè),過去4年是飛思卡爾最新駕駛輔助系統(tǒng)(ADAS)單芯片(SoC)解決方案主要視覺IP的供應(yīng)商。
TI、Nvidia、英飛凌、高通、谷歌等大廠都在進行自動駕駛汽車中使用的微型計算機視覺芯片設(shè)計的研究,致力于開發(fā)針對神經(jīng)網(wǎng)絡(luò)(CNN)優(yōu)化的SoC架構(gòu)。其中最厲害的是以色列公司——Mobileye——他們可以提供最完整解決方案。
為了實現(xiàn)視覺類芯片的深度學(xué)習(xí)應(yīng)用,芯片供貨商用盡了從CPU、GPU到FPGA和DSP的一切,有關(guān)CNN的爭論才剛剛開始。
人工智能型移動芯片面世還要多久?
“你不需要做出決定,因為深度學(xué)習(xí)將會為你做決定。”在深度學(xué)習(xí)架構(gòu)中,你可以將所有的步驟整合于一。
學(xué)習(xí)和訓(xùn)練過程先在專用設(shè)施完成,例如利用數(shù)據(jù)中心的超級計算機。然后,將第一階段中的大量數(shù)據(jù)集轉(zhuǎn)為‘設(shè)定’和‘協(xié)同效率’應(yīng)用到嵌入式系統(tǒng)中。
隨著許多圖像處理與增強功能也都使用計算機視覺技術(shù),計算機視覺和圖像處理技術(shù)之間的區(qū)別正在變得越來越模糊。最直接的例子就是多幀圖像增強功能,比如HDR、圖像縮放與再對焦--拍攝多個連續(xù)的圖像,然后將它們?nèi)诤显谝黄穑玫礁哔|(zhì)量的畫面。
雖然我們稱之為“圖像增強”,但這其實涉及大量的計算機視覺處理來“register”圖像,既完成兩幀或三幀畫面之間的匹配?,F(xiàn)在,用戶認為這種基本功能是理所當(dāng)然的,但其實它需要非常強大的處理能力,使得對于專門的、高性能的數(shù)字信號處理 (DSP)的需求將會增加。
高通公司(Qualcomm) 在Uplinq 2013上發(fā)布了文章,很好地描繪出用于各種不同處理功能的像素功率和時間關(guān)系。圖中展示了三個處理器,包括一個在1.2 GHz下運行的單核CPU、一個四核CPU,以及一個在690 MHz下運行的DSP。
圖:描繪不同處理器在處理每個像素時需要的處理能力和時間,表明了DSP結(jié)合CPU用于視覺處理的優(yōu)勢。為了優(yōu)化功耗和性能,結(jié)合CPU、DSP和GPU可能是總體來說最好的方法。
然而,隨著我們轉(zhuǎn)向在移動平臺上實現(xiàn)類似人類的視覺、人工智能和增強現(xiàn)實應(yīng)用,可能需要重新思考所需的處理架構(gòu)。結(jié)合傳感器融合和先進深度學(xué)習(xí)算法(比如CNN),這些非常先進的計算密集型應(yīng)用將提供更具環(huán)境感知和情境感知的用戶體驗,但是在電池壽命方面卻要作出取舍。
設(shè)計人員面臨的挑戰(zhàn),是一方面要實現(xiàn)具有智能感知能力的設(shè)備,同時在另一方面維持可接受的電池壽命。有幾種方法來實現(xiàn)這一點。例如,可以使用來自高通或Nvidia的GPU來支持CPU。這已經(jīng)在許多智能手機中實現(xiàn)了。然而,降低功耗這一持續(xù)性的強制需求驅(qū)使我們將特定的處理密集型功能分散給針對視覺處理進行優(yōu)化的DSP處理器。在處理物體識別和跟蹤時,對比當(dāng)下最先進的GPU簇群,使用這種方法可以節(jié)省高達9倍的功耗。
然而,即使具備這種功耗水平,移動設(shè)備仍然不太可能很快地使用面部識別來進行人群搜索,因為此功能對于處理能力的要求還是太高了。不過,低功耗處理器和經(jīng)過特定優(yōu)化的處理器架構(gòu)的面世帶來了希望,使得我們在這個領(lǐng)域內(nèi)正在取得實質(zhì)的進展。這類進展是MIT Technology Review將深度學(xué)習(xí)稱為2013年十項技術(shù)突破之一的原因所在。除了GTC上進行了相關(guān)演示,微軟、百度,以及Cognivue也展示了一些研究成果。此后,這個領(lǐng)域中還有其他長足發(fā)展。
此外,Aziana (澳大利亞)最近宣布與BrainChip(美國加州)合并,后者是專門以硬件方式實施人工智能的企業(yè),并已經(jīng)著眼于開發(fā)用于移動平臺的人工智能。雖然支持強大處理能力的架構(gòu)和超低功耗處理是至關(guān)重要的,但隨著云連接變得更普及、更快捷,若我們將盡可能多的處理開銷分配到云中,也是合乎情理的。這將會走向智能的處理性能分配。在云做最適合在云中處理的工作,在移動設(shè)備做最適合移動設(shè)備處理的工作,盡可能高效地依據(jù)架構(gòu)分配功能,比如使用CPU來分配GPU和DSP之間的負載。用高通公司的說法,就是使用合適的引擎來做合適的工作。
“寒武紀(jì)”芯片——中國AI的抗旗者
世界排行榜榜首中國圍棋抗旗者17歲的柯潔已向阿法狗約戰(zhàn),捍衛(wèi)人類尊嚴。美國通過人工智能再次展示其科技領(lǐng)域全球領(lǐng)先地位,在中國AI研究的抗旗者在哪?實力幾何?
在國內(nèi),大批科技公司也開始進入到這個市場。2014年科技部“863 計劃”啟動《基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)》項目,同時醞釀啟動“中國腦計劃”。在企業(yè)方面,阿里巴巴推出了國內(nèi)首個可視化云計算智能平臺 “DTPAI”;騰訊則推出了撰稿機器人Dreamwriter;新秀科大訊飛則在語音和語言方面也擁有了核心技術(shù)積累和產(chǎn)業(yè)基礎(chǔ)。
而作為國內(nèi)最早介入人工智能研發(fā)的企業(yè)之一,百度在人工智能研究方面的布局則遠非幾個獨立產(chǎn)品或是幾個垂直領(lǐng)域所能描述。2014年,百度在硅谷成立人工智能實驗室,側(cè)重于研究人工智能和深度學(xué)習(xí)的前沿技術(shù),這使得百度在硅谷現(xiàn)有開發(fā)能力的基礎(chǔ)上進一步增強了研究能力。與此同時,百度挖角谷歌大腦之父吳恩達,隨即成立由吳恩達領(lǐng)銜的深度學(xué)習(xí)實驗室,主攻智能駕駛和語音識別兩個方向。
截止目前,百度人工智能實驗室搭建了作為百度人工智能核心的“百度大腦”,融合了深度學(xué)習(xí)算法、數(shù)據(jù)建模、大規(guī)模GPU并行化平臺等技術(shù),實現(xiàn)了實時學(xué)習(xí)和成長,它擁有200億個參數(shù),構(gòu)成了一套巨大的深度神經(jīng)網(wǎng)絡(luò),是利用計算機技術(shù)模擬人的大腦的智慧,如學(xué)習(xí)、記憶、推理、搜索、分析、歸納、創(chuàng)新,甚至模擬和擁有人的情感、意識,使計算機或機器人能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。
在核心處理器領(lǐng)域,中國科學(xué)院計算技術(shù)研究所陳云霽、陳天石課題組提出的深度學(xué)習(xí)處理器指令集DianNaoYu被計算機體系結(jié)構(gòu)領(lǐng)域頂級國際會議ISCA2016(International Symposium on Computer Architecture)所接收,其評分排名所有近300篇投稿的第一名。2014年,陳云霽入選《麻省理工科技評論》35歲以下的全球最佳35名創(chuàng)新人士。
一同問世的還有全球首個深度學(xué)習(xí)處理器架構(gòu)寒武紀(jì)。陳云霽在接受采訪時表示,事實上,中國在智能這樣的新興領(lǐng)域和國外差距不大,甚至在智能芯片上是引領(lǐng)世界的。例如我們的寒武紀(jì),美國的哈佛、斯坦福、MIT、哥倫比亞等高校都跟在我們后面做。谷歌甚至需要使用上萬個x86 CPU核運行7天來訓(xùn)練一個識別貓臉的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。將來如果使用了帶有“DianNaoYu(電腦語)”指令集的“寒武紀(jì)”處理器,深度學(xué)習(xí)的運算速度會得到明顯提升。
陳云霽還表示,正在成立寒武紀(jì)公司,進行深度學(xué)習(xí)處理器的產(chǎn)業(yè)化,公司即將完成天使輪融資。相信我們的產(chǎn)品一旦流片,很多國內(nèi)外公司都會非常感興趣。