幾天前,高通(Qualcomm)正式對(duì)外宣布收購(gòu)專注于前沿機(jī)器學(xué)習(xí)技術(shù)的阿姆斯特丹大學(xué)附屬公司Scyfer,這是一家為全球制造業(yè)、醫(yī)療業(yè)和金融業(yè)等多個(gè)不同行業(yè)打造人工智能解決方案的公司。Qualcomm Technologies工程技術(shù)副總裁Jeff Gehlhaar日前在一次電話溝通會(huì)上對(duì)媒體表示,除了前沿技術(shù)外,對(duì)Scyfer的收購(gòu)還帶來(lái)了公司創(chuàng)始人、阿姆斯特丹大學(xué)知名教授 Max Welling博士的加入,這將幫助Qualcomm在人工智能研發(fā)上的進(jìn)一步發(fā)展。電子設(shè)計(jì)模塊
高通在機(jī)器學(xué)習(xí)領(lǐng)域的探索可以追溯到2007年,自那時(shí)起,高通就開始了面向計(jì)算機(jī)視覺和運(yùn)動(dòng)控制應(yīng)用的機(jī)器學(xué)習(xí)脈沖神經(jīng)方法研究,隨后,其研究范圍從仿生方法拓展到了人工神經(jīng)網(wǎng)絡(luò),也就是深度學(xué)習(xí)領(lǐng)域。而就在上個(gè)月,高通還參與投資了一家位于美國(guó)的人工智能公司Brain Corp。
人工智能正向終端遷移
終端側(cè)人工智能是高通最近在多個(gè)場(chǎng)合反復(fù)提及的詞匯。根據(jù)Jeff Gehlhaar的表述,移動(dòng)終端正成為全球最普遍的人工智能平臺(tái)。數(shù)據(jù)顯示,未來(lái)5年全球智能手機(jī)的累計(jì)出貨量將超過(guò)85億部,這也是移動(dòng)終端將成為全球最普遍人工智能平臺(tái)的原因。Qualcomm一直以來(lái)在移動(dòng)領(lǐng)域擁有領(lǐng)導(dǎo)地位,這為他們提供了利用已有的規(guī)模和機(jī)會(huì),去促進(jìn)手機(jī)和毗鄰領(lǐng)域發(fā)展的機(jī)會(huì)。移動(dòng)領(lǐng)域的規(guī)?;?,成為了Qualcomm將人工智能帶給大眾的基石。加之不可阻擋的物聯(lián)網(wǎng)趨勢(shì)和即將到來(lái)的5G時(shí)代,使得高通認(rèn)為智能互聯(lián)所需要的計(jì)算能力正通過(guò)云端分布到設(shè)備端。因此,高通提出的AI愿景將更專注于幫助智能手機(jī)、汽車和機(jī)器人等廣泛而普及的海量終端實(shí)現(xiàn)人工智能,以確保在有無(wú)網(wǎng)絡(luò)或Wi-Fi連接的情況下都能夠完成處理。其優(yōu)勢(shì)包括即時(shí)響應(yīng)、可靠性提升、隱私保護(hù)增強(qiáng),以及高效利用網(wǎng)絡(luò)帶寬。“我們于十年前就開始了基礎(chǔ)研究,目前我們的現(xiàn)有產(chǎn)品支持了許多人工智能用例:從計(jì)算機(jī)視覺和自然語(yǔ)言處理,到各種終端,如智能手機(jī)和汽車上的惡意軟件偵測(cè)。同時(shí),我們正在研究更廣泛的課題,例如面向無(wú)線連接、電源管理和攝影的人工智能。”Jeff Gehlhaar說(shuō)未來(lái)Qualcomm 將持續(xù)推進(jìn)人工智能研究,把先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)帶到業(yè)界最前沿,具體工作將包括: 針對(duì)半監(jiān)督和無(wú)監(jiān)督訓(xùn)練,如生成式對(duì)抗網(wǎng)絡(luò)(GANs)、分布式學(xué)習(xí)和隱私保護(hù),提升神經(jīng)網(wǎng)絡(luò)技術(shù); 面向終端側(cè)應(yīng)用的網(wǎng)絡(luò)優(yōu)化,包括壓縮、層間優(yōu)化、稀疏優(yōu)化,以及更好地利用內(nèi)存和空間/時(shí)間復(fù)雜度的其他技術(shù); 以及專門的硬件架構(gòu),旨在加速機(jī)器學(xué)習(xí)運(yùn)算,從而在嵌入式終端上帶來(lái)更佳性能和更低功耗。
但他同時(shí)也指出,對(duì)于終端側(cè)人工智能而言,人工智能需要的大量密集計(jì)算與終端所能承受的功耗和熱效率,是業(yè)界無(wú)法回避的巨大挑戰(zhàn)。而高效的硬件、算法改進(jìn)和軟件工具將是高通應(yīng)對(duì)挑戰(zhàn)的三把利器。“對(duì)Qualcomm來(lái)說(shuō),我們的算法優(yōu)化和提升主要包括壓縮、層間優(yōu)化和稀疏優(yōu)化等;軟件方面,Qualcomm一方面提供自己的軟件工具以支持在終端側(cè)進(jìn)行的人工智能,同時(shí)也和生態(tài)系統(tǒng)里的合作伙伴合作,支持TensorFlow、Caffe、Caffe2以及一些未來(lái)即將發(fā)布的框架。”
人工智能硬件的未來(lái)會(huì)是怎樣?
為了向更多行業(yè)(包括移動(dòng)、汽車、醫(yī)療健康、安全與圖像)的開發(fā)者提供他們所需的工具,以實(shí)現(xiàn)終端側(cè)的、由神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的用戶體驗(yàn),2016年,高通正式發(fā)布了Qualcomm驍龍神經(jīng)處理引擎(Neural Processing Engine, NPE) SDK,開發(fā)者可充分利用該SDK實(shí)現(xiàn)諸如情景探測(cè)、面部識(shí)別、自然語(yǔ)言理解、物體追蹤與規(guī)避、手勢(shì)和文本識(shí)別等深度學(xué)習(xí)用戶體驗(yàn)。
該SDK基于分布式架構(gòu),目前可支持驍龍600和800系列平臺(tái),以及TensorFlow、Caffe、Caffe2和一些即將發(fā)布的框架,可以讓深度神經(jīng)網(wǎng)絡(luò)引擎運(yùn)行在驍龍異構(gòu)平臺(tái)的CPU、GPU、DSP等各個(gè)單元上。未來(lái),再利用5G無(wú)線通信技術(shù),就可以實(shí)現(xiàn)終端側(cè)與云之間的人工智能配合和連接。首款整合驍龍神經(jīng)處理引擎SDK的公司之一是Facebook,目前正在使用它來(lái)加速其移動(dòng)應(yīng)用程序中的增強(qiáng)型現(xiàn)實(shí)過(guò)濾器。數(shù)據(jù)顯示,通過(guò)使用神經(jīng)處理引擎,F(xiàn)acebook的過(guò)濾器速度比通用CPU實(shí)現(xiàn)方案要快5倍,在拍攝照片和直播視頻時(shí),可實(shí)現(xiàn)更流暢、無(wú)縫且逼真的AR特性應(yīng)用。
智能駕駛是Jeff Gehlhaar列舉的另一個(gè)典型的終端側(cè)AI應(yīng)用場(chǎng)景。在CES 2017上,Qualcomm展示了采用驍龍820Am處理器的Qualcomm Drive Data平臺(tái)。這是一個(gè)數(shù)據(jù)收集和分析平臺(tái),可以通過(guò)車上的傳感器(前置攝像頭、后視攝像頭、雷達(dá)等)收集汽車的大量信息,用于實(shí)現(xiàn)車輛管理與地圖生成等功能。
該汽車技術(shù)平臺(tái)的重要組成部分便是基于終端的機(jī)器學(xué)習(xí)(on-device machine learning)。Qualcomm Drive Data平臺(tái)采用了驍龍820Am汽車處理器,支持汽車隨時(shí)隨地、精確地判斷城市街道的水平精確度(lane-level accuracy),以此來(lái)實(shí)現(xiàn)精準(zhǔn)的定位。其次,通過(guò)集成X12 LTE調(diào)制解調(diào)器,它還可以連接至云端。除此之外,它還支持基于云端處理的地圖和數(shù)據(jù)應(yīng)用。以上這些都是Qualcomm通過(guò)Qualcomm Drive Data平臺(tái)所展示的技術(shù)。
通常來(lái)說(shuō),汽車中的很多應(yīng)用都會(huì)收集大量數(shù)據(jù),然后在云端進(jìn)行機(jī)器學(xué)習(xí)處理,比如判斷交通路況、交通信號(hào)燈、車道偵測(cè)等。事實(shí)上,我們可以篩選掉某些不相關(guān)的數(shù)據(jù),僅僅把交通路況和環(huán)境視頻等需要的數(shù)據(jù)上傳至云端。因?yàn)轵旪?20Am處理器的性能十分強(qiáng)大,它集成了定位、機(jī)器學(xué)習(xí)、連接等多項(xiàng)出色特性,有很多數(shù)據(jù)就可以在終端上進(jìn)行處理。
此外,對(duì)于用戶關(guān)心的“安全和用戶隱私保護(hù)”,Jeff Gehlhaar表示,“高通與谷歌合作,研究了幾種技術(shù),我們相信這些技術(shù)將引領(lǐng)發(fā)展方向,而這些想法彼此間也都有一定的聯(lián)系。其中一個(gè)想法是,讓多臺(tái)終端一起作為整體協(xié)同學(xué)習(xí),這樣就沒(méi)有一臺(tái)終端能獲取所有的數(shù)據(jù)。第二個(gè)想法叫做隱私保護(hù)深度學(xué)習(xí)(privacy preserving deep learning),可以保證數(shù)據(jù)只提供給訓(xùn)練模型,從而保護(hù)數(shù)據(jù)隱私,同時(shí)也保護(hù)數(shù)據(jù)所有人的個(gè)人信息。用戶可以在不被泄露個(gè)人信息的情況下放心地分享數(shù)據(jù)。”