今年我國興起人工智能浪潮,很多人工智能公司都創(chuàng)下巨額的融資記錄,例如曠視、商湯、依圖、中科視拓等是公司。然而很多人不知道的是,這幾家公司都與微軟亞洲研究院有著深厚的淵源。中科視拓的董事長兼CTO山世光、曠視科技首席科學(xué)家孫劍是前微軟亞洲研究院院長沈向洋的團(tuán)隊成員、博士生;依圖科技的創(chuàng)始人兼CEO朱瓏是前微軟亞洲研究院副院長張宏江的學(xué)生;商湯科技創(chuàng)始人湯曉鷗曾是微軟亞洲研究院視覺計算組資深研究員。電子制作模塊
機(jī)器也有情商?微軟對話式人工智能
可以看到,很多從微軟亞洲研究院走出去的人才都涌向人臉識別領(lǐng)域,而現(xiàn)在微軟研究院似乎并沒有沿著這個方向走,他們最為人熟知的是對話式人工智能。在微軟看來,計算機(jī)在對話能力和情感理解能力方面仍然遠(yuǎn)遠(yuǎn)落后于人類,因此在2014年開始就研發(fā)微軟小冰,是一款基于情感計算框架、以情商為主要方向的對話式人工智能。那么,目前微軟的對話式人工智能到底進(jìn)展到哪一步了呢?微軟中國區(qū)首席技術(shù)顧問管震近日在一個人工智能論壇上做出精彩分享,表示機(jī)器開始學(xué)習(xí)人的情緒,來滿足各種需求。微軟小冰在全球范圍內(nèi),與數(shù)億人類進(jìn)行了旨在建立情感連接的對話,總計對話量已超過300億輪。
此外,基于人工智能的深度學(xué)習(xí)和大量數(shù)據(jù),微軟小冰還能勝任主持人,甚至是創(chuàng)作文學(xué)作品。目前小冰已經(jīng)創(chuàng)作出200首詩,部分作品發(fā)表在詩集《陽光失了玻璃窗》中。這也是人類史上第一部完全由人工智能創(chuàng)作的詩集。
微軟在對話式人工智能這方向深入研究,已經(jīng)走了很遠(yuǎn)的距離。但是對于創(chuàng)業(yè)型的機(jī)器人公司而言,千萬不要一上來就想研發(fā)另一個微軟小冰。管震表示,小冰是面向消費者的對話式人工智能,微軟花費了大量的人力財力,并與很多企業(yè)合作,灌輸了大量的數(shù)據(jù)之后才有了目前的成績。創(chuàng)業(yè)型機(jī)器人公司應(yīng)該將有限的人力財力投入到特定情景的服務(wù)型機(jī)器人當(dāng)中,訓(xùn)練對應(yīng)情景的知識地圖。例如在醫(yī)院負(fù)責(zé)掛號導(dǎo)流的服務(wù)型機(jī)器人,其服務(wù)對象是病人,只需具備理解病人的病癥并導(dǎo)流到指定科室的能力,查詢天氣、娛樂、生活百科式的問答是不必要的。
服務(wù)型對話機(jī)器人可以快速響應(yīng)用戶,提供24小時服務(wù);標(biāo)準(zhǔn)化的話術(shù)減少了前臺的服務(wù)培訓(xùn)時間。那么如何從零開啟創(chuàng)建一個對話機(jī)器人呢?管震表示,對話機(jī)器人大致分為用戶交互入口、用戶意圖理解、調(diào)用響應(yīng)服務(wù)三個步驟。
其中用戶意圖理解涉及到到自然語言的理解,例如在復(fù)雜的上下文語境下,要連貫起來理解用戶表達(dá)的意思。據(jù)說微軟小冰最多能聯(lián)系23句上下文的意思,但是水平還需大大提高。微軟可提供Congnitive Services(LUIS)技術(shù)幫助開發(fā)者實現(xiàn)自然語言的理解。
管震指出,微軟只是提供一個標(biāo)準(zhǔn)的對話式機(jī)器人框架,開發(fā)者需要訓(xùn)練特定情景的知識地圖。盡管微軟語言識別的錯誤率已經(jīng)非常低了,2016年微軟宣布英語的語音識別轉(zhuǎn)錄詞錯率僅 5.9%,達(dá)到了專業(yè)速錄員水平超越了人類。但是在特定的情景下,如面向3-6歲兒童的陪伴型機(jī)器人,兒童的表述能力不強(qiáng),語音識別錯誤率必然會升高。因此,開發(fā)者不能照搬微軟的標(biāo)準(zhǔn)化平臺,而是要訓(xùn)練兒童對話場景下的知識地圖和認(rèn)知能力。
驍龍845移動平臺,主導(dǎo)終端側(cè)人工智能
智能語音的應(yīng)用也越來越多,過往移動設(shè)備的AI由于大數(shù)據(jù)的需要較多依賴云端,例如微軟的對話式人工智能更多的是基于云端的大數(shù)據(jù)、大運算能力。但目前有一個趨勢是云端的運算能力開始往端上遷移,以進(jìn)一步提升效率,同時可靠性和用戶隱私數(shù)據(jù)也得到更高保障。
高通是踐行終端側(cè)人工智能的先行者之一,近日推出最新的驍龍845移動平臺,終端側(cè)智能是高通反復(fù)強(qiáng)調(diào)的認(rèn)知。高通在與華為的麒麟970芯片不同,驍龍845并沒有內(nèi)置單獨的NPU(神經(jīng)單元),而是綜合部署,將AI處理功能分散在845平臺的異構(gòu)架構(gòu)中。高通也在這方面強(qiáng)調(diào),通過模塊內(nèi)之間的調(diào)用,可以達(dá)到更有針對性的AI操作。
高通產(chǎn)品市場總監(jiān)Dennis Liu在“人工智能解決方案”的主題演講中表示,終端側(cè)的人工智能得以發(fā)展取決于三個關(guān)鍵的技術(shù)。一是高效硬件(處理器的運算能力);二是算法改進(jìn)(在終端運算的資源有限的前提下,想要保證精度必須使算法更簡潔);三個軟件工具(嵌入式設(shè)備接口很多,如何在復(fù)雜的編程環(huán)境下快速部署算法,軟件工具是關(guān)鍵)。
Dennis Liu透露,OPPO R11、VIVO 20、小米6、一加5等手機(jī)都用到了高通的人工智能功能。 驍龍神經(jīng)處理引擎通過軟件來加速終端側(cè)執(zhí)行的深度學(xué)習(xí)網(wǎng)絡(luò),支持智能手機(jī)實現(xiàn)流暢的解鎖和面部識別體驗,并支持在照片上增添人像模式或?qū)崿F(xiàn)實時背景虛化。
據(jù)了解,驍龍神經(jīng)處理引擎(SNPE)SDK除了已支持Google TensorFlow和Facebook Caffe / Caffe2框架之外,現(xiàn)在還支持Tensorflow Lite和新的ONNX,幫助開發(fā)者輕松使用他們所選擇的框架,包括Caffe2、CNTK和MxNet。驍龍845還支持Google Android NN API。
除了高通最擅長的智能手機(jī)領(lǐng)域,驍龍845在VR/AR等產(chǎn)品也頗有建樹。驍龍845是首款支持室內(nèi)空間定位(room-scale)六自由度(6DoF)和即時定位與地圖構(gòu)建(SLAM)的移動平臺。簡單來說,在使用驍龍845處理器玩虛擬顯示產(chǎn)品時通過攝像頭可以檢測到周邊的環(huán)境,包括對手實時跟蹤,并識別前方障礙物提醒用戶,提升VR沉浸式用戶體驗。
你了解你的膚質(zhì)嗎?基于圖像的膚質(zhì)檢測技術(shù)
皮膚是人的第二張臉,越來越多的人對自己的膚質(zhì)情況密切關(guān)注。但目前的人工識別技術(shù)大多應(yīng)用在安防、手機(jī)解鎖、支付上面,主要任務(wù)是將人臉識別出來,沒有將人臉上的膚質(zhì)進(jìn)行進(jìn)一步的分析。和而泰的數(shù)據(jù)與人工智能實驗室就在研究基于圖像的膚質(zhì)檢測技術(shù),是人臉識別技術(shù)相對是垂直的研究方向。和而泰副總裁王宏表示,目前可以提供豐富、精細(xì)的檢測維度,包括臉型、眉型、膚色、黑頭/毛孔、皺紋等等。
和而泰已經(jīng)在京東眾籌上發(fā)布了一款智能膚質(zhì)檢測儀,不過王宏表示,目前智能硬件的市場接受度比較低,因此主要通過手機(jī)攝像頭這個超級傳感器去開拓市場。
通過手機(jī)拍攝的人臉圖片,手機(jī)APP可快速精準(zhǔn)的檢測出眼周、臉部、手部等區(qū)域的皮膚水分、油分等肌膚參數(shù),并且針對數(shù)據(jù)進(jìn)行智能分析,提供針對每個人膚質(zhì)不一樣的定制化改善方案,包括護(hù)膚建議、飲食建議、保養(yǎng)建議等。
膚質(zhì)檢測減技術(shù)的檢測流程包括圖像采集-圖像預(yù)處理-圖像模型(傳統(tǒng)模型、深度模型)-識別結(jié)果。王宏表示,膚質(zhì)檢測技術(shù)目前還處于研究階段,并分享了兩個技術(shù)難點。
一是在圖像采集階段,如何得到一張高質(zhì)量的圖片,亮度和距離都要合適。為了保證圖像的亮度,以及人臉可識別區(qū)域的面積,需要在圖像采集時在前端做亮度和距離的檢測,判斷拍照姿勢、角度、距離正不正確,指導(dǎo)用戶拍照得到高質(zhì)量的照片。此外在圖像預(yù)處理階段也要調(diào)節(jié)圖像的亮度,從而捕捉到臉部更多的細(xì)節(jié)。
二是數(shù)據(jù)標(biāo)注階段,分為定義數(shù)據(jù)類別、數(shù)據(jù)標(biāo)注、數(shù)據(jù)檢測三個步驟。對于非專業(yè)人員可以輕易辨識的數(shù)據(jù),采取抽樣交叉標(biāo)注的方式;對于毛孔、黑頭等皮膚問題的數(shù)據(jù),需要與專業(yè)人員(醫(yī)生)合作,花費大量的時間去標(biāo)注數(shù)據(jù)。此外,人臉膚質(zhì)情況屬于個人隱私,如何得到大量的膚質(zhì)數(shù)據(jù)也是個難題。
其實,在深圳地鐵站的面膜智能售賣機(jī)上,已經(jīng)有免費膚質(zhì)檢測的功能。機(jī)器會檢測并顯示出用戶的膚質(zhì)情況,并建議用戶買哪一款面膜。這種商業(yè)模式其實相當(dāng)不錯,但問題在于膚質(zhì)檢測的結(jié)果并不準(zhǔn)確,多次檢測的結(jié)果甚至大相徑庭。當(dāng)檢測結(jié)果不精準(zhǔn)沒有權(quán)威性的時候,自然不會有太多消費者買單。希望能更多像和而泰這樣的企業(yè)研究膚質(zhì)檢測技術(shù),協(xié)同傳感器、AI芯片、算法公司、方案商、終端企業(yè)等產(chǎn)業(yè)鏈上下游共同推進(jìn)該技術(shù)的發(fā)展。