如同扎克伯格在Facebook頁面上說的,Jarvis是他個人的挑戰(zhàn),從設(shè)計的過程中他可以知道更多AI技術(shù)現(xiàn)況;他并指出,該系統(tǒng)采用了數(shù)種AI技術(shù):“包括自然語言處理、語音識別、臉部識別,以及強(qiáng)化學(xué)習(xí)(reinforcement learning);以Python、PHP與Objective C 等語言撰寫。”

在讀到他如何打造Jarvis時,有五件事情打動了我

20161226-Jarvis-1第一,他再次展現(xiàn)自己是個精明能干的軟件工程師。我確信有很多科技產(chǎn)業(yè)的執(zhí)行長也都擁有工程教育背景,他們在周末也會在地下室的工作臺上當(dāng)“修補(bǔ)工”;在兩年前我寫過當(dāng)時Marvell的執(zhí)行長Sehat Sutardja,他說他在閑暇時間開發(fā)一種新的互連技術(shù)MoChi,而Jarvis開發(fā)案讓我發(fā)現(xiàn)扎克伯格跟Sutardja一樣,是個大老板級的修補(bǔ)工。

第二,扎克伯格的Facebook貼文中最有趣的地方,是他的AI開發(fā)案暴露了一些基礎(chǔ)性的問題,不過與AI不相關(guān),是跟“聯(lián)網(wǎng)家庭”有關(guān)。對扎克伯格來說,AI反而是比較簡單的部分,比他預(yù)期更復(fù)雜的是:“簡單地與我家所有不同的系統(tǒng)鏈接與通信。”

所以說,甚至是在展開AI系統(tǒng)的開發(fā)之前,扎克伯格不得不先花好幾小時寫程序,以鏈接那些“語言不通”、并非采用相同通信協(xié)議的家用電器。例如扎克伯格說:

“我們的照明、恒溫器還有門,是用Crestron系統(tǒng);播放Spotify串流音樂是用Sonos系統(tǒng);有一臺三星(Samsung)電視、一臺我女兒Max用的Nest攝影機(jī),還有當(dāng)然我的工作是與Facebook的系統(tǒng)鏈接。”

他還提到:“我不得不把其中的一些API做逆向工程,甚至只為了達(dá)到我能從計算機(jī)發(fā)出指令打開燈,或是播放某一首歌的目的。”而對我們這些不會寫程序的人來說,除非只買支持三星SmartThings、或是蘋果(Apple) HomeKit的各種家電,沒有別的辦法可以實(shí)現(xiàn)所謂的“聯(lián)網(wǎng)家庭”──但當(dāng)然,那是不會發(fā)生的!

扎克伯格還發(fā)現(xiàn)一個比各種“智能家電”不具備互操作性更大的問題:“大多數(shù)的家電甚至還不能連結(jié)互聯(lián)網(wǎng)。”

我被他對烤面包機(jī)的討論逗笑了:“有可能采用聯(lián)網(wǎng)電力開關(guān)來控制某些不聯(lián)網(wǎng)的家電,讓你可以在遠(yuǎn)程打開電源,但通常這是不夠的;例如很難找到一臺烤面包機(jī),是在你把電源關(guān)閉時就讓吐司片下降,所以當(dāng)電源打開時就能自動開始烤。”有解決方案嗎?最后扎克伯格找了一臺有60年歷史的烤面包機(jī)(模擬式的),并用一個聯(lián)網(wǎng)開關(guān)來操縱它。

第三,一旦扎克伯格可以著手進(jìn)行AI系統(tǒng)開發(fā),他實(shí)際上提供了不少實(shí)用的AI相關(guān)發(fā)現(xiàn)以及至理名言,包括:

•對任何一種AI應(yīng)用來說,了解其來龍去脈非常重要;

•扎克伯格用Facebook Messenger打造了一個Messenger機(jī)器人用來跟Jarvis溝通,如此就能用手機(jī)發(fā)訊息給Jarvis,那些訊息會立即在Jarvis服務(wù)器回放并被處理;

•文字vs.語音──扎克伯格發(fā)現(xiàn)自己跟Jarvis之間的溝通是文字多于語音;

•扎克伯格設(shè)置了一個兩階段步驟,Jarvis能識別門外訪客的人臉(首先是執(zhí)行臉部偵測,看是不是有人進(jìn)入視野,接著是找到人臉并執(zhí)行臉部辨識、看訪客是誰);

•文字在與AI的溝通上,比大多數(shù)人所想象的、扮演更重要的角色,但語音也很實(shí)用,因?yàn)榉浅?焖?;扎克伯格寫道?ldquo;你不需要把手機(jī)拿起來、打開應(yīng)用程序然后開始打字,你只要講話就好了。”但是為了實(shí)現(xiàn)對Jarvis的語音控制:“我得先打造一個Jarvis專屬應(yīng)用程序,能一直聆聽我說的話;”Messenger機(jī)器人能在很多事情上表現(xiàn)優(yōu)異,但使用語音有太多磨擦。

第四,我發(fā)現(xiàn)扎克伯格最后的結(jié)論真是無價,因?yàn)樗浅V甭实刂赋隽薃I技術(shù)目前的狀況:“我今年花了100個小時來打造Jarvis,現(xiàn)在我有一個相當(dāng)棒的系統(tǒng),聽得懂我的話而且能做很多事情;但就算我再花1,000個小時,我大概還是沒辦法打造一套能自己學(xué)習(xí)全新技能的系統(tǒng)──除非我能在目前的AI技術(shù)上達(dá)到某種基礎(chǔ)性的突破。”

第五,在看到Jarvis目前在扎克伯格家做的工作,我忍不住想:“就醬?”

簡單來說,那些他透過聯(lián)網(wǎng)設(shè)備并教Jarvis做的事情,看來都是花了大量勞力來省力,而且就算沒有Jarvis也不是難事。我的意思是說,花了上百小時撰寫客制化程序來啟動音頻系統(tǒng)、應(yīng)門、打開烤面包機(jī)還有監(jiān)視嬰兒房,真的有比較快、比較有效率嗎?其實(shí)扎克伯格是不是只要花幾秒鐘就可以把他不聯(lián)網(wǎng)的尊臀從椅子上移開,然后手動把所有那些事情都做得很好?