不同于過去的“百萬像素戰(zhàn)爭”,大多數(shù)智能手機業(yè)者會在3D傳感技術(shù)這條新戰(zhàn)線打得更辛苦...電子實驗?zāi)K
三星(Samsung)的最新款智能手機Galaxy S9已經(jīng)準(zhǔn)備上市,華為(Huawei)則是即將于下周在法國巴黎舉辦新產(chǎn)品P20的發(fā)表會;成像技術(shù)專家表示,3D傳感技術(shù)已經(jīng)成為各家手機業(yè)者互別苗頭的最新競爭焦點。不過有一點還不明確的是,三星或華為的智能手機3D傳感功能是否夠資格與蘋果(Apple)的iPhone X分庭抗禮?
來自法國之市場研究機構(gòu)Yole Developpement的MEMS與成像技術(shù)研究主管Pierre Cambou表示,因為蘋果TrueDepth攝像頭技術(shù)設(shè)立了高門坎,他預(yù)測其他競爭對手可能需要一年以上的時間才能提供iPhone X媲美的3D傳感技術(shù)。
不同于過去的“百萬像素戰(zhàn)爭”,大多數(shù)智能手機業(yè)者會在3D傳感技術(shù)這條新戰(zhàn)線打得更辛苦;這是因為3D攝像頭包含眾多需要運作一致的零組件,還需要充分的供應(yīng)鏈管理。
Cambou將3D攝像頭形容為“一堆子裝置(sub-devices)”,他指出:“記得蘋果iPhone X嗎?參與其中的供應(yīng)商包括意法半導(dǎo)體(STMicroelectronics)、LG Innotek、鴻海(Foxconn)、奧地利微電子(ams)還有Lumentum。”
市場已有一些評論指出三星的S9前向傳感技術(shù)“令人失望”。有一篇本月稍早發(fā)表的CNET報導(dǎo)評論:“深入觀察三星的最新生物識別系統(tǒng)──以及該系統(tǒng)與iPhone X的Face ID之比較──結(jié)果顯示它在移動支付上還不夠安全。”
該報導(dǎo)指出,“這是因為三星的臉部識別系統(tǒng)使用標(biāo)準(zhǔn)攝像頭來建立使用者臉部的2D圖,而蘋果的Face ID則是會建立臉部圖形的復(fù)雜3D掃描”;人們已經(jīng)在三星去年推出的Galaxy S8證實,能用照片來欺騙三星的臉部識別技術(shù),顯然S9也會被一樣的手段欺騙。
至于即將發(fā)表的華為P20,有不少媒體報導(dǎo)都將該款手機的“三鏡頭”視為關(guān)鍵功能──為何需要3個攝影鏡頭,三個會比兩個好嗎?
為此我們詢問了雙鏡頭技術(shù)領(lǐng)導(dǎo)供應(yīng)商Corephotonics的市場營銷與業(yè)務(wù)開發(fā)副總裁Eran Briman,他表示:“三鏡頭是一個全新的技術(shù)領(lǐng)域,才剛剛起步、還未證明其價值;”他指出三攝像頭可能會有很多型態(tài)與配置,那些鏡頭可能各有目的,包括支持“低光線拍攝、變焦、景深、高分辨率以及整體影像質(zhì)量。”
根據(jù)Briman的說法,三攝像頭的組合可能包括:1. 一支彩色(RGB)鏡頭、一支黑白鏡頭,第三支攝像頭則是提供超寬廣視場(field of view,F(xiàn)oV)或是兩倍遠(yuǎn)距窄FoV;2. 一支魚眼鏡頭、一支標(biāo)準(zhǔn)廣角鏡頭以及一支兩倍望遠(yuǎn)鏡頭;或者是3. 一支標(biāo)準(zhǔn)廣角鏡、一支兩倍望遠(yuǎn)鏡以及一支五倍望遠(yuǎn)鏡,以支持超級變焦(super-zoom)功能。
他指出:“也有可能是其他配置,包括不同的影像傳感器;”但重點在于:“相較于雙鏡頭設(shè)計,所有的三鏡頭配置都可以提供更精確的深度信息。”
Briman表示:“主要原因是,實際上其基線(baseline,即鏡頭間的距離)會變得更大,特別是第一個與第三個鏡頭;當(dāng)基線數(shù)值越大,深度信息就越準(zhǔn)確──不過在軟件方面的挑戰(zhàn)很大,需要處理遮蔽(occlusion)、同步等等問題。”他補充指出:“此外藉由整合來自三個攝像頭的信息,理論上可以得到更好的深度信息。”
換句話說,華為的三鏡頭方案顯然是為了展現(xiàn)該公司在強化深度傳感技術(shù)方面的努力成果──雖然未經(jīng)證實,業(yè)界猜測高通(Qualcomm)是華為的3D傳感技術(shù)合作伙伴;在去年夏天,高通宣布與奇景光電(Himax Technologies)合作打造完全整合的結(jié)構(gòu)光模塊(structured light module,SliM)。高通當(dāng)時表示,其3D深度傳感攝像頭模塊將在今年第一季量產(chǎn)。
3D傳感技術(shù)領(lǐng)域有哪些重要廠商?
那么在智能手機3D傳感技術(shù)領(lǐng)域有哪些關(guān)鍵供應(yīng)商?在我們討論這個題目之前,先復(fù)習(xí)一下蘋果的3D攝像頭運作原理:蘋果TrueDepth攝像頭結(jié)構(gòu) (來源:Yole Developpement)
如同Yole先前所解釋的,iPhone X能識別使用者臉部并解鎖手機,是結(jié)合了ToF測距傳感器與紅外線“結(jié)構(gòu)光”相機,因而能使用均勻的“泛光”或“位圖案”照明。首先,iPhone X結(jié)合了紅外線相機與泛光感應(yīng)組件,從而在手機前方投射出均勻的紅外光;接著拍攝影像,并此觸發(fā)臉部識別算法。
然而,這種臉部識別功能并非持續(xù)運作。連接到飛行時間(ToF)測距傳感器的紅外線相機發(fā)出信號,指示相機在偵測到臉部時拍攝照片。iPhone X接著啟動其點陣式投射器拍攝影像。然后將一般影像和位圖案影像傳送至應(yīng)用處理單元(APU),用于進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,以識別手機使用者以及解鎖手機。
Yole的Cambou指出,此時尚未開始進行3D影像的運算,3D信息包含在位圖案影像中。“為了執(zhí)行3D應(yīng)用,同一個APU可以使用另一種計算影像深度地圖的算法;”他補充:“由于采用了運算密集的結(jié)構(gòu)光途徑,iPhone X充份利用了A11芯片的強大處理能力。使用神經(jīng)網(wǎng)絡(luò)是得以實現(xiàn)這一設(shè)計的關(guān)鍵技術(shù)。”
基本上有三種類型的技術(shù)能實現(xiàn)3D傳感,包括立體視覺(stereo vision)、結(jié)構(gòu)光以及ToF傳感;Yole所提供的以下表格可以看到這三種技術(shù)的優(yōu)缺點與特性比較:
三大3D傳感技術(shù)比較 (來源:Yole Developpement)
而因為每個3D攝像頭都包含了一堆子裝置,Yole針對以上三種類型技術(shù)提供了一些組件供應(yīng)商組合線索。
首先,立體視覺或主動立體視覺(active stereo),能透過結(jié)合由Omnivision或ST提供的全局快門近紅外線(NIR)攝像頭,以及歐司朗(Osram)、Lumentum、Finisar的NIR照明(可選),還有Iniutive、英特爾(Intel)/Movidius所提供的3D硬件加速器(即視覺處理器)。
其次在結(jié)構(gòu)光部分,必要的子裝置包括全局快門NIR攝像頭,一樣是有Omnivision或ST等供應(yīng)商;還有結(jié)構(gòu)NIR照明組件(可選),供應(yīng)商是奧地利微電子、奇景光電、韓國業(yè)者Namuga以及歌爾(Goertek);此外是3D重建軟件,供應(yīng)商有Apple Primesense、Mantis、Namuga與奧比中光(Orbbec)。
第三種ToF方案,則需要供應(yīng)商包括pmd、Sony/Softkinetic的ToF鏡頭,以及歐司朗、Lumentum、Finisar與奧地利微電子等廠商的NIR照明組件(可選)。Cambou指出,奧地利微電子與意法都提供ToF近接探測器,但只支持幾個像素,輛家公司都還未開發(fā)ToF攝像頭。
蘋果設(shè)下的高競爭門坎
假設(shè)iPhone X的TrueDepth如同Yole所說的遠(yuǎn)勝所有競爭者,究竟其他3D傳感技術(shù)方案是少了什么?
對此Cambou認(rèn)為,“神經(jīng)引擎”(neural engine)是一個關(guān)鍵,也是蘋果的競爭對手難以跨越的障礙:“高通顯然已經(jīng)有了‘me too’解決方案…但還未看到成果;”此外他表示:“你需要夠力的2D-3D攝影系統(tǒng),適合智能手機前置、成本要低于15美元,”這不是完全不可能,但真的很難做到。
iPhone X的光學(xué)中樞系統(tǒng)成本 (來源:Yole Developpement與System Plus Consulting)
此外Cambou補充,該系統(tǒng)還需要達到一定程度的生物識別效果,如果一張照片就能騙過系統(tǒng),那方案就沒用;他認(rèn)為這是問題所在:“蘋果從一開始就知道要用3D攝像頭來做什么,是包括生物識別方案在內(nèi)的用戶接口,”而其他競爭對手只是嘗試要賣廉價版的相同功能。
Cambou指出:“蘋果識別系統(tǒng)需要的性能等級,已經(jīng)設(shè)立了超越所有競爭者技術(shù)能力的標(biāo)準(zhǔn);奇景光電的窘境意味著手機業(yè)者還沒有充分了解其應(yīng)用重點。”
那除了高通與奇景光電的合作,還有其他案例嗎?Cambou指出,聯(lián)發(fā)科(Mediatek)也打算以APU供應(yīng)商的角色加入3D傳感戰(zhàn)場,打算以卷積神經(jīng)網(wǎng)絡(luò)(CNN)──類似于蘋果的神經(jīng)引擎──來支持生物識別;而他表示,聯(lián)發(fā)科顯然會在未來替小米(Xiaomi)提供CNN加速器,將與奧比中光設(shè)計的3D攝像頭結(jié)合。 3Dimaging_sensingmarket3D傳感技術(shù)市場預(yù)測 (來源:Yole Developpement)
Cambou還表示,如果手機的臉部識別系統(tǒng)將會用于移動支付,我們永遠(yuǎn)可以爭論哪種3D攝像頭模塊更安全,但有一件不可忽略的事情,就是中國因素。舉例來說,最終只要支付寶認(rèn)定哪種3D傳感技術(shù)夠好,就會被中國市場認(rèn)可──中國有一大部分人口都已經(jīng)依賴像是微信支付、支付寶等移動支付方案,而這會成為3D傳感技術(shù)贏家的最大決定因素。