1.智能小助手在視覺上開戰(zhàn)
隨著我們的系統(tǒng)越來越接近于“人性化”——就像人工智能,它將更需要視覺數(shù)據(jù)來進(jìn)行學(xué)習(xí)和處理其他數(shù)據(jù)。在LDV 峰會(huì)上,Evan Nisselson說到:“這是所有主要公司都想在激烈的競(jìng)爭(zhēng)中擁有我們的活動(dòng)視覺數(shù)據(jù)的原因之一?!薄盀榱俗龅竭@一點(diǎn),他們需要擁有攝像機(jī)?!崩?,亞馬遜最近為其以Alexa作為語音助手的智能設(shè)備—— Echo,添加了一臺(tái)攝像頭,而Google和Facebook最近又發(fā)布了新的增強(qiáng)現(xiàn)實(shí)研究的聲明。
2.光學(xué)器件足以引導(dǎo)無人駕駛車
我們經(jīng)常會(huì)看到類似于這樣的爭(zhēng)論——無人駕駛汽車是否需要LiDAR,或者說是僅依賴于光學(xué)的解決方案就已經(jīng)足夠。例如,特斯拉首席執(zhí)行官Elon Musk認(rèn)為,體積龐大且昂貴的設(shè)備LiDAR通過使用激光器實(shí)時(shí)地對(duì)其環(huán)境進(jìn)行映射不是駕駛時(shí)所必需的。 Wheras Humatics 的首席技術(shù)官Gregory Charvat在發(fā)布會(huì)上表示,汽車“不僅僅需要光學(xué)傳感器平臺(tái)[相機(jī)],他們也需要比差分GPS更精確的LiDAR,雷達(dá)和高精度無線電導(dǎo)航。”
LiDAR和雷達(dá)通過范圍和角度來精確定位周圍環(huán)境中的實(shí)際物體,而基于用相機(jī)解決問題的深度學(xué)習(xí)則需要通過算法運(yùn)行圖像,并且即便這樣,最終仍只能取得一個(gè)預(yù)測(cè)的結(jié)果。然而,光學(xué)解決方案能在實(shí)際生活中識(shí)別某個(gè)地方效果更好,就像一個(gè)行人和一串像圣誕樹的像素點(diǎn)相比,在Auto X 的創(chuàng)始人兼CEO Jianxiong Xiao的令人印象深刻的演示中,他們的公司可以只使用相機(jī)來低成本的解決無人駕駛汽車的問題。
由于技術(shù)上的優(yōu)缺點(diǎn),汽車公司通常提前五年來進(jìn)行戰(zhàn)略研究,所以現(xiàn)在需要購買一些必備的硬件來確定2021年的最后生產(chǎn)時(shí)限。目前,LiDAR和一些更先進(jìn)的雷達(dá)依然很昂貴(對(duì)于前者來說即便80,000美元也被認(rèn)為是便宜的)、笨重。同時(shí),如果要以一種混合的方式運(yùn)行所有這些光學(xué)技術(shù)和傳感器技術(shù),需要一臺(tái)足夠小的能適應(yīng)汽車的超級(jí)計(jì)算機(jī)。
3.視覺系統(tǒng)能讓機(jī)器比通過機(jī)器學(xué)習(xí)學(xué)得更好
LDV中的幾個(gè)演示提醒了我們,機(jī)器不僅僅通過神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)來學(xué)習(xí)。他們還有其他方法來學(xué)會(huì)識(shí)別和分析他們周圍的世界。Google研究的科學(xué)家Tali Dekel展示了一種技術(shù),使用計(jì)算機(jī)視覺來進(jìn)行識(shí)別,通過將屋頂上的直線或紫色水果中所存在的偏差放大,然后來判斷。例如,確定舊房子的結(jié)構(gòu)是否存在問題,或者是某個(gè)西紅柿是否比其他的成熟的更好,更飽滿。看似很簡(jiǎn)單,但這是計(jì)算機(jī)視覺優(yōu)于人類的地方。
4.機(jī)器視覺可以幫助醫(yī)療診斷
病理學(xué)家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬個(gè)需要分析的單個(gè)細(xì)胞,如果有癌癥的存在,那么醫(yī)生很容易將其遺漏?!皩?duì)于人類來說,我們無法像計(jì)算機(jī)一樣高效的工作,只因?yàn)槲覀儫o法去仔細(xì)觀察每一個(gè)單元格”,PathAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Andrew Beck表示,“但我們認(rèn)為電腦每次都能做出完美的診斷。”
根據(jù)美國醫(yī)學(xué)協(xié)會(huì)的一項(xiàng)研究,對(duì)于一項(xiàng)正確的診斷,通常只有不到一半的病理學(xué)家會(huì)表示贊同。引用另一項(xiàng)重點(diǎn)研究乳腺癌淋巴結(jié)活檢的例子,Beck說明了計(jì)算機(jī)與人類病理學(xué)家所關(guān)注的側(cè)重點(diǎn)之間的區(qū)別;前者強(qiáng)調(diào)了許多會(huì)成為癌細(xì)胞容器的區(qū)域。Beck說:“我們?yōu)椴±韺W(xué)家提供原始圖像,然后他們?nèi)匀豢梢匀ゲ榭此麄兯煜さ臄?shù)據(jù),和那些由學(xué)習(xí)系統(tǒng)處理了的圖像,基本上這就可以確定癌癥的區(qū)域,然后醫(yī)生就能通過專門研究這些區(qū)域作出診斷。”乳腺癌研究表明,如果沒有人工智能,這種活檢只有85%的準(zhǔn)確率。而如果使用人工智能作為輔助,錯(cuò)誤率將下降到只有5%。
5.計(jì)算機(jī)視覺領(lǐng)域的門檻變得越來越低
優(yōu)質(zhì)相機(jī),傳感器和深度學(xué)習(xí)軟件庫(如Google TensorFlow)的商品化大大擴(kuò)展了計(jì)算機(jī)視覺的使用范圍,我們看到許多新的初創(chuàng)公司出現(xiàn)。在Vision Summit舉辦的兩次比賽中,不論是一種能夠從Google對(duì)街景視圖圖像進(jìn)行判斷,然后生成人口學(xué)分析的技術(shù),還是一個(gè)能夠?qū)κ鹿拾l(fā)生后汽車的損壞程度進(jìn)行評(píng)估并且計(jì)算出維修成本的應(yīng)用程序,我們可以看到這些判斷和分析都僅僅是來源于一張圖片。