【案例分享】自動駕駛汽車也有第六感?看這家初創(chuàng)公司如何為無人車賦予“直覺”
寬泛科技專注為人工智能、影視后期、VR/AR/MR、視覺計算、虛擬化云計算、商務(wù)應(yīng)用等行業(yè)客戶提供基于深度學(xué)習(xí)、人臉識別、圖像識別、視頻分析、無人駕駛、醫(yī)療影像識別等硬件解決方案。
來自哈佛大學(xué)的初創(chuàng)公司Perceptive Automata正在讓自動駕駛汽車實現(xiàn)像人類一樣的推理和判斷。

只需輕輕一瞥,您就可以了解到一個人的很多信息。比如您可以判斷他是否已經(jīng)疲憊、正在分心或是很匆忙,也可以看出他是下班回家還是去健身房。
不必神探福爾摩斯附體,您就可以迅速憑直覺做出這些判斷,因為我們的大腦就是這樣運作的。事實上,大腦非常擅長處理此類感知,以至于您都很難意識到自己在做出這些判斷。
來自哈佛大學(xué)的初創(chuàng)公司Perceptive Automata正努力通過深度學(xué)習(xí)將這種人類才有的直覺應(yīng)用于自動駕駛汽車中。
肢體語言或?qū)Ψ绞殖治锲返纫曈X線索可以為駕駛決策的形成提供重要信息。如果一個人一邊打電話一邊沖向馬路對面,那么您就可以得出結(jié)論:對方的注意力集中在別處,而不是在其周圍環(huán)境上。此時,您就需要謹慎行事。而如果一位行人站在人行橫道上左右張望,那么您就知道,對方已經(jīng)意識到其所處的環(huán)境并在留意過往車流。
“駕駛比解決物理問題更加復(fù)雜,”Perceptive Automata聯(lián)合創(chuàng)始人兼首席技術(shù)官Sam Anthony說道,“除了識別出周圍的人和物體之外,您還要不停地判斷這些人的想法和意圖。”
開發(fā)自動駕駛汽車時,Perceptive Automata的軟件增加了一些深度學(xué)習(xí)算法,而訓(xùn)練這些算法時使用的是真實世界的人類行為數(shù)據(jù)。通過同時運行這些算法以及驅(qū)動汽車的AI技術(shù),汽車能夠更為全面地了解周圍環(huán)境,從而增強安全性。
敏銳的視角
為了幫助汽車理解外部環(huán)境,Perceptive Automata采用了一種獨特的方法來訓(xùn)練深度學(xué)習(xí)算法。
傳統(tǒng)訓(xùn)練方法會使用一系列同一物體的圖片,教會神經(jīng)網(wǎng)絡(luò)辨別該物體。例如,工程師會向深度學(xué)習(xí)算法展示數(shù)百萬張救護車的圖片,然后該軟件就能夠自主識別出救護車。
Perceptive Automata沒有使用指向同一概念的多張圖片進行訓(xùn)練,而是讓數(shù)據(jù)可以用一幅圖向神經(jīng)網(wǎng)絡(luò)傳達一系列信息。通過結(jié)合面部表情與其他標志物(如某人正拿著咖啡或手機),該軟件可以推斷出行人的注意力集中在何處。
Perceptive Automata 訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可理解人類行為,從而實現(xiàn)安全的自動駕駛。
借助NVIDIA DRIVE強大的性能以及節(jié)能的特性,Perceptive Automata的目標得以實現(xiàn)。這款車載深度學(xué)習(xí)平臺讓軟件可以分析一系列肢體語言標志,并推斷出行人的路線。該軟件可以對汽車視野內(nèi)的一個人或整個人群進行計算,從而為道路上的每個人創(chuàng)造更安全的環(huán)境。
讓未來汽車更具人性化
Anthony表示,為自動駕駛汽車增加這樣微妙的感知能力能夠創(chuàng)造出更為流暢的駕駛體驗。自動駕駛汽車獲得的信息越多,就越能適應(yīng)復(fù)雜的交通狀況,從而無縫融入到人類和AI共享車道的生態(tài)系統(tǒng)中。
“隨著該行業(yè)日益成熟,在都市環(huán)境中進行的測試也越來越多。愈發(fā)明顯的一點是,這種微妙的感知能力是人類天生就會的,然而對自動駕駛汽車卻不是這樣。”Anthony說道。
Perceptive Automata的軟件充分利用了差異性,將先進的深度神經(jīng)網(wǎng)絡(luò)整合到駕駛堆棧中,從而為這種感知挑戰(zhàn)提供了一個安全且強大的解決方案。當汽車有了這種更高級別的理解力之后,自動駕駛就將變得更智能、更安全。