科羅拉多大學(xué)的研究者在最近發(fā)表的論文中提出了依靠包括神經(jīng)模擬數(shù)學(xué)函式在內(nèi)的多種深度學(xué)習(xí)模型來幫助機(jī)器人從相機(jī)畫面中分辨出野外路徑的方法。
“機(jī)器人有望在多種戶外場(chǎng)景中發(fā)揮作用,例如搜尋救援、野生動(dòng)物管理、收集數(shù)據(jù)保護(hù)環(huán)境、氣候研究和天氣預(yù)報(bào)等,”研究者寫道,“但是,野外環(huán)境中的自動(dòng)導(dǎo)航一直是個(gè)技術(shù)難題。收集和分析訓(xùn)練數(shù)據(jù)集的方法在一些場(chǎng)景中并不可行,特別是考慮到地形狀況有可能會(huì)受到季節(jié)變化、暴風(fēng)雨和自然侵蝕的影響。”
論文作者指出,野外路徑中存在著太多變數(shù),收集和標(biāo)記真實(shí)世界的數(shù)據(jù)來訓(xùn)練機(jī)器人系統(tǒng)將耗費(fèi)巨大的時(shí)間,因此研究者將目光轉(zhuǎn)向人工虛擬野外環(huán)境圖像。為了合成這些圖像,他們用游戲引擎Unity搭建了一個(gè)有土路的高山場(chǎng)景,再用樹木、巖石和葉子的3D模型加以點(diǎn)綴。然后,他們?cè)谄渲嗅尫帕艘粋€(gè)裝備有三個(gè)80度視域、400乘400像素?cái)z像頭的虛擬機(jī)器人并最終收集到了兩萬多張地貌圖片。

在虛擬環(huán)境中繪制野外地圖
研究團(tuán)隊(duì)壓縮了這些圖片的像素?cái)?shù)從而加快處理速度并減少內(nèi)存占用,然后將圖片分為三組,一組用于訓(xùn)練、一組用于校驗(yàn)、還有一組用于測(cè)試。
訓(xùn)練組的數(shù)據(jù)被輸入進(jìn)三個(gè)架構(gòu)不同的神經(jīng)網(wǎng)絡(luò),它們分別是深度神經(jīng)網(wǎng)絡(luò)(DNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。在實(shí)驗(yàn)中AI對(duì)虛擬機(jī)器人有完整控制權(quán),RNN模型推斷正確路徑方向的準(zhǔn)確率達(dá)到了95.02%。在另一個(gè)實(shí)驗(yàn)中,研究者用四千張真實(shí)世界的圖片訓(xùn)練三種AI算法,DNN模型的路徑推斷準(zhǔn)確率為58.41%,這個(gè)成績(jī)高于基準(zhǔn)線并預(yù)示著從虛擬到現(xiàn)實(shí)的遷移學(xué)習(xí)有潛力勝過一些應(yīng)用了計(jì)算機(jī)視覺技術(shù)的常規(guī)方法。
“我們觀察到機(jī)器人在野外導(dǎo)航領(lǐng)域整體上是成功的,包括那些帶有急轉(zhuǎn)彎障礙物的場(chǎng)景,例如巨石等,”研究者寫道,“此外,我們還觀察到了幾個(gè)智能決策的案例,有一次,機(jī)器人在發(fā)現(xiàn)障礙物后徑直離開了路徑,但它隨后重新返回路徑并繼續(xù)它的旅程。”
這三種神經(jīng)網(wǎng)絡(luò)都沒有做到完美。機(jī)器人有時(shí)會(huì)將某些特別的地面區(qū)域識(shí)別為路徑并導(dǎo)致方向偏離。除此之外,研究者也承認(rèn)Unity引擎生成的低畫質(zhì)圖像不足以表現(xiàn)出不同物體之間的差異性。但他們認(rèn)為這項(xiàng)研究為日后加快地形導(dǎo)航AI的訓(xùn)練打下了基礎(chǔ)。
“機(jī)器人的電池壽命、人類的疲勞因素以及安全方面的考量都是人工收集數(shù)據(jù)所面臨的挑戰(zhàn),但是我們的方法有效避開了這些問題,因?yàn)樵谔摂M環(huán)境中可以迅速高效地生成標(biāo)記數(shù)據(jù),”研究者寫道,“這樣一來機(jī)器人就能在虛擬環(huán)境中接受地形導(dǎo)航訓(xùn)練而無需在真實(shí)世界中踏足那些危險(xiǎn)復(fù)雜的地形場(chǎng)景。”
關(guān)鍵詞: