DS200TCQAG1BHF
DS200TCQAG1BHF
DS200TCQAG1BHF
環(huán)境中尋找目標(biāo)
16年,李飛飛組放出了一篇論文,基于深度強(qiáng)化學(xué)習(xí),在以目標(biāo)圖像為輸入的情況下,不建圖去找東西。大致思路是:根據(jù)機(jī)器看到的圖,決定怎么走,然后再看圖,再?zèng)Q定新走的一步,直到找到東西。論文將目標(biāo)圖像作為輸入,訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)具有通用性。
這種方式找東西更接近人的思維。訓(xùn)練出的控制器并沒有記住物體的位置,更不知道房屋的結(jié)構(gòu)。但它記住了在每一個(gè)位置,通向各個(gè)物體應(yīng)該怎么走。
機(jī)器人抓取
傳統(tǒng)的機(jī)器人學(xué)研究認(rèn)為,需要非常清楚要抓取的物體的三維幾何形狀,分析受力位置和力的大小,再反向計(jì)算機(jī)器手如何一步步移動(dòng)到這些位置。但這種方式抓取不規(guī)則形狀和柔性物體會(huì)很困難。例如毛巾,可能需要看成一系列剛體的鏈接,再進(jìn)行動(dòng)力學(xué)建模分析,但是計(jì)算量比較大。而小黃鴨那樣的橡膠,外部并不能看出彈性程度,難以計(jì)算出需要施加的正確的力。
PieterAbbeel、DeepMind和OpenAI關(guān)于機(jī)器人控制的研究,都以此深度強(qiáng)化學(xué)習(xí)為基礎(chǔ)?;趶?qiáng)化學(xué)習(xí)進(jìn)行機(jī)器人抓取,以機(jī)器視角看到的圖像為輸入,以機(jī)器終抓到物體為目標(biāo),不斷對(duì)機(jī)器進(jìn)行訓(xùn)練,從而在不建模和不做受力分析的情況下,實(shí)現(xiàn)對(duì)物體的抓取。PieterAbbeel已經(jīng)展示過機(jī)器人疊毛巾,開瓶蓋,裝玩具等復(fù)雜的動(dòng)作。
不過基于強(qiáng)化學(xué)習(xí)也仍有很多問題,如效率低、推理過程長(zhǎng)、任務(wù)難以描述、不能終身學(xué)習(xí)、不能限度從真實(shí)世界獲取信息等。其中一些通過meta學(xué)習(xí),one-shot學(xué)習(xí),遷移學(xué)習(xí),VR示教等方法的引入得到了改善,有些則還暫時(shí)難以解決。
Bussmann 170M1571
Bussmann 170M3466
Bussmann 170M6546
Bussmann 170M6419
BUSSMANN 170M5258
Bussmann 170M5952/5953/5954/5955/5956/5957/5958
Bussmann 170M6421
BUSSMANN 170M6146/6147/6148/6150/6151
BUSSMANN 170M7062/7063/7102/7103/7122/7123
BUSSMANN 170M5566/5567/5568/5518/5467/5468
Bussmann 170M6494/6495/6496/6497/6498/6499/6500/6501
Bussmann 170M6418/6468/6469/6518/6519/6568/6569/6393
BUSSMANN 170M4145/4146/4147/4195/4196/4197
Bussmann 170M5195/5196/5197/5198/5199/5200
Bussmann 170M6188/6189/6190/6191/6192/6193/6194/6195
Bussmann 170M5018/5068/5167/5168/5217/5218
Bussmann 170M5241/5242/5243/5244/5245/5246/5247
BUSSMANN 170M3558/3559/3560/3561/3562/3563/3564/3565
BUSSMANN FWP-60B