機(jī)械人會(huì)技擊,誰也擋不住。 然則,真的有一群科研人員讓機(jī)械人學(xué)會(huì)了一樣武器:雙節(jié)棍。 新澤西理工年夜學(xué)的一組科研人員做了一只仿外行,和一只舉措捕獲手套,經(jīng)由過程人類的舉措演示來教機(jī)械人應(yīng)用雙節(jié)棍。這項(xiàng)研討的論文Robot Composite Learning and the Nunchaku Flipping Challenge曾經(jīng)上傳到了arXiv。 仿外行 人類先生在做示范的時(shí)刻,要戴上有傳感器的手套來捕獲舉措 這固然不是為了讓機(jī)械人對(duì)你應(yīng)用雙截棍,而是為了研討如何讓機(jī)械人學(xué)會(huì)一套靜態(tài)的復(fù)合舉措。 想讓機(jī)械人完成精致舉措,經(jīng)由過程人類示范進(jìn)修(learning from human demonstration,LfD)是一種經(jīng)常使用的辦法。然則對(duì)“應(yīng)用雙截棍”這類靜態(tài)技巧、復(fù)合舉措來講,僅唯一人類示范還不敷,所以研討者們又對(duì)“教授教養(yǎng)辦法”做了一點(diǎn)小修正。 他們教機(jī)械人學(xué)雙節(jié)棍的進(jìn)程,和人類的教授教養(yǎng)異常類似。 人類轉(zhuǎn)雙截棍的舉措(上)和對(duì)應(yīng)的Petri網(wǎng)(下) 起首,先生用一個(gè)符號(hào)化的流程圖:petri網(wǎng)來說明一個(gè)舉措; 然后,再將全部舉措展現(xiàn)幾回,每次都給本身評(píng)個(gè)分; 接上去,就須要機(jī)械人依照Petri網(wǎng)和示范舉措一步一步學(xué)了,它在進(jìn)修舉措掌握戰(zhàn)略的同時(shí),還能從先生的自我評(píng)分中進(jìn)修評(píng)判尺度; 最初,機(jī)械人要對(duì)本身的舉措停止評(píng)判,固然,在這個(gè)階段,人類也能夠給機(jī)械人的舉措打分。 用這類辦法,機(jī)械人學(xué)會(huì)將雙截棍繞著手背轉(zhuǎn)一圈然后捉住,也就是上圖這個(gè)舉措,須要年夜約幾個(gè)小時(shí)。 好在它生成就戰(zhàn)勝了練雙截棍的最年夜妨礙:打到本身太疼了…… 這項(xiàng)試驗(yàn)中所用的雙截棍,是“半軟半硬”物體的典范代表,這類教授教養(yǎng)辦法,也異樣可以用來教機(jī)械人做其他龐雜舉措,好比曬生果、給汽車裝內(nèi)飾等等。 固然也能學(xué)更龐雜的雙截棍技巧啦,哼哼哈嘿!
