科技日報(bào)北京10月27日電 (記者張夢然)美國加州大學(xué)伯克利分校、西蒙弗雷澤大學(xué)和喬治亞理工學(xué)院的聯(lián)合機(jī)器人團(tuán)隊(duì)最近創(chuàng)建了一種強(qiáng)化學(xué)習(xí)模型,能讓四足機(jī)器人以守門員的身份高效踢足球。在arXiv上預(yù)先發(fā)表的一篇論文中介紹的該模型,通過反復(fù)試驗(yàn)不斷提高了機(jī)器人的技能。
研究人員稱,通過讓四足機(jī)器人踢足球,可突破四足機(jī)器人的人工智能極限。守門員是一項(xiàng)有趣但具有挑戰(zhàn)性的任務(wù),它需要機(jī)器人對快速移動的球作出反應(yīng),有時需在空中飛行,并在很短的時間內(nèi)(通常在一秒鐘內(nèi))動態(tài)攔截它。
新研究的主要目標(biāo)是創(chuàng)造一個四足機(jī)器人守門員,它可像人類守門員一樣在比賽中完善其技能。為此,研究人員開發(fā)了一種強(qiáng)化學(xué)習(xí)模型,讓該模型通過試錯而不是固定的人工設(shè)計(jì)策略來訓(xùn)練機(jī)器人。
研究人員解釋說,機(jī)器人首先學(xué)習(xí)不同的運(yùn)動控制策略來執(zhí)行不同的技能,例如躲避、前撲和跳躍,同時記錄機(jī)器人腳趾的隨機(jī)軌跡;谶@些控制策略,機(jī)器人接著學(xué)習(xí)高級規(guī)劃策略,在檢測到球的位置和自身狀態(tài)后,選擇最佳技能和動作來攔截球。
經(jīng)過一系列模擬足球比賽,團(tuán)隊(duì)訓(xùn)練了強(qiáng)化學(xué)習(xí)模型。隨后他們將它學(xué)到的策略部署在麻省理工學(xué)院開發(fā)的四足機(jī)器人Mini Cheetah上,并在現(xiàn)實(shí)世界中測試了它的性能。
研究表明,強(qiáng)化學(xué)習(xí)框架可極大地提高M(jìn)ini Cheetah作為足球守門員的能力。在真實(shí)世界測試的40次隨機(jī)射門中,機(jī)器人撲救成功率達(dá)87.5%。
研究人員稱,此項(xiàng)工作最酷炫的是,四足機(jī)器人Mini Cheetah能執(zhí)行跳躍和前撲等非常敏捷的運(yùn)動技能,以及快速和精確的操作技能,例如在一瞬間擺動機(jī)器腿把球推開。這實(shí)際上突破了機(jī)器人領(lǐng)域“腿運(yùn)動”的界限,表明腿也可以是一個機(jī)械手。
由于該模型可提高四足機(jī)器人的敏捷性和身體能力,因此這些機(jī)器人還可用于處理完全不同的任務(wù),例如搜索和救援任務(wù)。也許不久的將來,四足機(jī)器人也可與人類足球運(yùn)動員同場競技。
【總編輯圈點(diǎn)】
踢球和守門有多難?對某些球隊(duì)來說,確實(shí)很難,但對機(jī)器人來說,更不容易。其實(shí),大多數(shù)人類做起來流暢自如、渾然天成的運(yùn)動動作,對機(jī)器人來說都可能是技術(shù)上的重大障礙。這就是“算法”與“天然”之間的鴻溝。現(xiàn)在,工程師們嘗試用機(jī)器學(xué)習(xí)跨越這道鴻溝,不是預(yù)先編好程序,而是讓人工智能在練習(xí)和試錯中,逐漸掌握動作。最終,連機(jī)器人都成了不錯的守門員。(科技日報(bào))