更多精彩內(nèi)容,歡迎關(guān)注:

視頻號(hào)
視頻號(hào)

抖音
抖音

快手
快手

微博
微博

科技前沿:算法讓機(jī)器狗在一小時(shí)內(nèi)學(xué)會(huì)走路

導(dǎo)讀智能機(jī)器人像新生動(dòng)物一樣,一個(gè)四足機(jī)器人在第一次嘗試行走時(shí)會(huì)絆倒。但是,雖然小馬駒或長(zhǎng)頸鹿需要更長(zhǎng)的時(shí)間才能掌握行走,但機(jī)器人只需一個(gè)小時(shí)就能學(xué)會(huì)流暢地向前移動(dòng)。計(jì)算機(jī)程序充當(dāng)動(dòng)物脊髓的人工演示,并學(xué)習(xí)在短時(shí)間內(nèi)優(yōu)化機(jī)器人的運(yùn)動(dòng)。人工神經(jīng)網(wǎng)絡(luò)在開(kāi)始時(shí)尚未進(jìn)行理想調(diào)整,但可以快速自我調(diào)整。

智能機(jī)器人像新生動(dòng)物一樣,一個(gè)四足機(jī)器人在第一次嘗試行走時(shí)會(huì)絆倒。但是,雖然小馬駒或長(zhǎng)頸鹿需要更長(zhǎng)的時(shí)間才能掌握行走,但機(jī)器人只需一個(gè)小時(shí)就能學(xué)會(huì)流暢地向前移動(dòng)。計(jì)算機(jī)程序充當(dāng)動(dòng)物脊髓的人工演示,并學(xué)習(xí)在短時(shí)間內(nèi)優(yōu)化機(jī)器人的運(yùn)動(dòng)。人工神經(jīng)網(wǎng)絡(luò)在開(kāi)始時(shí)尚未進(jìn)行理想調(diào)整,但可以快速自我調(diào)整。

新生長(zhǎng)頸鹿或小馬駒必須學(xué)會(huì)用腿走路,以盡可能快地避開(kāi)捕食者。動(dòng)物天生具有位于脊髓的肌肉協(xié)調(diào)網(wǎng)絡(luò)。然而,學(xué)習(xí)腿部肌肉和肌腱的精確協(xié)調(diào)需要一些時(shí)間。最初,幼年動(dòng)物嚴(yán)重依賴硬連線脊髓反射。接下來(lái),必須練習(xí)更先進(jìn)和精確的肌肉控制,直到神經(jīng)系統(tǒng)最終很好地適應(yīng)幼年動(dòng)物的腿部肌肉和肌腱。

斯圖加特馬克斯·普朗克智能系統(tǒng)研究所(MPI-IS)的研究人員進(jìn)行了一項(xiàng)研究,以了解動(dòng)物是如何學(xué)會(huì)走路和從絆倒中學(xué)習(xí)的。他們制造了一個(gè)四條腿、狗大小的機(jī)器人,幫助他們了解細(xì)節(jié)。

MPI-IS動(dòng)力運(yùn)動(dòng)研究小組的前博士生菲利克斯·魯佩特(Felix Ruppert)說(shuō):“作為工程師和機(jī)器人專家,我們通過(guò)制造一種具有與動(dòng)物一樣的反射功能并能從錯(cuò)誤中學(xué)習(xí)的機(jī)器人來(lái)尋找答案。但是如果它經(jīng)常絆倒,它會(huì)給我們一個(gè)衡量機(jī)器人行走能力的標(biāo)準(zhǔn)。”

Felix Ruppert是《在閉環(huán)中央模式生成器中學(xué)習(xí)機(jī)器人動(dòng)力學(xué)的塑料匹配》一書的第一作者,該書于2022年7月18日發(fā)表在《自然機(jī)器智能》雜志上。

學(xué)習(xí)算法優(yōu)化虛擬脊髓

在一個(gè)小時(shí)內(nèi)學(xué)會(huì)走路后,魯佩特的機(jī)器人很好地利用了其復(fù)雜的腿部力學(xué)。貝葉斯優(yōu)化算法指導(dǎo)學(xué)習(xí):測(cè)量的腳部傳感器信息與作為程序在機(jī)器人計(jì)算機(jī)中運(yùn)行的模擬虛擬脊髓的目標(biāo)數(shù)據(jù)相匹配。機(jī)器人通過(guò)不斷比較發(fā)送的和預(yù)期的傳感器信息、運(yùn)行反射回路和調(diào)整其電機(jī)控制模式來(lái)學(xué)習(xí)行走。

該學(xué)習(xí)算法適應(yīng)中央模式生成器(CPG)的控制參數(shù)。在人類和動(dòng)物中,這些中央模式發(fā)生器是脊髓中的神經(jīng)元網(wǎng)絡(luò),在沒(méi)有大腦輸入的情況下產(chǎn)生周期性肌肉收縮。中央模式生成器網(wǎng)絡(luò)有助于生成有節(jié)奏的任務(wù),如行走、眨眼或消化。此外,反射是由連接腿部傳感器和脊髓的硬編碼神經(jīng)通路觸發(fā)的非自愿運(yùn)動(dòng)控制動(dòng)作。

只要小動(dòng)物在一個(gè)完全平坦的表面上行走,中央肌電圖就足以控制來(lái)自脊髓的運(yùn)動(dòng)信號(hào)。然而,地面上的一個(gè)小腫塊改變了行走。反射開(kāi)始并調(diào)整動(dòng)作模式,以防止動(dòng)物摔倒。運(yùn)動(dòng)信號(hào)中的這些瞬時(shí)變化是可逆的,或“彈性的”,并且在干擾后,運(yùn)動(dòng)模式恢復(fù)到其原始配置。

但是,如果動(dòng)物在許多運(yùn)動(dòng)周期中沒(méi)有停止跌跌撞撞——盡管有積極的反射——那么必須重新學(xué)習(xí)運(yùn)動(dòng)模式并使其“可塑”,即不可逆。在新生動(dòng)物中,CpG最初調(diào)整得不夠好,動(dòng)物在平坦或不平坦的地形上蹣跚而行。但是,這種動(dòng)物很快學(xué)會(huì)了它的中央處理器和反射如何控制腿部肌肉和肌腱。

拉布拉多大小的名為“莫蒂”的機(jī)器狗也是如此。更重要的是,機(jī)器人在大約一個(gè)小時(shí)內(nèi)比動(dòng)物更快地優(yōu)化其運(yùn)動(dòng)模式。莫蒂的中央處理器是在一個(gè)小而輕的計(jì)算機(jī)上模擬的,該計(jì)算機(jī)控制著機(jī)器人腿的運(yùn)動(dòng)。這個(gè)虛擬脊髓被放置在四足機(jī)器人的背部,頭部所在的位置。在機(jī)器人順利行走所需的一小時(shí)內(nèi),來(lái)自機(jī)器人腳的傳感器數(shù)據(jù)會(huì)不斷與機(jī)器人的中央處理器預(yù)測(cè)的預(yù)期著陸進(jìn)行比較。如果機(jī)器人絆倒,學(xué)習(xí)算法會(huì)改變腿來(lái)回?cái)[動(dòng)的距離、擺動(dòng)的速度以及腿在地面上的長(zhǎng)度。調(diào)整后的運(yùn)動(dòng)也會(huì)影響機(jī)器人如何更好地利用其柔順的腿部力學(xué)。在學(xué)習(xí)過(guò)程中,中央處理器發(fā)送適應(yīng)的電機(jī)信號(hào),使機(jī)器人從此減少絆倒并優(yōu)化其行走。在這個(gè)框架中,虛擬脊髓沒(méi)有關(guān)于機(jī)器人腿部設(shè)計(jì)、電機(jī)和彈簧的明確知識(shí)。由于對(duì)機(jī)器的物理一無(wú)所知,它缺少一個(gè)機(jī)器人“模型”。

Ruppert解釋說(shuō):“我們的機(jī)器人實(shí)際上是‘天生’的,對(duì)腿的解剖結(jié)構(gòu)或工作方式一無(wú)所知。CPG類似于自然界提供的內(nèi)置自動(dòng)行走智能,我們已經(jīng)將其傳輸?shù)綑C(jī)器人。計(jì)算機(jī)產(chǎn)生控制腿部電機(jī)的信號(hào),機(jī)器人最初行走和絆倒。數(shù)據(jù)從傳感器返回虛擬脊髓,在那里比較傳感器和CPG數(shù)據(jù)。如果傳感器數(shù)據(jù)與預(yù)期數(shù)據(jù)不匹配,學(xué)習(xí)alg算法改變行走行為,直到機(jī)器人行走良好,沒(méi)有絆倒。在保持反射活躍和監(jiān)測(cè)機(jī)器人步履蹣跚的同時(shí),更改中央處理器輸出是學(xué)習(xí)過(guò)程的核心部分?!?/p>

節(jié)能機(jī)器人狗控制

莫蒂的電腦在行走過(guò)程中只消耗5瓦的電力。知名制造商生產(chǎn)的工業(yè)四足機(jī)器人已經(jīng)學(xué)會(huì)了在復(fù)雜控制器的幫助下運(yùn)行,因此耗電量要大得多。他們的控制器用機(jī)器人的精確質(zhì)量和身體幾何形狀的知識(shí)編碼——使用機(jī)器人模型。它們通常需要幾十瓦,甚至幾百瓦的功率。這兩種機(jī)器人都能動(dòng)態(tài)高效地運(yùn)行,但在斯圖加特模型中,計(jì)算能耗要低得多。它還提供了對(duì)動(dòng)物解剖學(xué)的重要見(jiàn)解。

亞歷山大·巴德里·斯普羅維茨(AlexanderBadri Spr witz)說(shuō):“我們不容易研究活動(dòng)物的脊髓。但我們可以在機(jī)器人中模擬一個(gè)?!彼c魯佩特(Ruppert)共同撰寫了這本出版物,并領(lǐng)導(dǎo)著動(dòng)態(tài)運(yùn)動(dòng)研究小組?!拔覀冎涝S多動(dòng)物中都存在這些CpG。我們知道反射是嵌入的;但我們?nèi)绾螌烧呓Y(jié)合起來(lái),使動(dòng)物通過(guò)反射和CpG學(xué)習(xí)動(dòng)作?這是機(jī)器人學(xué)和生物學(xué)交叉點(diǎn)的基礎(chǔ)研究。機(jī)器人模型為我們回答了生物學(xué)本身無(wú)法回答的問(wèn)題?!?/p>

以上就是小編的分享,希望可以幫助到大家。

為你推薦
資訊專欄
熱門視頻
相關(guān)推薦
萬(wàn)物互聯(lián)著眼未來(lái),八方IOT系統(tǒng)開(kāi)啟人機(jī)互動(dòng)新局面! AITO 問(wèn)界M5為何是服務(wù)與生態(tài)定義的高品質(zhì)汽車智能座艙? 5G資費(fèi)為何這么貴,是4G用著不香嗎? 智聯(lián)時(shí)代不再遙遠(yuǎn),5G通信為數(shù)智化發(fā)展注入新動(dòng)能! 食用香菇時(shí)需要注意什么 升級(jí)iOS15.6正式版,5G信號(hào)更穩(wěn)定,續(xù)航好更省電! 又一國(guó)產(chǎn)神秘新機(jī)發(fā)布,搭載鴻蒙系統(tǒng)+麒麟5G芯片! 百合一年四季都可以食用嗎 為期五年,約7100個(gè)基站,諾基亞贏得挪威全國(guó)性5G合同! 營(yíng)養(yǎng)豐富葷素搭配的胡蘿卜炒牛肉 橄欖油如何吃才能吃出健康 為什么說(shuō)買浴霸前一定要把它看完? 為了減肥長(zhǎng)期不吃晚飯真的好嗎 難忘的長(zhǎng)沙街頭小吃臭豆腐,一份美好記憶 大暑來(lái)了怎么辦?廣式羅漢果菊花涼茶助你輕松度夏 艾佳生活和你一起營(yíng)造一個(gè)更加溫馨的家 萬(wàn)物皆可塞冰箱,凍過(guò)的水果給你絕對(duì)的驚喜 以后家里的這些“小物件”,千萬(wàn)別亂放可能影響風(fēng)水 超級(jí)治愈系美食,沒(méi)有人能拒絕芝士蛋糕 帶你打卡那些好吃到停不下來(lái)的美食街 三大功能全面升級(jí),訊飛智能錄音筆SR501高質(zhì)體驗(yàn) 蘋果35W雙C口充電器要價(jià)399元 蘋果5G芯片研發(fā)失敗,反觀華為是怎么做成的? 與傳統(tǒng)門店相比 做全域新零售運(yùn)營(yíng)模式的優(yōu)勢(shì)有哪些? 一證通查詢手機(jī)號(hào)綁了多少互聯(lián)網(wǎng)賬號(hào) 有人建議取消外賣和關(guān)閉電商,恢復(fù)往日繁榮,你同意這種做法嗎? Cleer HALO無(wú)線頸戴音箱,聆聽(tīng)耳機(jī)與音響完美結(jié)合的美妙世界! 名為游戲?qū)崬槿艿穆?lián)想拯救者Y700游戲平板,體驗(yàn)感為何這么好? 備受青睞的vivo WATCH 2微信手表版,哪些產(chǎn)品優(yōu)勢(shì)成就了它? 支持約25小時(shí)長(zhǎng)續(xù)航的索尼新款頸掛式無(wú)線耳機(jī),你心動(dòng)了嗎? 趨近完美的第五款折疊屏旗艦,華為Mate Xs 2體驗(yàn)感爆棚! 秘制紅燒肉大碗面,好吃到?jīng)]商量 千元檔高品質(zhì)手機(jī),5G大內(nèi)存長(zhǎng)續(xù)航,榮耀暢玩30實(shí)戰(zhàn)測(cè)評(píng)! 在家就能做的芝士漢堡 操作簡(jiǎn)單易上手 教你制作美味不輸西餐的番茄意面 搭載頂配麒麟,華為mate50系列5款機(jī)器的優(yōu)勢(shì)在哪? 一看就會(huì)的糖醋里脊實(shí)用家常做法 相比三星Z Flip4,聯(lián)想moto Razr 2022這款機(jī)型更有意思! 簡(jiǎn)單幾步做出地道美味的魚香肉絲 吃一次就上癮的宮保雞丁正確打開(kāi)方式
Top