科技前沿：算法讓機(jī)器狗在一小時(shí)內(nèi)學(xué)會走路

導(dǎo)讀智能機(jī)器人像新生動(dòng)物一樣，一個(gè)四足機(jī)器人在第一次嘗試行走時(shí)會絆倒。但是，雖然小馬駒或長頸鹿需要更長的時(shí)間才能掌握行走，但機(jī)器人只需一個(gè)小時(shí)就能學(xué)會流暢地向前移動(dòng)。計(jì)算機(jī)程序充當(dāng)動(dòng)物脊髓的人工演示，并學(xué)習(xí)在短時(shí)間內(nèi)優(yōu)化機(jī)器人的運(yùn)動(dòng)。人工神經(jīng)網(wǎng)絡(luò)在開始時(shí)尚未進(jìn)行理想調(diào)整，但可以快速自我調(diào)整。

智能機(jī)器人像新生動(dòng)物一樣，一個(gè)四足機(jī)器人在第一次嘗試行走時(shí)會絆倒。但是，雖然小馬駒或長頸鹿需要更長的時(shí)間才能掌握行走，但機(jī)器人只需一個(gè)小時(shí)就能學(xué)會流暢地向前移動(dòng)。計(jì)算機(jī)程序充當(dāng)動(dòng)物脊髓的人工演示，并學(xué)習(xí)在短時(shí)間內(nèi)優(yōu)化機(jī)器人的運(yùn)動(dòng)。人工神經(jīng)網(wǎng)絡(luò)在開始時(shí)尚未進(jìn)行理想調(diào)整，但可以快速自我調(diào)整。

新生長頸鹿或小馬駒必須學(xué)會用腿走路，以盡可能快地避開捕食者。動(dòng)物天生具有位于脊髓的肌肉協(xié)調(diào)網(wǎng)絡(luò)。然而，學(xué)習(xí)腿部肌肉和肌腱的精確協(xié)調(diào)需要一些時(shí)間。最初，幼年動(dòng)物嚴(yán)重依賴硬連線脊髓反射。接下來，必須練習(xí)更先進(jìn)和精確的肌肉控制，直到神經(jīng)系統(tǒng)最終很好地適應(yīng)幼年動(dòng)物的腿部肌肉和肌腱。

斯圖加特馬克斯·普朗克智能系統(tǒng)研究所（MPI-IS）的研究人員進(jìn)行了一項(xiàng)研究，以了解動(dòng)物是如何學(xué)會走路和從絆倒中學(xué)習(xí)的。他們制造了一個(gè)四條腿、狗大小的機(jī)器人，幫助他們了解細(xì)節(jié)。

MPI-IS動(dòng)力運(yùn)動(dòng)研究小組的前博士生菲利克斯·魯佩特（Felix Ruppert）說：“作為工程師和機(jī)器人專家，我們通過制造一種具有與動(dòng)物一樣的反射功能并能從錯(cuò)誤中學(xué)習(xí)的機(jī)器人來尋找答案。但是如果它經(jīng)常絆倒，它會給我們一個(gè)衡量機(jī)器人行走能力的標(biāo)準(zhǔn)。”

Felix Ruppert是《在閉環(huán)中央模式生成器中學(xué)習(xí)機(jī)器人動(dòng)力學(xué)的塑料匹配》一書的第一作者，該書于2022年7月18日發(fā)表在《自然機(jī)器智能》雜志上。

學(xué)習(xí)算法優(yōu)化虛擬脊髓

在一個(gè)小時(shí)內(nèi)學(xué)會走路后，魯佩特的機(jī)器人很好地利用了其復(fù)雜的腿部力學(xué)。貝葉斯優(yōu)化算法指導(dǎo)學(xué)習(xí)：測量的腳部傳感器信息與作為程序在機(jī)器人計(jì)算機(jī)中運(yùn)行的模擬虛擬脊髓的目標(biāo)數(shù)據(jù)相匹配。機(jī)器人通過不斷比較發(fā)送的和預(yù)期的傳感器信息、運(yùn)行反射回路和調(diào)整其電機(jī)控制模式來學(xué)習(xí)行走。

該學(xué)習(xí)算法適應(yīng)中央模式生成器（CPG）的控制參數(shù)。在人類和動(dòng)物中，這些中央模式發(fā)生器是脊髓中的神經(jīng)元網(wǎng)絡(luò)，在沒有大腦輸入的情況下產(chǎn)生周期性肌肉收縮。中央模式生成器網(wǎng)絡(luò)有助于生成有節(jié)奏的任務(wù)，如行走、眨眼或消化。此外，反射是由連接腿部傳感器和脊髓的硬編碼神經(jīng)通路觸發(fā)的非自愿運(yùn)動(dòng)控制動(dòng)作。

只要小動(dòng)物在一個(gè)完全平坦的表面上行走，中央肌電圖就足以控制來自脊髓的運(yùn)動(dòng)信號。然而，地面上的一個(gè)小腫塊改變了行走。反射開始并調(diào)整動(dòng)作模式，以防止動(dòng)物摔倒。運(yùn)動(dòng)信號中的這些瞬時(shí)變化是可逆的，或“彈性的”，并且在干擾后，運(yùn)動(dòng)模式恢復(fù)到其原始配置。

但是，如果動(dòng)物在許多運(yùn)動(dòng)周期中沒有停止跌跌撞撞——盡管有積極的反射——那么必須重新學(xué)習(xí)運(yùn)動(dòng)模式并使其“可塑”，即不可逆。在新生動(dòng)物中，CpG最初調(diào)整得不夠好，動(dòng)物在平坦或不平坦的地形上蹣跚而行。但是，這種動(dòng)物很快學(xué)會了它的中央處理器和反射如何控制腿部肌肉和肌腱。

拉布拉多大小的名為“莫蒂”的機(jī)器狗也是如此。更重要的是，機(jī)器人在大約一個(gè)小時(shí)內(nèi)比動(dòng)物更快地優(yōu)化其運(yùn)動(dòng)模式。莫蒂的中央處理器是在一個(gè)小而輕的計(jì)算機(jī)上模擬的，該計(jì)算機(jī)控制著機(jī)器人腿的運(yùn)動(dòng)。這個(gè)虛擬脊髓被放置在四足機(jī)器人的背部，頭部所在的位置。在機(jī)器人順利行走所需的一小時(shí)內(nèi)，來自機(jī)器人腳的傳感器數(shù)據(jù)會不斷與機(jī)器人的中央處理器預(yù)測的預(yù)期著陸進(jìn)行比較。如果機(jī)器人絆倒，學(xué)習(xí)算法會改變腿來回?cái)[動(dòng)的距離、擺動(dòng)的速度以及腿在地面上的長度。調(diào)整后的運(yùn)動(dòng)也會影響機(jī)器人如何更好地利用其柔順的腿部力學(xué)。在學(xué)習(xí)過程中，中央處理器發(fā)送適應(yīng)的電機(jī)信號，使機(jī)器人從此減少絆倒并優(yōu)化其行走。在這個(gè)框架中，虛擬脊髓沒有關(guān)于機(jī)器人腿部設(shè)計(jì)、電機(jī)和彈簧的明確知識。由于對機(jī)器的物理一無所知，它缺少一個(gè)機(jī)器人“模型”。

Ruppert解釋說：“我們的機(jī)器人實(shí)際上是‘天生’的，對腿的解剖結(jié)構(gòu)或工作方式一無所知。CPG類似于自然界提供的內(nèi)置自動(dòng)行走智能，我們已經(jīng)將其傳輸?shù)綑C(jī)器人。計(jì)算機(jī)產(chǎn)生控制腿部電機(jī)的信號，機(jī)器人最初行走和絆倒。數(shù)據(jù)從傳感器返回虛擬脊髓，在那里比較傳感器和CPG數(shù)據(jù)。如果傳感器數(shù)據(jù)與預(yù)期數(shù)據(jù)不匹配，學(xué)習(xí)alg算法改變行走行為，直到機(jī)器人行走良好，沒有絆倒。在保持反射活躍和監(jiān)測機(jī)器人步履蹣跚的同時(shí)，更改中央處理器輸出是學(xué)習(xí)過程的核心部分。”

節(jié)能機(jī)器人狗控制

莫蒂的電腦在行走過程中只消耗5瓦的電力。知名制造商生產(chǎn)的工業(yè)四足機(jī)器人已經(jīng)學(xué)會了在復(fù)雜控制器的幫助下運(yùn)行，因此耗電量要大得多。他們的控制器用機(jī)器人的精確質(zhì)量和身體幾何形狀的知識編碼——使用機(jī)器人模型。它們通常需要幾十瓦，甚至幾百瓦的功率。這兩種機(jī)器人都能動(dòng)態(tài)高效地運(yùn)行，但在斯圖加特模型中，計(jì)算能耗要低得多。它還提供了對動(dòng)物解剖學(xué)的重要見解。

亞歷山大·巴德里·斯普羅維茨（AlexanderBadri Spr witz）說：“我們不容易研究活動(dòng)物的脊髓。但我們可以在機(jī)器人中模擬一個(gè)。”他與魯佩特（Ruppert）共同撰寫了這本出版物，并領(lǐng)導(dǎo)著動(dòng)態(tài)運(yùn)動(dòng)研究小組。“我們知道許多動(dòng)物中都存在這些CpG。我們知道反射是嵌入的；但我們?nèi)绾螌烧呓Y(jié)合起來，使動(dòng)物通過反射和CpG學(xué)習(xí)動(dòng)作？這是機(jī)器人學(xué)和生物學(xué)交叉點(diǎn)的基礎(chǔ)研究。機(jī)器人模型為我們回答了生物學(xué)本身無法回答的問題?！?/p>

以上就是小編的分享，希望可以幫助到大家。

為你推薦

資訊專欄

熱門視頻

相關(guān)推薦

科技

美食

生活

娛樂

健康

母嬰

教育

體育

更多

汽車

游戲

旅游

時(shí)尚

財(cái)經(jīng)

寵物

視頻號

抖音

快手

微博

首頁

電子數(shù)碼

互聯(lián)網(wǎng)

APP應(yīng)用

智能硬件

軟件測評

手機(jī)系統(tǒng)

5G/6G

科技百科

人工智能

科技前沿：算法讓機(jī)器狗在一小時(shí)內(nèi)學(xué)會走路