一、自主機器人的系統組成
1、視覺系統
負責感知球(qiu)場上的態勢,視(shi)覺系(xi)統獲得球(qiu)場上的實時圖像(xiang),對圖像(xiang)進(jin)行顏(yan)色分(fen)割,識別(bie)出球(qiu)場上的各個目(mu)標,然后進(jin)行距(ju)離校正,將結果發給(gei)決策程序。
2、決策系統
接收視覺系統(tong)的辨(bian)識結果,對(dui)球場(chang)態(tai)勢進(jin)行分(fen)析,然后做出合理決(jue)策,將命令發送給底層控制系統(tong)。
3、底層控制系統
通(tong)(tong)過串口接(jie)收上位機的命令,控制(zhi)(zhi)各輪走行(xing)電機按照指定速度運行(xing),控制(zhi)(zhi)彈射和持(chi)球電機,將(jiang)底層傳感器的數據通(tong)(tong)過串口發送(song)給上位機 。
4、通信系統
通過無線網絡聯系場(chang)內(nei)機器人和(he)場(chang)外(wai)計算機,進行遙控測試,參數設置等操作以及(ji)控制比賽(sai)的開(kai)始(shi)和(he)終止。
二、自主機器人如何實現學習
絕大多數的(de)(de)(de)(de)基于(yu)(yu)行(xing)為的(de)(de)(de)(de)實現方法都是(shi)對(dui)(dui)(dui)不(bu)同(tong)的(de)(de)(de)(de)任務(wu)(wu)進(jin)行(xing)手工(gong)編程(cheng)的(de)(de)(de)(de),這需要編程(cheng)人員能充分地考慮到各種(zhong)可能出現的(de)(de)(de)(de)情況,對(dui)(dui)(dui)機器人與環境之間的(de)(de)(de)(de)交互有(you)充分的(de)(de)(de)(de)理解,雖(sui)然有(you)些(xie)設計出的(de)(de)(de)(de)系統對(dui)(dui)(dui)于(yu)(yu)很多任務(wu)(wu)和環境而言性能都是(shi)魯棒的(de)(de)(de)(de),但系統對(dui)(dui)(dui)環境并不(bu)具有(you)適應(ying)性。
人不能窮(qiong)盡一切(qie)可能。機(ji)器(qi)人能否通過學(xue)習獲得不能由程序(xu)員手工編碼進去的知識,比如構建一個(ge)未知環境(jing)的地圖,在任(ren)何環境(jing)的性質隨時間變化的任(ren)務中都是必(bi)要的。
當機器(qi)人(ren)元(yuan)件老(lao)化(hua)后,機器(qi)人(ren)的(de)傳感器(qi)和(he)執行機構的(de)性質是可能會發生改變的(de)。
機(ji)(ji)器人(ren)在多機(ji)(ji)器人(ren)的(de)環境中執行,由(you)于(yu)需要(yao)(yao)對其他機(ji)(ji)器人(ren)作出反應,它的(de)策略是(shi)需要(yao)(yao)改變的(de)。學(xue)習(xi)方(fang)法在這(zhe)些情況下(xia)都能發揮重要(yao)(yao)的(de)作用。用學(xue)習(xi)方(fang)法為機(ji)(ji)器人(ren)進行編(bian)程(cheng),而(er)無(wu)須告訴它怎樣達到它的(de)目標,只(zhi)要(yao)(yao)告訴它目標是(shi)什么,讓(rang)它通過(guo)學(xue)習(xi)去滿足這(zhe)個目標,無(wu)疑(yi),這(zhe)種方(fang)法具有很大(da)的(de)吸引力。它是(shi)提高機(ji)(ji)器人(ren)的(de)適應性,降低編(bian)程(cheng)人(ren)員編(bian)程(cheng)強度(du)的(de)必(bi)由(you)之路。
分類
機器人有不(bu)同(tong)層次(ci)(ci)的(de)行為(wei),它們由不(bu)同(tong)層次(ci)(ci)的(de)信息(xi)表達所決(jue)定,因此就存在著不(bu)同(tong)類型的(de)學(xue)習。Broo ks和Mataric總結(jie)出了以下類型的(de)學(xue)習:
1、為(wei)傳感設備(bei)標(biao)定(ding)(ding)或則參數(shu)調節進(jin)行學(xue)習。這種類型(xing)的學(xue)習只在一個特定(ding)(ding)行為(wei)結構中優(you)化操作參數(shu)。
2、學(xue)習(xi)真實世界的知(zhi)識。這(zhe)種類型的學(xue)習(xi)構建與(yu)修改(gai)機器(qi)人對(dui)于真實世界的內部表(biao)達,以利于機器(qi)人作出行為規劃和決策等高層的智能行為。
3、學習已有行(xing)(xing)為的(de)協調。這種類型的(de)學習中(zhong)通過協調已經存在的(de)行(xing)(xing)為被觸發和被執(zhi)行(xing)(xing)的(de)順序來(lai)改變它們對世界(jie)的(de)作用。
4、學習(xi)新的(de)(de)行為。這(zhe)種類(lei)型的(de)(de)學習(xi)建立新的(de)(de)行為結構。
實際問題
機(ji)(ji)器人(ren)領域(yu)對(dui)任何學習(xi)(xi)算法而言都是一個挑戰。在構建擁有(you)學習(xi)(xi)能(neng)力,能(neng)自動進(jin)行知識獲(huo)取的自主機(ji)(ji)器人(ren)的過程中必須面對(dui)許(xu)多煩瑣的有(you)關真實世界(jie)的問題(ti)。
1、傳感器噪聲。大多數(shu)機器人的(de)(de)傳感器是不可靠的(de)(de)。于是由傳感器信號(hao)得到的(de)(de)狀態描述注定是不精(jing)確(que)的(de)(de)。學習算法(fa)必須能(neng)夠處理噪聲,因此經常需要用統計平滑技術克服噪音的(de)(de)影響。
算法的易駕馭性(xing)。機器人(ren)必須對不(bu)可預見的環境進行實時響應。因此(ci)學習算法必須不(bu)能(neng)過于復雜,算法的每一次迭代都(dou)必須能(neng)實時地完(wan)成(cheng)。
2、增量式的算(suan)法(fa)(fa)。學習算(suan)法(fa)(fa)必須允許(xu)機器人邊學習邊改善自己(ji)的性能(neng)(neng)。因為機器人必須一(yi)(yi)邊收集經驗(yan)一(yi)(yi)邊進行(xing)學習. 形成經驗(yan)的數(shu)據不能(neng)(neng)離線獲得(de)。
3、有限(xian)的(de)訓(xun)練時(shi)(shi)間(jian)。機器人的(de)訓(xun)練時(shi)(shi)間(jian)是非常有限(xian)的(de)。學習算法必須在合(he)理的(de)運算次數中收斂(lian),因為(wei)機器人需要(yao)完(wan)成任務,在真(zhen)實的(de)機器人上進行上百萬次的(de)動作是極為(wei)困難的(de)。
堅(jian)實的信(xin)(xin)息(xi)來(lai)源。 所有(you)機器(qi)(qi)人可以獲得(de)的信(xin)(xin)息(xi)都必(bi)須最終來(lai)至從它的傳(chuan)(chuan)感(gan)器(qi)(qi)抽取(qu)得(de)到(dao)的信(xin)(xin)息(xi)或初始狀態時(shi)強行編碼進去的知識。由于(yu)狀態信(xin)(xin)息(xi)是由傳(chuan)(chuan)感(gan)器(qi)(qi)數據計算得(de)到(dao)的,學習(xi)算法必(bi)須能和感(gan)知設備的限制一起工作.明(ming)顯地,能否解決以上提出的一些(xie)問題決定了(le)用在真實機器(qi)(qi)人上的學習(xi)算法的成功(gong)與否。
學習方法
在(zai)機器人(ren)研(yan)究領(ling)域中有(you)三種(zhong)主(zhu)要的學(xue)習方(fang)法(fa)(fa)變(bian)得越來(lai)越流行。它(ta)們是強(qiang)化(hua)學(xue)習( RL) ,進化(hua)方(fang)法(fa)(fa)( GA和(he)(he)EP)和(he)(he)基(ji)于人(ren)工(gong)神經網絡( ANN )的方(fang)法(fa)(fa)。其中應用得最為(wei)廣(guang)泛(fan)的方(fang)法(fa)(fa)是強(qiang)化(hua)學(xue)習方(fang)法(fa)(fa).在(zai)學(xue)習新(xin)的行為(wei)和(he)(he)學(xue)習協(xie)調已經存在(zai)的行為(wei)兩種(zhong)情況下(xia)都可以(yi)(yi)用到強(qiang)化(hua)學(xue)習的方(fang)法(fa)(fa)。 強(qiang)化(hua)方(fang)法(fa)(fa)是一種(zhong)無監督(du)的學(xue)習算法(fa)(fa),它(ta)比較好(hao)地符合(he)人(ren)們解決問題的心理習慣(guan),和(he)(he)傳統人(ren)工(gong)智能以(yi)(yi)及優(you)化(hua)算法(fa)(fa)聯(lian)系緊密,有(you)普遍適的用性,因此獲得了最廣(guang)泛(fan)的關注。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。