一、自主機器人的系統組成
1、視覺系統
負(fu)責感(gan)知球場上(shang)的(de)態勢,視覺(jue)系統獲(huo)得球場上(shang)的(de)實(shi)時(shi)圖像,對圖像進(jin)行(xing)顏色分割,識(shi)別出球場上(shang)的(de)各個目標,然后進(jin)行(xing)距離校正,將結果發(fa)給決策程序。
2、決策系統
接收(shou)視(shi)覺系(xi)統(tong)的辨識結果,對球場態勢進行分(fen)析,然(ran)后做出合(he)理決(jue)策,將命(ming)令發送(song)給底層(ceng)控(kong)制系(xi)統(tong)。
3、底層控制系統
通過(guo)(guo)串(chuan)口接收上(shang)位(wei)機(ji)的命(ming)令,控制(zhi)各輪走行電機(ji)按(an)照指定速度運行,控制(zhi)彈射和持球電機(ji),將底(di)層傳感器的數據通過(guo)(guo)串(chuan)口發送給上(shang)位(wei)機(ji) 。
4、通信系統
通過無線網絡聯系場內機(ji)器人和場外計算機(ji),進(jin)行遙控測(ce)試,參數設置等操作以及控制比賽的開始(shi)和終止。
二、自主機器人如何實現學習
絕大多(duo)數的(de)基于行(xing)為(wei)的(de)實(shi)現(xian)方法都(dou)是(shi)對(dui)不同的(de)任務(wu)進行(xing)手(shou)工(gong)編程(cheng)的(de),這(zhe)需要(yao)編程(cheng)人(ren)員(yuan)能(neng)充(chong)分地考慮(lv)到各種可能(neng)出(chu)現(xian)的(de)情況,對(dui)機器人(ren)與環境(jing)之(zhi)間的(de)交(jiao)互(hu)有(you)充(chong)分的(de)理(li)解,雖然(ran)有(you)些設(she)計出(chu)的(de)系統(tong)對(dui)于很多(duo)任務(wu)和環境(jing)而言性能(neng)都(dou)是(shi)魯棒(bang)的(de),但(dan)系統(tong)對(dui)環境(jing)并不具有(you)適應性。
人(ren)不能窮盡一切(qie)可能。機器(qi)人(ren)能否通過學習(xi)獲得不能由程序員(yuan)手工編(bian)碼(ma)進去的(de)知識,比如構建(jian)一個(ge)未知環(huan)境(jing)的(de)地圖,在任何環(huan)境(jing)的(de)性質隨時間變(bian)化的(de)任務中都(dou)是必要的(de)。
當機器人(ren)元件老化后,機器人(ren)的(de)傳感器和(he)執(zhi)行(xing)機構的(de)性質是(shi)可能會發生(sheng)改變的(de)。
機器(qi)人在(zai)多機器(qi)人的(de)環境中執行,由(you)(you)于需要(yao)對其他機器(qi)人作(zuo)(zuo)出反應,它(ta)的(de)策略是(shi)需要(yao)改變(bian)的(de)。學(xue)習方法在(zai)這(zhe)些情況下(xia)都能發揮(hui)重要(yao)的(de)作(zuo)(zuo)用(yong)。用(yong)學(xue)習方法為機器(qi)人進行編程(cheng)(cheng),而無須告訴它(ta)怎(zen)樣達到它(ta)的(de)目(mu)標,只(zhi)要(yao)告訴它(ta)目(mu)標是(shi)什(shen)么,讓它(ta)通過(guo)學(xue)習去(qu)滿足這(zhe)個目(mu)標,無疑,這(zhe)種方法具有很大的(de)吸引(yin)力(li)。它(ta)是(shi)提高(gao)機器(qi)人的(de)適應性(xing),降低編程(cheng)(cheng)人員編程(cheng)(cheng)強度的(de)必由(you)(you)之(zhi)路。
分類
機器人有(you)不(bu)同層次的行(xing)為(wei),它們由不(bu)同層次的信息表(biao)達(da)所決(jue)定,因此就存在(zai)著不(bu)同類型(xing)的學習(xi)。Broo ks和Mataric總結出(chu)了(le)以下類型(xing)的學習(xi):
1、為(wei)傳(chuan)感(gan)設備標定或(huo)則參數(shu)調節進行學習。這(zhe)種類(lei)型的學習只(zhi)在(zai)一(yi)個特定行為(wei)結(jie)構中優化操作(zuo)參數(shu)。
2、學習真實(shi)世(shi)界的(de)(de)(de)知識(shi)。這種類型的(de)(de)(de)學習構建與修(xiu)改(gai)機器(qi)人(ren)對于真實(shi)世(shi)界的(de)(de)(de)內(nei)部(bu)表達(da),以(yi)利于機器(qi)人(ren)作出行(xing)為(wei)規劃和決策等高層的(de)(de)(de)智能行(xing)為(wei)。
3、學習已(yi)有(you)行(xing)(xing)為的(de)(de)協調。這(zhe)種類型的(de)(de)學習中通過協調已(yi)經存(cun)在的(de)(de)行(xing)(xing)為被觸發和被執行(xing)(xing)的(de)(de)順序(xu)來改變它們對世(shi)界的(de)(de)作用。
4、學習(xi)新(xin)的(de)行為。這種類型的(de)學習(xi)建立新(xin)的(de)行為結(jie)構。
實際問題
機器(qi)人領域(yu)對任何學習(xi)算法而言都是一個挑(tiao)戰。在構建擁有學習(xi)能(neng)力,能(neng)自動進行(xing)知識獲取的(de)(de)自主機器(qi)人的(de)(de)過程中必須面(mian)對許多煩瑣(suo)的(de)(de)有關真實世界的(de)(de)問(wen)題。
1、傳感(gan)器(qi)噪(zao)聲。大(da)多數(shu)機器(qi)人的傳感(gan)器(qi)是不(bu)可靠(kao)的。于(yu)是由傳感(gan)器(qi)信號得到的狀態描述注定是不(bu)精確的。學習算法(fa)必須能夠處理噪(zao)聲,因(yin)此(ci)經常需要用統計平(ping)滑技術(shu)克服噪(zao)音(yin)的影響(xiang)。
算(suan)(suan)法的(de)易駕馭性。機(ji)器人必須對不可預見的(de)環境進行實時響應。因(yin)此學習算(suan)(suan)法必須不能(neng)過于復雜,算(suan)(suan)法的(de)每一次迭代都必須能(neng)實時地完成。
2、增量(liang)式的(de)(de)算法。學(xue)習(xi)算法必須允許機器人(ren)(ren)邊學(xue)習(xi)邊改善自己的(de)(de)性能。因為機器人(ren)(ren)必須一(yi)邊收集經驗一(yi)邊進行學(xue)習(xi). 形成經驗的(de)(de)數(shu)據不能離線獲得。
3、有限的(de)(de)訓練時(shi)間。機器人的(de)(de)訓練時(shi)間是非常有限的(de)(de)。學習算法必須在合理(li)的(de)(de)運算次數中收(shou)斂,因為(wei)機器人需要完成任(ren)務,在真(zhen)實的(de)(de)機器人上(shang)進行上(shang)百萬次的(de)(de)動(dong)作是極為(wei)困難的(de)(de)。
堅實的(de)(de)信(xin)(xin)息來(lai)源(yuan)。 所有機器人可(ke)以獲得(de)(de)的(de)(de)信(xin)(xin)息都必須最終來(lai)至從它的(de)(de)傳(chuan)感器抽取得(de)(de)到的(de)(de)信(xin)(xin)息或(huo)初始狀態時強行編碼(ma)進(jin)去的(de)(de)知(zhi)(zhi)識(shi)。由(you)于(yu)狀態信(xin)(xin)息是由(you)傳(chuan)感器數(shu)據計(ji)算得(de)(de)到的(de)(de),學習(xi)算法(fa)必須能(neng)和(he)感知(zhi)(zhi)設備的(de)(de)限(xian)制一(yi)起工(gong)作(zuo).明顯地,能(neng)否(fou)解(jie)決以上(shang)提(ti)出(chu)的(de)(de)一(yi)些問題決定了用在(zai)真實機器人上(shang)的(de)(de)學習(xi)算法(fa)的(de)(de)成功與(yu)否(fou)。
學習方法
在(zai)機器人(ren)研究領(ling)域中(zhong)有三(san)種(zhong)主要(yao)的(de)(de)(de)學(xue)習(xi)(xi)方(fang)法(fa)變得(de)越(yue)來越(yue)流行(xing)。它們是(shi)強化(hua)(hua)(hua)學(xue)習(xi)(xi)( RL) ,進化(hua)(hua)(hua)方(fang)法(fa)( GA和EP)和基于人(ren)工(gong)神經網絡( ANN )的(de)(de)(de)方(fang)法(fa)。其(qi)中(zhong)應用得(de)最為(wei)廣泛的(de)(de)(de)方(fang)法(fa)是(shi)強化(hua)(hua)(hua)學(xue)習(xi)(xi)方(fang)法(fa).在(zai)學(xue)習(xi)(xi)新的(de)(de)(de)行(xing)為(wei)和學(xue)習(xi)(xi)協(xie)調已經存(cun)在(zai)的(de)(de)(de)行(xing)為(wei)兩種(zhong)情況(kuang)下都可以用到(dao)強化(hua)(hua)(hua)學(xue)習(xi)(xi)的(de)(de)(de)方(fang)法(fa)。 強化(hua)(hua)(hua)方(fang)法(fa)是(shi)一種(zhong)無監督(du)的(de)(de)(de)學(xue)習(xi)(xi)算法(fa),它比較好地符合人(ren)們解決(jue)問(wen)題的(de)(de)(de)心理習(xi)(xi)慣,和傳統人(ren)工(gong)智能以及(ji)優化(hua)(hua)(hua)算法(fa)聯系緊密,有普(pu)遍適的(de)(de)(de)用性(xing),因此獲得(de)了最廣泛的(de)(de)(de)關注。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。