一、自主機器人的系統組成
1、視覺系統
負(fu)責感知球(qiu)場(chang)上(shang)的態勢,視覺系(xi)統獲得球(qiu)場(chang)上(shang)的實時圖像(xiang),對圖像(xiang)進行(xing)顏色分割,識別出球(qiu)場(chang)上(shang)的各個目標,然后(hou)進行(xing)距(ju)離校正,將結(jie)果發給(gei)決策(ce)程序(xu)。
2、決策系統
接收視(shi)覺(jue)系統的(de)辨(bian)識結果,對(dui)球場態勢(shi)進(jin)行分析,然后做(zuo)出(chu)合(he)理決策,將命令(ling)發送給底(di)層控制系統。
3、底層控制系統
通過串(chuan)口(kou)接收上(shang)位機的命令(ling),控制各輪(lun)走行(xing)(xing)電機按(an)照指定(ding)速度運行(xing)(xing),控制彈射和持球電機,將底層傳感器的數據(ju)通過串(chuan)口(kou)發(fa)送給上(shang)位機 。
4、通信系統
通過無線網絡聯系場內(nei)機器人(ren)和(he)場外計(ji)算機,進行遙(yao)控測試,參數(shu)設置(zhi)等操作以及控制比賽的開始和(he)終止。
二、自主機器人如何實現學習
絕大多(duo)數的(de)基于(yu)行(xing)(xing)為的(de)實現方(fang)法都(dou)是(shi)對(dui)不(bu)同(tong)的(de)任務進行(xing)(xing)手工編程的(de),這需要編程人(ren)員能(neng)充分地考慮(lv)到各種(zhong)可(ke)能(neng)出現的(de)情況,對(dui)機器人(ren)與環(huan)境(jing)之(zhi)間(jian)的(de)交互(hu)有(you)充分的(de)理解,雖(sui)然有(you)些設計出的(de)系統對(dui)于(yu)很多(duo)任務和環(huan)境(jing)而言性能(neng)都(dou)是(shi)魯棒的(de),但(dan)系統對(dui)環(huan)境(jing)并不(bu)具有(you)適應性。
人不(bu)能窮盡一切可能。機器人能否通過學習獲(huo)得(de)不(bu)能由程序員手工編碼進(jin)去的知識,比如構建一個未(wei)知環(huan)境的地圖,在任(ren)何(he)環(huan)境的性質隨時間變(bian)化的任(ren)務中都(dou)是必要的。
當(dang)機器(qi)人(ren)元件(jian)老化后,機器(qi)人(ren)的(de)(de)傳(chuan)感器(qi)和執(zhi)行(xing)機構(gou)的(de)(de)性質是可能會(hui)發生改變的(de)(de)。
機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)在多機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)的(de)(de)環境中執行,由(you)于需要對其他機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)作(zuo)出反應,它(ta)(ta)(ta)(ta)的(de)(de)策略是需要改變的(de)(de)。學習方法在這些情況下都能發(fa)揮重要的(de)(de)作(zuo)用。用學習方法為機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)進(jin)行編程,而無須告(gao)訴(su)它(ta)(ta)(ta)(ta)怎樣達到它(ta)(ta)(ta)(ta)的(de)(de)目標,只要告(gao)訴(su)它(ta)(ta)(ta)(ta)目標是什么,讓它(ta)(ta)(ta)(ta)通過學習去滿(man)足這個目標,無疑,這種方法具有(you)很大的(de)(de)吸引力(li)。它(ta)(ta)(ta)(ta)是提高機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)的(de)(de)適應性,降低編程人(ren)(ren)(ren)員編程強(qiang)度(du)的(de)(de)必由(you)之路。
分類
機器人有不同層次(ci)的行為,它們由(you)不同層次(ci)的信息表(biao)達所決定,因此就(jiu)存在著不同類(lei)型的學(xue)習。Broo ks和Mataric總結(jie)出了以下類(lei)型的學(xue)習:
1、為傳感設(she)備(bei)標(biao)定或則參(can)數調(diao)節(jie)進(jin)行(xing)學習(xi)。這種(zhong)類型的學習(xi)只在一(yi)個特定行(xing)為結構中優化操作參(can)數。
2、學(xue)習真實(shi)世(shi)界(jie)的(de)(de)知(zhi)識(shi)。這(zhe)種類型(xing)的(de)(de)學(xue)習構建與修改機器(qi)(qi)人對于真實(shi)世(shi)界(jie)的(de)(de)內部表達(da),以利于機器(qi)(qi)人作出行為規劃(hua)和決策等高層的(de)(de)智能(neng)行為。
3、學習已有行(xing)為的(de)協調(diao)。這種類型的(de)學習中通(tong)過(guo)協調(diao)已經存(cun)在的(de)行(xing)為被觸(chu)發和(he)被執(zhi)行(xing)的(de)順(shun)序(xu)來改變它(ta)們(men)對世界(jie)的(de)作用。
4、學(xue)習(xi)新的行(xing)為。這種類型的學(xue)習(xi)建立新的行(xing)為結構。
實際問題
機(ji)器人領域對任何學習算法(fa)而言都是一(yi)個挑戰。在構建擁有學習能力,能自動進行(xing)知識獲取的自主機(ji)器人的過程中必須面對許多煩(fan)瑣的有關真實世(shi)界的問題(ti)。
1、傳(chuan)(chuan)感器(qi)噪(zao)聲。大多(duo)數機(ji)器(qi)人的傳(chuan)(chuan)感器(qi)是不(bu)可靠的。于是由(you)傳(chuan)(chuan)感器(qi)信號得到的狀態(tai)描述注(zhu)定是不(bu)精(jing)確的。學習算法必須能夠處理(li)噪(zao)聲,因此經常需要(yao)用統計平滑(hua)技術克服噪(zao)音的影響。
算法的(de)易駕馭性(xing)。機器人必(bi)須對不(bu)可(ke)預(yu)見的(de)環(huan)境進行(xing)實時響應。因(yin)此(ci)學習算法必(bi)須不(bu)能(neng)過(guo)于(yu)復雜,算法的(de)每一次迭代都必(bi)須能(neng)實時地(di)完成(cheng)。
2、增量式的(de)算(suan)法(fa)(fa)。學習算(suan)法(fa)(fa)必須(xu)允許(xu)機(ji)器(qi)(qi)人邊(bian)學習邊(bian)改善自己的(de)性能(neng)。因為機(ji)器(qi)(qi)人必須(xu)一邊(bian)收集(ji)經(jing)驗一邊(bian)進行學習. 形成經(jing)驗的(de)數據(ju)不能(neng)離線獲得。
3、有限的(de)訓練(lian)時(shi)(shi)間(jian)。機(ji)器人(ren)的(de)訓練(lian)時(shi)(shi)間(jian)是(shi)非常(chang)有限的(de)。學習(xi)算法必(bi)須在合理的(de)運算次數中收斂,因為機(ji)器人(ren)需要完成(cheng)任務,在真(zhen)實的(de)機(ji)器人(ren)上進行上百萬(wan)次的(de)動(dong)作是(shi)極為困難的(de)。
堅實(shi)的(de)信(xin)息來(lai)源。 所(suo)有(you)機(ji)器(qi)(qi)人可以獲得(de)的(de)信(xin)息都必(bi)須最終來(lai)至從它的(de)傳感器(qi)(qi)抽取得(de)到的(de)信(xin)息或初始狀(zhuang)態時(shi)強行編碼進(jin)去的(de)知(zhi)識。由于狀(zhuang)態信(xin)息是由傳感器(qi)(qi)數據計算(suan)得(de)到的(de),學(xue)習算(suan)法(fa)必(bi)須能和感知(zhi)設備的(de)限(xian)制一起(qi)工作.明(ming)顯(xian)地,能否解決(jue)以上提出的(de)一些問題決(jue)定了用在真實(shi)機(ji)器(qi)(qi)人上的(de)學(xue)習算(suan)法(fa)的(de)成功與否。
學習方法
在機器人研究領域中有三種主要的(de)學習(xi)(xi)方(fang)法變得越來越流行。它(ta)(ta)們(men)是強(qiang)(qiang)化(hua)學習(xi)(xi)( RL) ,進化(hua)方(fang)法( GA和(he)EP)和(he)基于人工(gong)神(shen)經網(wang)絡( ANN )的(de)方(fang)法。其中應用(yong)得最(zui)為廣(guang)泛(fan)的(de)方(fang)法是強(qiang)(qiang)化(hua)學習(xi)(xi)方(fang)法.在學習(xi)(xi)新的(de)行為和(he)學習(xi)(xi)協調已經存在的(de)行為兩種情況(kuang)下(xia)都可以用(yong)到強(qiang)(qiang)化(hua)學習(xi)(xi)的(de)方(fang)法。 強(qiang)(qiang)化(hua)方(fang)法是一種無監督的(de)學習(xi)(xi)算(suan)法,它(ta)(ta)比較好地符合人們(men)解(jie)決問題的(de)心理習(xi)(xi)慣,和(he)傳統人工(gong)智能以及優化(hua)算(suan)法聯系(xi)緊(jin)密(mi),有普遍適的(de)用(yong)性,因此獲得了最(zui)廣(guang)泛(fan)的(de)關注(zhu)。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。