一、自主機器人的系統組成
1、視覺系統
負(fu)責感知球(qiu)場(chang)上(shang)(shang)的(de)態勢,視覺系統獲(huo)得(de)球(qiu)場(chang)上(shang)(shang)的(de)實(shi)時(shi)圖像,對(dui)圖像進行(xing)顏色分割,識(shi)別(bie)出球(qiu)場(chang)上(shang)(shang)的(de)各個目(mu)標(biao),然后進行(xing)距(ju)離校正(zheng),將結果發(fa)給決策程序(xu)。
2、決策系統
接收(shou)視覺(jue)系統的辨識結果(guo),對球場態勢進行分析,然(ran)后做出合理決(jue)策,將(jiang)命令發(fa)送給(gei)底層控制(zhi)系統。
3、底層控制系統
通過串口接收上位機的(de)命令(ling),控制(zhi)各輪走(zou)行電機按照(zhao)指定(ding)速度(du)運行,控制(zhi)彈射(she)和持球電機,將底層傳感器的(de)數據通過串口發送給上位機 。
4、通信系統
通過無(wu)線網絡聯系場內機器人(ren)和場外計(ji)算機,進行遙控測試,參數設置等操作以(yi)及(ji)控制(zhi)比(bi)賽(sai)的開始和終止(zhi)。
二、自主機器人如何實現學習
絕大(da)多(duo)數的(de)(de)(de)基于行(xing)為的(de)(de)(de)實現(xian)(xian)方法都(dou)是對(dui)不同的(de)(de)(de)任(ren)(ren)務(wu)進行(xing)手工編(bian)程的(de)(de)(de),這需要(yao)編(bian)程人員能充分(fen)(fen)地考(kao)慮到各種可能出現(xian)(xian)的(de)(de)(de)情況(kuang),對(dui)機(ji)器(qi)人與環(huan)境之間的(de)(de)(de)交(jiao)互有充分(fen)(fen)的(de)(de)(de)理解,雖然有些設計出的(de)(de)(de)系統對(dui)于很多(duo)任(ren)(ren)務(wu)和(he)環(huan)境而言性能都(dou)是魯棒(bang)的(de)(de)(de),但系統對(dui)環(huan)境并不具有適應(ying)性。
人不能(neng)窮盡一(yi)切(qie)可能(neng)。機器(qi)人能(neng)否通過學(xue)習獲得不能(neng)由(you)程(cheng)序員手工(gong)編碼進去的(de)知(zhi)識,比如構(gou)建一(yi)個(ge)未知(zhi)環(huan)境的(de)地圖,在任何環(huan)境的(de)性質(zhi)隨時間(jian)變化的(de)任務(wu)中都是必(bi)要的(de)。
當機器人元件老化(hua)后,機器人的(de)(de)傳感器和執行機構的(de)(de)性(xing)質是(shi)可(ke)能會發(fa)生(sheng)改(gai)變的(de)(de)。
機(ji)器人(ren)(ren)在多(duo)機(ji)器人(ren)(ren)的(de)環(huan)境中(zhong)執行,由于需要對(dui)其他機(ji)器人(ren)(ren)作出反應,它(ta)(ta)(ta)(ta)的(de)策略是(shi)(shi)需要改變(bian)的(de)。學(xue)習方(fang)法(fa)在這些情況下(xia)都能發揮重要的(de)作用(yong)。用(yong)學(xue)習方(fang)法(fa)為(wei)機(ji)器人(ren)(ren)進行編(bian)(bian)程,而無須告(gao)訴它(ta)(ta)(ta)(ta)怎樣達到它(ta)(ta)(ta)(ta)的(de)目(mu)標,只要告(gao)訴它(ta)(ta)(ta)(ta)目(mu)標是(shi)(shi)什么(me),讓它(ta)(ta)(ta)(ta)通過(guo)學(xue)習去滿(man)足這個目(mu)標,無疑(yi),這種方(fang)法(fa)具有很大的(de)吸引(yin)力。它(ta)(ta)(ta)(ta)是(shi)(shi)提高(gao)機(ji)器人(ren)(ren)的(de)適應性,降低編(bian)(bian)程人(ren)(ren)員編(bian)(bian)程強(qiang)度的(de)必由之路。
分類
機(ji)器人有(you)不(bu)同層(ceng)次(ci)的行(xing)為,它們由不(bu)同層(ceng)次(ci)的信息表達所決(jue)定,因此就存在著不(bu)同類(lei)型(xing)的學習(xi)。Broo ks和Mataric總結出了以(yi)下(xia)類(lei)型(xing)的學習(xi):
1、為(wei)傳感設備標定或(huo)則參(can)數(shu)(shu)調節(jie)進行學習(xi)。這種(zhong)類型的學習(xi)只(zhi)在一(yi)個(ge)特定行為(wei)結構中優化操作參(can)數(shu)(shu)。
2、學習真實世(shi)界的(de)知識。這(zhe)種類型的(de)學習構建與修改機器(qi)人對(dui)于真實世(shi)界的(de)內部表達,以利(li)于機器(qi)人作出行(xing)為規(gui)劃和(he)決(jue)策等高(gao)層的(de)智能行(xing)為。
3、學(xue)習(xi)已(yi)(yi)有行為的(de)協調(diao)。這種類型的(de)學(xue)習(xi)中(zhong)通過協調(diao)已(yi)(yi)經(jing)存在的(de)行為被觸發和(he)被執行的(de)順(shun)序(xu)來改變它們(men)對世界的(de)作用。
4、學(xue)習(xi)新的行(xing)為。這(zhe)種類型(xing)的學(xue)習(xi)建立(li)新的行(xing)為結構。
實際問題
機(ji)器(qi)人(ren)領域對(dui)任何(he)學(xue)習(xi)算法而言都是(shi)一個挑戰。在構建(jian)擁有學(xue)習(xi)能(neng)(neng)力,能(neng)(neng)自動進行知識(shi)獲取的(de)自主(zhu)機(ji)器(qi)人(ren)的(de)過程中必須面對(dui)許多煩瑣的(de)有關(guan)真(zhen)實世界(jie)的(de)問題(ti)。
1、傳(chuan)感(gan)(gan)器噪(zao)聲。大多數(shu)機器人的傳(chuan)感(gan)(gan)器是不可(ke)靠的。于(yu)是由傳(chuan)感(gan)(gan)器信號得到的狀(zhuang)態描述注定是不精確的。學習算(suan)法(fa)必須能夠處(chu)理噪(zao)聲,因(yin)此經常需要用統計平滑技術克服噪(zao)音的影響。
算(suan)法(fa)的(de)易(yi)駕馭(yu)性。機器人必(bi)須對不(bu)(bu)可預見的(de)環境進行實時(shi)響應。因此學(xue)習算(suan)法(fa)必(bi)須不(bu)(bu)能過于復雜,算(suan)法(fa)的(de)每一(yi)次迭代都必(bi)須能實時(shi)地(di)完成。
2、增量式的算(suan)法(fa)。學(xue)(xue)習算(suan)法(fa)必須(xu)(xu)允許機器人(ren)邊(bian)學(xue)(xue)習邊(bian)改善自己的性能(neng)(neng)。因(yin)為機器人(ren)必須(xu)(xu)一邊(bian)收(shou)集經(jing)驗一邊(bian)進行學(xue)(xue)習. 形成經(jing)驗的數據(ju)不能(neng)(neng)離(li)線獲得。
3、有(you)限的(de)(de)(de)訓練(lian)時間。機(ji)器人的(de)(de)(de)訓練(lian)時間是(shi)非(fei)常有(you)限的(de)(de)(de)。學(xue)習算法必(bi)須在合(he)理的(de)(de)(de)運算次(ci)數中收(shou)斂,因為機(ji)器人需要完成(cheng)任務,在真實的(de)(de)(de)機(ji)器人上進行上百(bai)萬次(ci)的(de)(de)(de)動作(zuo)是(shi)極(ji)為困難的(de)(de)(de)。
堅實(shi)的(de)(de)(de)信息(xi)來源。 所有機器(qi)人可(ke)以獲得(de)的(de)(de)(de)信息(xi)都必(bi)須(xu)(xu)最終來至從(cong)它的(de)(de)(de)傳(chuan)感器(qi)抽取得(de)到(dao)的(de)(de)(de)信息(xi)或初始狀態時(shi)強行編碼進(jin)去的(de)(de)(de)知識。由(you)于狀態信息(xi)是由(you)傳(chuan)感器(qi)數據計(ji)算(suan)得(de)到(dao)的(de)(de)(de),學(xue)(xue)習(xi)算(suan)法必(bi)須(xu)(xu)能和感知設備的(de)(de)(de)限制一起工作.明顯地,能否解決以上提出(chu)的(de)(de)(de)一些問題決定了用(yong)在(zai)真實(shi)機器(qi)人上的(de)(de)(de)學(xue)(xue)習(xi)算(suan)法的(de)(de)(de)成(cheng)功與否。
學習方法
在機器人(ren)研究領域(yu)中有(you)三種(zhong)主要(yao)的(de)(de)(de)學(xue)習(xi)方法(fa)(fa)變得越來越流行(xing)。它們是(shi)(shi)強(qiang)(qiang)化學(xue)習(xi)( RL) ,進(jin)化方法(fa)(fa)( GA和(he)EP)和(he)基于(yu)人(ren)工(gong)(gong)神經(jing)(jing)網絡( ANN )的(de)(de)(de)方法(fa)(fa)。其中應用(yong)得最為廣(guang)泛的(de)(de)(de)方法(fa)(fa)是(shi)(shi)強(qiang)(qiang)化學(xue)習(xi)方法(fa)(fa).在學(xue)習(xi)新的(de)(de)(de)行(xing)為和(he)學(xue)習(xi)協調(diao)已經(jing)(jing)存(cun)在的(de)(de)(de)行(xing)為兩種(zhong)情況下都可以用(yong)到強(qiang)(qiang)化學(xue)習(xi)的(de)(de)(de)方法(fa)(fa)。 強(qiang)(qiang)化方法(fa)(fa)是(shi)(shi)一種(zhong)無監督(du)的(de)(de)(de)學(xue)習(xi)算(suan)法(fa)(fa),它比較好地符(fu)合人(ren)們解決問題的(de)(de)(de)心理習(xi)慣(guan),和(he)傳(chuan)統人(ren)工(gong)(gong)智能以及優(you)化算(suan)法(fa)(fa)聯系緊密(mi),有(you)普遍適(shi)的(de)(de)(de)用(yong)性,因此獲得了(le)最廣(guang)泛的(de)(de)(de)關注。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。