自主機器人的系統組成自主機器人如何實現學習

本文章由注冊用戶科技數碼行上傳提供評論發布反饋 0

摘要：自主機器人是其本體自帶各種必要的傳感器、控制器，在運行過程中無外界人為信息輸入和控制的條件下，可以獨立完成一定的任務的機器人。自助機器人主要由以下系統組成：視覺系統、決策系統、底層控制系統、通信系統。自助機器人最大的特點就是自主，但是對于自助機器人來說，如何學會學習和思考的方法才是最重要的。畢竟人類無法窮盡所有的問題，教會機器人自主思考才行。下面就一起看看自助機器人的知識吧！

一、自主機器人的系統組成

1、視覺系統

負(fu)責感知球(qiu)場(chang)上(shang)的態勢，視覺系(xi)統獲得球(qiu)場(chang)上(shang)的實時圖像(xiang)，對圖像(xiang)進行(xing)顏色分割，識別出球(qiu)場(chang)上(shang)的各個目標，然后(hou)進行(xing)距(ju)離校正，將結(jie)果發給(gei)決策(ce)程序(xu)。

2、決策系統

接收視(shi)覺(jue)系統的(de)辨(bian)識結果，對(dui)球場態勢(shi)進(jin)行分析，然后做(zuo)出(chu)合(he)理決策，將命令(ling)發送給底(di)層控制系統。

3、底層控制系統

通過串(chuan)口(kou)接收上(shang)位機的命令(ling)，控制各輪(lun)走行(xing)(xing)電機按(an)照指定(ding)速度運行(xing)(xing)，控制彈射和持球電機，將底層傳感器的數據(ju)通過串(chuan)口(kou)發(fa)送給上(shang)位機。

4、通信系統

通過無線網絡聯系場內(nei)機器人(ren)和(he)場外計(ji)算機，進行遙(yao)控測試，參數(shu)設置(zhi)等操作以及控制比賽的開始和(he)終止。

二、自主機器人如何實現學習

絕大多(duo)數的(de)基于(yu)行(xing)(xing)為的(de)實現方(fang)法都(dou)是(shi)對(dui)不(bu)同(tong)的(de)任務進行(xing)(xing)手工編程的(de)，這需要編程人(ren)員能(neng)充分地考慮(lv)到各種(zhong)可(ke)能(neng)出現的(de)情況，對(dui)機器人(ren)與環(huan)境(jing)之(zhi)間(jian)的(de)交互(hu)有(you)充分的(de)理解，雖(sui)然有(you)些設計出的(de)系統對(dui)于(yu)很多(duo)任務和環(huan)境(jing)而言性能(neng)都(dou)是(shi)魯棒的(de)，但(dan)系統對(dui)環(huan)境(jing)并不(bu)具有(you)適應性。

人不(bu)能窮盡一切可能。機器人能否通過學習獲(huo)得(de)不(bu)能由程序員手工編碼進(jin)去的知識，比如構建一個未(wei)知環(huan)境的地圖，在任(ren)何(he)環(huan)境的性質隨時間變(bian)化的任(ren)務中都(dou)是必要的。

當(dang)機器(qi)人(ren)元件(jian)老化后，機器(qi)人(ren)的(de)(de)傳(chuan)感器(qi)和執(zhi)行(xing)機構(gou)的(de)(de)性質是可能會(hui)發生改變的(de)(de)。

機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)在多機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)的(de)(de)環境中執行,由(you)于需要對其他機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)作(zuo)出反應，它(ta)(ta)(ta)(ta)的(de)(de)策略是需要改變的(de)(de)。學習方法在這些情況下都能發(fa)揮重要的(de)(de)作(zuo)用。用學習方法為機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)進(jin)行編程，而無須告(gao)訴(su)它(ta)(ta)(ta)(ta)怎樣達到它(ta)(ta)(ta)(ta)的(de)(de)目標，只要告(gao)訴(su)它(ta)(ta)(ta)(ta)目標是什么，讓它(ta)(ta)(ta)(ta)通過學習去滿(man)足這個目標，無疑，這種方法具有(you)很大的(de)(de)吸引力(li)。它(ta)(ta)(ta)(ta)是提高機(ji)(ji)器(qi)(qi)人(ren)(ren)(ren)的(de)(de)適應性，降低編程人(ren)(ren)(ren)員編程強(qiang)度(du)的(de)(de)必由(you)之路。

分類

機器人有不同層次(ci)的行為，它們由(you)不同層次(ci)的信息表(biao)達所決定,因此就(jiu)存在著不同類(lei)型的學(xue)習。Broo ks和Mataric總結(jie)出了以下類(lei)型的學(xue)習：

1、為傳感設(she)備(bei)標(biao)定或則參(can)數調(diao)節(jie)進(jin)行(xing)學習(xi)。這種(zhong)類型的學習(xi)只在一(yi)個特定行(xing)為結構中優化操作參(can)數。

2、學(xue)習真實(shi)世(shi)界(jie)的(de)(de)知(zhi)識(shi)。這(zhe)種類型(xing)的(de)(de)學(xue)習構建與修改機器(qi)(qi)人對于真實(shi)世(shi)界(jie)的(de)(de)內部表達(da)，以利于機器(qi)(qi)人作出行為規劃(hua)和決策等高層的(de)(de)智能(neng)行為。

3、學習已有行(xing)為的(de)協調(diao)。這種類型的(de)學習中通(tong)過(guo)協調(diao)已經存(cun)在的(de)行(xing)為被觸(chu)發和(he)被執(zhi)行(xing)的(de)順(shun)序(xu)來改變它(ta)們(men)對世界(jie)的(de)作用。

4、學(xue)習(xi)新的行(xing)為。這種類型的學(xue)習(xi)建立新的行(xing)為結構。

實際問題

機(ji)器人領域對任何學習算法(fa)而言都是一(yi)個挑戰。在構建擁有學習能力,能自動進行(xing)知識獲取的自主機(ji)器人的過程中必須面對許多煩(fan)瑣的有關真實世(shi)界的問題(ti)。

1、傳(chuan)(chuan)感器(qi)噪(zao)聲。大多(duo)數機(ji)器(qi)人的傳(chuan)(chuan)感器(qi)是不(bu)可靠的。于是由(you)傳(chuan)(chuan)感器(qi)信號得到的狀態(tai)描述注(zhu)定是不(bu)精(jing)確的。學習算法必須能夠處理(li)噪(zao)聲,因此經常需要(yao)用統計平滑(hua)技術克服噪(zao)音的影響。

算法的(de)易駕馭性(xing)。機器人必(bi)須對不(bu)可(ke)預(yu)見的(de)環(huan)境進行(xing)實時響應。因(yin)此(ci)學習算法必(bi)須不(bu)能(neng)過(guo)于(yu)復雜，算法的(de)每一次迭代都必(bi)須能(neng)實時地(di)完成(cheng)。

2、增量式的(de)算(suan)法(fa)(fa)。學習算(suan)法(fa)(fa)必須(xu)允許(xu)機(ji)器(qi)(qi)人邊(bian)學習邊(bian)改善自己的(de)性能(neng)。因為機(ji)器(qi)(qi)人必須(xu)一邊(bian)收集(ji)經(jing)驗一邊(bian)進行學習. 形成經(jing)驗的(de)數據(ju)不能(neng)離線獲得。

3、有限的(de)訓練(lian)時(shi)(shi)間(jian)。機(ji)器人(ren)的(de)訓練(lian)時(shi)(shi)間(jian)是(shi)非常(chang)有限的(de)。學習(xi)算法必(bi)須在合理的(de)運算次數中收斂，因為機(ji)器人(ren)需要完成(cheng)任務，在真(zhen)實的(de)機(ji)器人(ren)上進行上百萬(wan)次的(de)動(dong)作是(shi)極為困難的(de)。

堅實(shi)的(de)信(xin)息來(lai)源。所(suo)有(you)機(ji)器(qi)(qi)人可以獲得(de)的(de)信(xin)息都必(bi)須最終來(lai)至從它的(de)傳感器(qi)(qi)抽取得(de)到的(de)信(xin)息或初始狀(zhuang)態時(shi)強行編碼進(jin)去的(de)知(zhi)識。由于狀(zhuang)態信(xin)息是由傳感器(qi)(qi)數據計算(suan)得(de)到的(de)，學(xue)習算(suan)法(fa)必(bi)須能和感知(zhi)設備的(de)限(xian)制一起(qi)工作.明(ming)顯(xian)地,能否解決(jue)以上提出的(de)一些問題決(jue)定了用在真實(shi)機(ji)器(qi)(qi)人上的(de)學(xue)習算(suan)法(fa)的(de)成功與否。

學習方法

在機器人研究領域中有三種主要的(de)學習(xi)(xi)方(fang)法變得越來越流行。它(ta)(ta)們(men)是強(qiang)(qiang)化(hua)學習(xi)(xi)( RL) ，進化(hua)方(fang)法( GA和(he)EP)和(he)基于人工(gong)神(shen)經網(wang)絡( ANN )的(de)方(fang)法。其中應用(yong)得最(zui)為廣(guang)泛(fan)的(de)方(fang)法是強(qiang)(qiang)化(hua)學習(xi)(xi)方(fang)法.在學習(xi)(xi)新的(de)行為和(he)學習(xi)(xi)協調已經存在的(de)行為兩種情況(kuang)下(xia)都可以用(yong)到強(qiang)(qiang)化(hua)學習(xi)(xi)的(de)方(fang)法。強(qiang)(qiang)化(hua)方(fang)法是一種無監督的(de)學習(xi)(xi)算(suan)法，它(ta)(ta)比較好地符合人們(men)解(jie)決問題的(de)心理習(xi)(xi)慣，和(he)傳統人工(gong)智能以及優化(hua)算(suan)法聯系(xi)緊(jin)密(mi)，有普遍適的(de)用(yong)性，因此獲得了最(zui)廣(guang)泛(fan)的(de)關注(zhu)。

申明：以上方法源于程序系統索引或網民分享提供，僅供您參考使用，不代表本網站的研究觀點，證明有效，請注意甄別內容來源的真實性和權威性。

標簽： 智能智能機器人科技數碼 ★

網站提醒和聲明

本站(zhan)為注冊用戶提(ti)(ti)供信息(xi)存儲空間服務(wu)，非(fei)“MAIGOO編(bian)輯上傳(chuan)提(ti)(ti)供”的文(wen)章/文(wen)字均是注冊用戶自主發布上傳(chuan)，不(bu)代表本站(zhan)觀點，更(geng)不(bu)表示本站(zhan)支(zhi)持購買(mai)和交易(yi)，本站(zhan)對(dui)網頁中內(nei)容的合法性(xing)、準確(que)性(xing)、真實性(xing)、適(shi)用性(xing)、安全性(xing)等概不(bu)負責。版權歸原作者所有，如有侵權、虛假信息(xi)、錯誤信息(xi)或(huo)任(ren)何問題(ti)，請及時聯系我們，我們將在第一時間刪除或(huo)更(geng)正。申請刪除>> 糾錯>> 投訴侵權>>

提交說明：快速提交發布>> 查看提交幫助>> 注冊登錄>>