多機(jī)器人學(xué)習(xí)
多機(jī)器人學(xué)習(xí)是指系統(tǒng)不斷尋找或優(yōu)化控制參數(shù),適應(yīng)外界環(huán)境變化的一種手段。多數(shù)研究者認(rèn)為要使機(jī)器人系統(tǒng)具有更大的潛能,其控制系統(tǒng)應(yīng)具有學(xué)習(xí)能力。機(jī)器人的自治學(xué)習(xí)被認(rèn)為是進(jìn)行多機(jī)器人協(xié)作控制更具潛力的方法。
強(qiáng)化學(xué)習(xí)是從動(dòng)物學(xué)習(xí)和自適應(yīng)控制理論發(fā)展來(lái)的。其基本原理為如果智能體的某個(gè)行為策略導(dǎo)致環(huán)境正的獎(jiǎng)勵(lì),那么智能體產(chǎn)生這個(gè)行為策略的趨勢(shì)將會(huì)加強(qiáng);如果智能體的某個(gè)行為策略導(dǎo)致環(huán)境負(fù)的獎(jiǎng)勵(lì),那么智能體產(chǎn)生這個(gè)行為策略的趨勢(shì)將會(huì)減弱,**終消亡。由于強(qiáng)化學(xué)習(xí)不像監(jiān)督學(xué)習(xí)那樣有明顯的信號(hào),它僅有一個(gè)強(qiáng)化信號(hào)來(lái)評(píng)判動(dòng)作的好壞,所以它的學(xué)習(xí)過(guò)程必定是漫長(zhǎng)的。隨著智能體技術(shù)的發(fā)展,應(yīng)用分布式強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)智能體間的分工、協(xié)作逐漸成為研究的熱點(diǎn),同時(shí)也促進(jìn)了分布式人工智能的發(fā)展以及應(yīng)用?,F(xiàn)在的分布式強(qiáng)化學(xué)習(xí)方法主要有4種:中央強(qiáng)化學(xué)習(xí)、獨(dú)立強(qiáng)化學(xué)習(xí)、群體強(qiáng)化學(xué)習(xí)、社會(huì)強(qiáng)化學(xué)習(xí)。原始的博弈游戲已經(jīng)不能夠滿足需要,追捕者游戲因?yàn)槟P秃?jiǎn)單而又說(shuō)明問(wèn)題成為一個(gè)廣泛應(yīng)用的研究模型,但是卻缺乏工程用途。**近興起的機(jī)器人足球也是一個(gè)很好的研究范本,著重體現(xiàn)了內(nèi)部協(xié)作以及外部競(jìng)爭(zhēng),但由于系統(tǒng)的復(fù)雜性,實(shí)現(xiàn)上存在一定困難。
雖然許多學(xué)者在多機(jī)器人學(xué)習(xí)領(lǐng)域已經(jīng)開(kāi)始了研究工作,然而至今在多機(jī)器人系統(tǒng)學(xué)習(xí)領(lǐng)域做的工作還較少。一些典型多機(jī)器人學(xué)習(xí)研究范例僅有機(jī)器人足球、合作目標(biāo)觀測(cè)、合作推箱等。雖然目前已經(jīng)提出多種學(xué)習(xí)方法,比如神經(jīng)網(wǎng)絡(luò)、進(jìn)化算法、增強(qiáng)性學(xué)習(xí)以及它們的一些組合,但是幾乎所有的方法在所需學(xué)習(xí)的任務(wù)變得復(fù)雜時(shí)性能會(huì)變得很差。復(fù)雜的任務(wù)通常需要復(fù)雜的控制器,于是就需要大量的參數(shù)刻劃他們,這就引起了狀態(tài)空間到動(dòng)作空間映射的組合爆炸,給算法帶來(lái)了繁重的任務(wù),極大提高了問(wèn)題的難度,這也就使得多機(jī)器人學(xué)習(xí)的發(fā)展受到了限制。
物體搬運(yùn)和操作
多機(jī)器人物體搬運(yùn)和操作是多機(jī)器人運(yùn)作協(xié)調(diào)的典型應(yīng)用領(lǐng)域之一,也是多機(jī)器人系統(tǒng)發(fā)展的重要方向,由于其受制于多機(jī)器人運(yùn)作協(xié)調(diào)技術(shù)的發(fā)展,所以早期的研究主要是多機(jī)器人協(xié)作推箱和搬運(yùn)家具,近年來(lái)的研究則更側(cè)重于多機(jī)器人協(xié)作運(yùn)送材料、搬運(yùn)大型物品等。多機(jī)器人物體搬運(yùn)和操作的發(fā)展與多機(jī)器人運(yùn)作協(xié)調(diào)的發(fā)展相輔相成,這里就不再贅述。
多機(jī)器人系統(tǒng)的研究是機(jī)器人技術(shù)的一個(gè)重要方向,由于其廣闊的應(yīng)用前景,已成為國(guó)際學(xué)術(shù)界研究的熱點(diǎn)問(wèn)題。本課題是根據(jù)國(guó)內(nèi)外多機(jī)器人系統(tǒng)的研究現(xiàn)狀,在研究單機(jī)器人的基礎(chǔ)上,研究多機(jī)器人的使用領(lǐng)域,諸如工業(yè)領(lǐng)域、醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、航天領(lǐng)域、遠(yuǎn)地作業(yè)、震后搜救以及農(nóng)業(yè)領(lǐng)域等。并根據(jù)現(xiàn)在多機(jī)器人系統(tǒng)的技術(shù),探索研究并預(yù)測(cè)分析未來(lái)多機(jī)器人系統(tǒng)的發(fā)展方向。針對(duì)多機(jī)器人系統(tǒng)發(fā)展的關(guān)鍵問(wèn)題,提出了一些具有一定價(jià)值的見(jiàn)解和看法,取得了一些具有理論價(jià)值和實(shí)際意義的研究成果。
對(duì)于未來(lái)多機(jī)器人系統(tǒng)的發(fā)展方向,我們還需要不斷探索,不斷研究。如果能夠?qū)ξ磥?lái)多機(jī)器人系統(tǒng)的發(fā)展有一個(gè)準(zhǔn)確的分析和預(yù)測(cè),并對(duì)此進(jìn)行更深一步的研究,那么必將會(huì)對(duì)機(jī)器人技術(shù)的發(fā)展帶來(lái)劃時(shí)代的變革。
咨詢電話:- 15000411174
咨詢網(wǎng)址:教育聯(lián)展網(wǎng)