創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人應用 > 機器人示教學習:學習低級技能運動基元軌跡運動技能  
 

機器人示教學習:學習低級技能運動基元軌跡運動技能

來源:CAAI認知係統與信息處理專委會      編輯:創澤      時間:2020/6/9      主題:其他   [加盟]

人們使用機器人的目的是節約人力和時間並高效完成任務。傳統的機器人需要預先編程來滿足特定任務,但如果任務發生變化,往往需要重新編程。而通過機器人的示教學習,它使機器人能夠自主地執行新任務,允許用戶通過示教任務來教授機器人所需的技能,而無需繁瑣的重新編程。我們結合2020年ICIMIA 會議發表的《A Comprehensive Study onRobot Learning from Demonstration》文章,介紹了機器人示教學習LfD(Learning from Demonstration)的研究概況。

機器人可以通過采取行動與所處環境交互,導致當前狀態到新狀態的概率轉換。機器人活動的環境可以被完全或部分觀察到。觀察性條件取決於示教數據采集方法的類型以及所選擇的教學方法。在[6]中,對環境描述的方法進行了研究。定義明確的目標可以清晰的評價任務表現,並改進已學習的任務[7]。LfD目前沒有標準的評估參數或方法,這是因為到目前為止LfD框架缺乏通用性,沒有可以進行比較的基準。人類如何提供示教,基於與機器人的交互方式。

(1)低級技能

低級技能通常包括在三維空間中從一個點移動到另一個點。它可以包括原始的動作,如手勢、觸摸物體、挑選物體等,這種情況下獲得的示教數據是機器人關節的位置、速度和加速度。低級運動可記錄在關節空間、任務空間或扭矩空間[11]。然而,在某些情況下,任務目標不能完全由關節位置來表示,應提供任務框架方麵的額外信息。例如,挑選一個在每次示教中可能位於不同位置的目標對象。當這種低級技能在機器人框架中學習時,軌跡可能沒有相似性,因此很難提取模型。但是,如果在任務框架中表示相同的對象,則可以得到相同對象的一般模型。一種常用的方法是跟蹤末端執行器相對於目標對象的笛卡爾坐標位置[12]。

低級技能學習或建模的三種主要方法:

1)動態運動基元(DMP):DMP方法的中心思想是依賴於一個可靠的動態係統,調整該係統的非線性項,實現預期的吸引子行為。

圖3 DMP方法:字母書寫技巧[50]的不變性

在圖3中,可以看出DMP的不變性性質的重要性。藍線表示示教軌跡,紅線表示技能執行軌跡。起點是相似的,但是,即使target_0和target_1表示的終點不同,它也能夠執行低級技能。此外,還能根據示教的字母“a”生成“a”的一致放大版本。為了利用高度規則的結構和潛在空間來簡化DMP方法,提出了一個高斯過程的隱藏變量模型[13]。在[9]中,通過調整DMP方程中的起始參數和目標參數,評估了一種泛化技能的方法,並在baxter機械臂上進行了進一步的論證。

2)高斯混合建模與回歸(GMM-GMR):該方法依賴於統計監督學習,由兩部分組成:a)使用高斯混合模型(GMM)對技能進行編碼 b)利用高斯混合回歸(GMR)方法再現該技能。根據給定的示教,維度下降方法將數據投射到潛在空間中。這些方法可以執行局部線性變換[14]或利用任何全局非線性方法[15]。在[16]中,使用GMM作為一種技能學習算法,對7個關節角度的示教數據進行預處理,進一步采用k均值聚類算法確定期望最大值(EM)算法的初始均值和協方差。通過運行迭代算法提取一個GMM,並進一步使用該GMM來執行一項技能。在[17]中使用GMM-GMR對技能編碼的類似方法進行了評估。

3)隱馬爾科夫模型(HMM):此類模型基於概率方法。為了用隱馬爾可夫模型來建模低級技能,可以用隱藏狀態序列和所有的概率分布來表示該技能。HMM模型學習由兩部分組成:a)結構學習b)參數學習。結構學習處理識別隱藏狀態的數量。除此之外,它還涉及到確定這些隱藏狀態是如何相互聯係的。HMM模型學習的另一部分是參數學習,用於估計先驗、轉移和觀察概率分布。HMM模型使用概率分布,以便從當前狀態前進到下一個狀態,從而生成一個序列。該序列可以提供給控製器,以產生平滑的控製信號。應該注意的是,由於提供的示教並不是暫時一致的。所記錄的重複示教或者一批示教,其時間值不相同。即使是一個熟練的示教者也不可能提供完全相同的重複示教。因此,預處理步驟涉及動態時間扭曲(DTW)技術,該技術測量多個示教的時間序列之間的相似性。

創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



商業化移動機器人的感知係統設計

機器人感知係統包括傳感器的選擇和配置,以及算法和實現,利用了一個單目相機,一個短程二維激光測距儀,車輪編碼器和慣性測量單元。

教育機器人發展階段及特點

教育機器人經曆了從概念先行到價格營銷到回歸內容與價值本質的發展階段變遷

教育機器人與機器人教育的區別

教育服務機器人:指具有教與學智能的服務機器人,機器人教育:模塊化機器人和機器人套件是機器人教育中常見 的輔助產品

機器人常用外部傳感器參數及性能對比

機器人對環境的感知大多通過激光雷達、攝像頭、毫米波雷達、超聲波傳感器、GPS這五類傳感器及其之間的組合來實現自主移動功能

人與機器人交互時代的社會認知

與機器人互動時研究人的大腦將有助於更清晰、更深入地了解人機交互,從而為社交機器人的春天奠定基礎,將社會維度整合到人與這些機器的交流中來加速人與機器人的交互研究,有助於推動創造真正的社交機器人

電子皮膚和機器學習在智能軟體機器人的應用

基於電子皮膚的軟體機器人傳感、機器學習在柔性電子皮膚上的應用、形狀感知、麵向軟體機器人的反饋控製和機器人的操作

機器人常用避障傳感器

避障使用的傳感器各種各樣,其特點和適用範圍也不同。根據不同的原理,可分為:超聲波傳感器、紅外傳感器、激光傳感器和視覺傳感器等

機器人輔助穿衣過程中用戶上肢運動實時追蹤方法

機器人輔助穿衣過程中,使用一種多傳感器信息融合的人體骨骼實時追蹤方法,使機器人既可以基於力的信息自動改變運動軌跡從而保證用戶安全,又可以完成穿衣任務
 
資料獲取

智能教育機器人功能介紹
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map