創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人應用 > 機器人示教學習:高級技能學習方法(學習計劃和學習目標)  
 

機器人示教學習:高級技能學習方法(學習計劃和學習目標)

來源:CAAI認知係統與信息處理專委會      編輯:創澤      時間:2020/6/9      主題:其他   [加盟]
機器人可以在人類教師反饋的基礎上來探索某項任務。反饋提供了關於機器人嚐試的任務滿足目標的程度的信息。大多數基於反饋的工作傾向於采用強化學習。傳統的RL算法提供了一個反饋(獎勵)信號,在這種情況下使用了人工響應。在某些情況下,除了人類的反饋,任務的表現直接受到老師的影響,老師允許選擇下一步行動。在[10]中,這種方法將任務學習表現提高了約50%。

需要注意的是,有時選擇的示教方法和獲取的數據類型與學習算法的選擇有關。一方麵來自多個模態的示範增加了維數,增加了學習的複雜性。數據的維數可以降低,但是有些信息被忽略,導致從示教數據中學習不當。另一方麵,缺少傳感模態可能會在一開始就提供不完整的信息,導致學習算法表現不理想。

高級技能可以認為是一組低級技能或一組動作基元。除此之外,高級技能還包括對象可視性,涉及構建物理世界對象和機器人動作之間關係的知識。高級技能學習方法可以大致分為學習計劃和學習目標。

1)學習計劃:在這種高級技能的學習方法中,學習計劃為從初始狀態到最終狀態的一係列動作。因此,動作是根據前置條件和後置條件定義的。前置條件為動作執行前的狀態,後置條件為動作執行後的狀態。除此之外,人類教師還用注釋的形式提供附加信息。注釋可以通過觸覺、視覺或語義來提供。額外的信息允許更好地概括高水平的技能。可執行的動作可以是簡單的低級技能,如抓住目標對象,拾起綠色的對象等,組合起來形成一個高級任務,如排序綠色的對象。另一方麵,有一些方法可以通過在示教數據中尋找重複的結構來從高級技能示教中提取低級技能,這樣就可以在不同的示教中識別它。在[2]中,一個示教學習範例是通過人類示教和在程序界麵輸入的用戶目的來描述的。在[18]中,一些涉及一係列順序旋轉和轉換的日常對象操作的示教被用來提取順序的低級技能,並進一步構建一個計劃。這項工作還示教了從一個對象到其他類似對象的學習知識轉移。


2)學習目標:推斷高級技能的目標。人類教師提供的示教被用來推斷執行高級技能的意圖。通過生成假設,可以從重複的示教中推斷出目標。現代方法也使用基於獎勵函數的強化學習方法來實現期望目標。如果獎勵函數是從給定的示教中學習的,那麼它就被認為是目標學習。一些基於強化學習的方法得到了很好的研究[19]。


3、討論總結

技能的學習直接依賴於示教的準確性。大多數方法[20]手動消除了部分示教中的噪聲。結合強化學習,在獎勵和探索機製的基礎上對技能學習進行改進。另一種改進技能的方法涉及示教者反饋[21]。當機器人在一個稍微不熟悉的情況下執行學習到的技能時,從人類教師那裏得到關於執行技能可取性的反饋。目前為了實現這種技能細化的方法,研究人員主要從兩個方麵進行了研究:(1)控製機器人和人類教師之間的信息交互,(2)提供反饋。


創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



機器人示教學習:學習低級技能運動基元軌跡運動技能

低級技能學習或建模的三種主要方法:動態運動基元(DMP),高斯混合建模與回歸(GMM-GMR),隱馬爾科夫模型(HMM)

商業化移動機器人的感知係統設計

機器人感知係統包括傳感器的選擇和配置,以及算法和實現,利用了一個單目相機,一個短程二維激光測距儀,車輪編碼器和慣性測量單元。

教育機器人發展階段及特點

教育機器人經曆了從概念先行到價格營銷到回歸內容與價值本質的發展階段變遷

教育機器人與機器人教育的區別

教育服務機器人:指具有教與學智能的服務機器人,機器人教育:模塊化機器人和機器人套件是機器人教育中常見 的輔助產品

機器人常用外部傳感器參數及性能對比

機器人對環境的感知大多通過激光雷達、攝像頭、毫米波雷達、超聲波傳感器、GPS這五類傳感器及其之間的組合來實現自主移動功能

人與機器人交互時代的社會認知

與機器人互動時研究人的大腦將有助於更清晰、更深入地了解人機交互,從而為社交機器人的春天奠定基礎,將社會維度整合到人與這些機器的交流中來加速人與機器人的交互研究,有助於推動創造真正的社交機器人

電子皮膚和機器學習在智能軟體機器人的應用

基於電子皮膚的軟體機器人傳感、機器學習在柔性電子皮膚上的應用、形狀感知、麵向軟體機器人的反饋控製和機器人的操作

機器人常用避障傳感器

避障使用的傳感器各種各樣,其特點和適用範圍也不同。根據不同的原理,可分為:超聲波傳感器、紅外傳感器、激光傳感器和視覺傳感器等

機器人輔助穿衣過程中用戶上肢運動實時追蹤方法

機器人輔助穿衣過程中,使用一種多傳感器信息融合的人體骨骼實時追蹤方法,使機器人既可以基於力的信息自動改變運動軌跡從而保證用戶安全,又可以完成穿衣任務

下肢外骨骼機器人步態建模及其控製方法研究

在下肢外骨骼機器人的穩定性評估、步態規劃和平衡控製中,人機係統質心是重要的參數之一

火爆的貨箱倉儲機器人

多台貨箱到人機器人正在運行,攜帶著貨箱輕巧敏捷地來回穿梭於存儲區和工位之間,高速完成美妝產品的存揀作業。這是業內首個多層貨箱到人機器人解決方案的落地應用,相較同等麵積的人工倉,效率提升2.5倍。

結合人工智能技術,5G+MR全息教室創新教學模式

基於計算機視覺的智能識別技術 和SLAM定位技術的引入,則實現了目標與用戶的動態精準識別和交互。能夠輔助課堂教學,提升遠程教學和溝通效率,營造場景化教學新體驗
 
資料獲取

智能教育機器人功能介紹
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map