創澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 機器人開發 > 一種基於層次強化學習的機械手魯棒操作

一種基於層次強化學習的機械手魯棒操作

來源: CAAI認知係統與信息處理專委會     編輯:創澤   時間:2020/6/24   主題:其他 [加盟]
1.  研究背景

機械手內操作(in-hand manipulation)是指使用單隻機械手,通過移動手指、手掌等部位來改變物體在手中的相對位置和姿態。這種能力對於機器人實現人類水平的靈巧操作極為重要,因為在日常生活中有很多類似的任務,例如抓取一件工具並調整它在手中的位置和旋轉角度。我們注意到,在實現複雜的操作目標時,人在操作物體時常常改變抓取物體的手指接觸點位置,從而極大的提高物體在手中的位姿範圍。

傳統上,手內操作有兩類解決方案,一類是基於模型的方法(model-based method),通過對抓取的動力學建模,來控製手指移動帶動物體姿態。這種辦法好處在於穩定性強,模型簡單,但問題在於難以實現較長和複雜的手內操作流程,特別是目標位姿和起始位姿相距很遠的情況,因為它們很難規劃手指接觸點的移動;另一類方法是無模型方法(model-free method),通常使用深度強化學習的方法。這類方法優點在於不需要係統模型,但缺點在於穩定性差,並且需要大量數據進行訓練。而我們的方法結合了這兩種方法:在底層使用傳統的動力學建模方式保持穩定的抓取和實現簡單基本的操作單元,在中層通過深度強化學習來進行規劃,選擇不同的操作單元,最終實現穩定且複雜的操作流程。我們的方法結合了兩種方法的優點:在底層通過使用基於模型的操作單元,保證了手指與物體之間持續穩定的抓取;在中層使用強化學習進行規劃,從而實現較長和複雜的手內操作流程。

 

2.  研究方法

在底層,我們使用柔性力矩控製器定義了三個操作單元,分別是reposing,sliding和flipping。Reposing是指在不改變手指與物體接觸點的前提下,通過控製機械手改變物體的位姿;sliding是指在不改變物體位姿的前提下,沿著物體滑動指尖改變接觸點;flipping是指將指頭從一側移動到另一側,從而改變抓握方式。在中層,我們使用深度強化學習網絡學習在給定目標位姿下選擇底層操作單元,最終形成一條由大量不同操作單元組成的序列,實現複雜的操作目標。



創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



移動機器人Wang利用深度強化學習算法和視覺感知相結合的方法完成非結構環境下的移動

中科院沈陽自動化所的Wang利用深度強化學習算法和視覺感知相結合的方法來完成移動機器人在非結構環境下的移動操作

移動操作機器人Centauro通過融合自身攜帶的多傳感器信息可實現自主移動和抓取操作

德國伯恩大學計算機學院研製的遙操作輪腿複合的移動操作機器人可通過遠程操作平台完成各種複雜操作任務

機器人手腕的係列分享之一

假肢腕設計的有效基準能夠做3自由度運動,即旋前/旋後、屈伸和橈側/尺側偏移,未受影響的腕關節,其最大活動範圍通常在76度/85度

機器人手腕的係列分享之二

旋轉器用於使終端設備沿前臂的縱向放出或滾動,而屈肌使終端設備彎曲或俯仰, OB棘輪式旋轉手腕,被動腕部裝置的鎖定也可以通過使用不可反向驅動的機構來實現

機器人手腕的係列分享之二自由度手腕

2自由度腕部由一個與旋轉器串聯的屈肌單元組成,形成一個U型關節。其中一種設備是OBRoboWrist ,它可以同時鎖住前旋和屈曲,當解鎖時,還可以通過轉動手腕上的項圈來調節運動產生摩擦阻力

機器人手腕的係列分享之三自由度手腕

3自由度人工手腕在某些方麵優於人類的手腕,如運動範圍或扭矩輸出。盡管一些假肢在設計中加入了3自由度手腕,但串行3自由度手腕設備在機器人應用中更普遍

串行腕關節與並行腕關節優缺點對比分析

具有相同數量自由度的設備之間進行比較時,串行機構往往比並行機構更長,對於串行機構,運動範圍和扭矩規格通常簡單地由執行機構的選擇和基本形狀幾何決定

假肢腕關節和機器人腕關節優缺點對比分析

假肢需要直接的人類互動來發揮功能,而機器人手腕則完全是主動的,假腕還包括外部可調節功能,如可調節摩擦或鎖定;機器人手腕的任何調整通常都是在控製係統內完成的

柔軟的靈巧手的設計、製備及驅動

由於軟體材料的發展,靈巧手也開始柔軟起來,如柏林工業大學研製的軟體、欠驅動、柔性多指靈巧手、康奈爾大學研製的軟體多指靈巧手、北京航空航天大學研製的軟體多指靈巧手

服務機器人核心模塊分析

環境感知技術:機器人感知環境及自身狀態的窗口、運動控製技術:定位導航與運動協調控製、人機交互技術:人機有效溝通的橋梁

LDV激光測振與3D視覺傳感在智能機器人中的應用

宋雲峰博士分享了LDV激光測振及3D視覺傳感技術在智能機器人中的應用,主要介紹了智能機器人光學感知技術、LDV激光測振及3D視覺傳感技術原理及產品介紹、應用案例分享等內容

基於主動探索的智能抓取機器人

新型智能抓取機器人,結合深度學習方法,賦予機器人主動探索感知的能力,解決了Affordance Map缺陷,提高了機器人在複雜環境下的抓取成功率
資料獲取
機器人開發
== 最新資訊 ==
國標《智慧城市 智慧多功能杆 服務功能與
人工智能之數據挖掘2020年第9期
噴霧消毒殺菌機器人
中國通信學會發布《全球人工智能基礎設施戰
創澤集團受邀參加工信部 AI 精準賦能中
人工智能案例 依圖科技:不斷崛起的AI
2020年麵向人工智能新基建的知識圖譜行
破解AI工程化難題,AI中台助力企業智能
淺析我國消防機器人發展現狀與趨勢 | 山
【華為出品】智能體白皮書2020
“先行示範•智贏未來” 創澤
創澤集團牽頭起草的全國首個《應用於滅菌消
創澤集團智能機器人新品發布會!多款自主研
AIIA2020人工智能開發者大會開幕
人工智能人才發展報告:亞太地區創新與招聘
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站


機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫療 物聯網 機器人排名 機器人企業 機器人政策 教育機器人 迎賓機器人 機器人開發 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖
版權所有 必威主頁 中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728

Baidu
map