創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人開發 > 一種基於層次強化學習的機械手魯棒操作  
 

一種基於層次強化學習的機械手魯棒操作

來源:CAAI認知係統與信息處理專委會      編輯:創澤      時間:2020/6/24      主題:其他   [加盟]
1.  研究背景

機械手內操作(in-hand manipulation)是指使用單隻機械手,通過移動手指、手掌等部位來改變物體在手中的相對位置和姿態。這種能力對於機器人實現人類水平的靈巧操作極為重要,因為在日常生活中有很多類似的任務,例如抓取一件工具並調整它在手中的位置和旋轉角度。我們注意到,在實現複雜的操作目標時,人在操作物體時常常改變抓取物體的手指接觸點位置,從而極大的提高物體在手中的位姿範圍。

傳統上,手內操作有兩類解決方案,一類是基於模型的方法(model-based method),通過對抓取的動力學建模,來控製手指移動帶動物體姿態。這種辦法好處在於穩定性強,模型簡單,但問題在於難以實現較長和複雜的手內操作流程,特別是目標位姿和起始位姿相距很遠的情況,因為它們很難規劃手指接觸點的移動;另一類方法是無模型方法(model-free method),通常使用深度強化學習的方法。這類方法優點在於不需要係統模型,但缺點在於穩定性差,並且需要大量數據進行訓練。而我們的方法結合了這兩種方法:在底層使用傳統的動力學建模方式保持穩定的抓取和實現簡單基本的操作單元,在中層通過深度強化學習來進行規劃,選擇不同的操作單元,最終實現穩定且複雜的操作流程。我們的方法結合了兩種方法的優點:在底層通過使用基於模型的操作單元,保證了手指與物體之間持續穩定的抓取;在中層使用強化學習進行規劃,從而實現較長和複雜的手內操作流程。

 

2.  研究方法

在底層,我們使用柔性力矩控製器定義了三個操作單元,分別是reposing,sliding和flipping。Reposing是指在不改變手指與物體接觸點的前提下,通過控製機械手改變物體的位姿;sliding是指在不改變物體位姿的前提下,沿著物體滑動指尖改變接觸點;flipping是指將指頭從一側移動到另一側,從而改變抓握方式。在中層,我們使用深度強化學習網絡學習在給定目標位姿下選擇底層操作單元,最終形成一條由大量不同操作單元組成的序列,實現複雜的操作目標。



創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商
  



ICRA2020論文分享:基於視觸融合感知的可形變物體抓取狀態評估

人類可以通過視覺和觸覺融合感知快速確定抓取可變形物體所需力的大小,以防止其發生滑動或過度形變,但這對於機器人來說仍然是一個具有挑戰性的問題

如何搭建一個GPU加速的分布式機器學習係統,遇到的問題和解決方法

能快速將現有算法在實際生產環境落地,並能利用GPU加速實現大規模計算,我們自己搭建了一個GPU加速的大規模分布式機器學習係統,取名小諸葛

拯救渣畫質,馬賽克圖秒變高清,杜克大學提出AI新算法

杜克大學的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉換成計算機生成的圖像,其細節比之前任何時候都更加精細、逼真

餓了麼推薦算法的演進及在線學習實踐

餓了麼算法專家劉金介紹推薦業務背景,包括推薦產品形態及算法優化目標;然後是算法的演進路線;最後重點介紹在線學習是如何在餓了麼推薦領域實踐的

百變應用場景下,優酷基於圖執行引擎的算法服務框架築造之路

優酷推薦業務,算法應用場景眾多,需求靈活多變,需要一套通用業務框架,支持運行時的算法流程的裝配,提升算法服務場景搭建的效率

內容流量管理的關鍵技術:多任務保量優化算法實踐

通過分析其中的關鍵問題,建立了新熱內容曝光敏感模型,並最終給出一種曝光資源約束下的多目標優化保量框架與算法

CVPOS自助收銀的挑戰以及商品識別算法工程落地方法和經驗

針對結算收銀場景中商品識別的難點,從商品識別落地中的模型選擇、數據挑選與標注、前端和雲端部署、模型改進等方麵,進行了深入講解

麵向動態記憶和學習功能的神經電晶體可塑性研究

神經形態結構融合學習和記憶功能領域的研究主要集中在人工突觸的可塑性方麵,同時神經元膜的固有可塑性在神經形態信息處理的實現中也很重要

人工智能和機器學習之間的差異及其重要性

機器學習就是通過經驗來尋找它學習的模式,而人工智能是利用經驗來獲取知識和技能,並將這些知識應用於新的環境

滴滴機器學習平台調度係統的演進與K8s二次開發

滴滴機器學習場景下的 k8s 落地實踐與二次開發的技術實踐與經驗,包括平台穩定性、易用性、利用率、平台 k8s 版本升級與二次開發等內容

如何更高效地壓縮時序數據?基於深度強化學習的探索

大型商用時序數據壓縮的特性,提出了一種新的算法,分享用深度強化學習進行數據壓縮的研究探索

基於深度學習目標檢測模型優缺點對比

深度學習模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD
 
資料獲取
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map