創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人開發 > 讓大規模深度學習訓練線性加速、性能無損,基於BMUF的Adam優化器並行化實踐  
 

讓大規模深度學習訓練線性加速、性能無損,基於BMUF的Adam優化器並行化實踐

來源:AI科技大本營      編輯:創澤      時間:2020/5/29      主題:其他   [加盟]

作為一種自適應步長隨機梯度優化器,自2014年提出以來,Adam 算法便以其卓越的性能風靡深度學習領域。為了提高應用於訓練大規模任務時的效率,該算法通常與同步隨機梯度(Synchronous Stochastic Gradient,SSG)技術相結合,采用數據並行(data parallel)的方式在多台機器上執行。在本文中,我們稱這一方法為 Sync-Adam。

本質上來講,Sync-Adam 通過將一個 minibatch 內樣本的梯度計算分布到多台機器上達到加速目的,因此通信十分頻繁,並且隨著並行機器數目增多,minibatch 內樣本的數量也成比例增加,這種情況下,通常會損害最終得到的模型的性能。為解決基於 SSG 的 Adam 算法可擴展性差的難題,我們把目光投向了逐區塊模型更新濾波(Blockwise Model-Update Filtering, BMUF)框架。

BMUF 是一種通信高效的通用分布式優化算法框架,於2016年由微軟亞洲研究院語音組的研究人員提出並發表。該算法在多個並行工作機之間周期性同步模型更新信息,並與曆史更新信息相結合提升全局模型性能。與基於 SSG 的算法相比,BMUF 具有通信頻率較低、訓練幾乎線性加速、模型性能基本無損的特點。這一算法已經在工業界廣泛用於大規模深度學習模型的訓練。

本文中,我們采用 BMUF 框架並行化 Adam 算法,並在微軟大規模 OCR 和語音產品數據集上進行了測試。實驗結果表明,在大規模 OCR 任務中,BMUF-Adam 在多達64機的並行訓練中幾乎實現了線性加速的同時,基本沒有模型性能損失,在32機大詞彙量連續語音識別任務中也獲得了類似效果。

接下來我們探討如何采用 BMUF 框架賦能 Adam 算法,在大規模深度學習任務上成就不凡。


在基於 BMUF 的訓練框架下,假設我們總共有 N 個並行工作機,一個工作機可以是一塊或多塊 GPU 卡,也可以是一個計算節點。給定一個包含 Nτ 個 minibatch 的訓練數據子集,首先我們將這些數據均勻分布到 N 個並行工作機,每台工作機獲得 τ 個 minibatch。從一個共同的初始模型 θ_(t-τ)^((init)) 開始,N 個工作機獨立更新各自的局部模型 τ 步,得到 {θ_(t,1),θ_(t,2),…,θ_(t,N)},對局部模型取平均得到 θ ̅_t。這一過程稱之為數據塊內並行優化(Intra-Block Parallel Optimization, IBPO)。與直接將 θ ̅_t 作為全局模型不同,BMUF 技術將曆史更新信息與當前更新信息結合,得到全局模型:



創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



音樂人工智能、計算機聽覺及音樂科技

音樂科技、音樂人工智能與計算機聽覺以數字音樂和聲音為研究對象,是聲學、心理學、信號處理、人工智能、多媒體、音樂學及各行業領域知識相結合的重要交叉學科,具有重要的學術研究和產業開發價值

【深度】未來5-10年計算機視覺發展趨勢為何?

專家(查紅彬,陳熙霖,盧湖川,劉燁斌,章國鋒)從計算機視覺發展曆程、現有研究局限性、未來研究方向以及視覺研究範式等多方麵展開了深入的探討

華南理工大學羅晶博士和楊辰光教授團隊發文提出遙操作機器人交互感知與學習算法

羅晶博士和楊辰光教授團隊提出,遙操作機器人係統可以自然地與外界環境進行交互、編碼人機協作任務和生成任務模型,從而提升係統的類人化操作行為和智能化程度

實時識別卡扣成功裝配的機器學習框架

卡扣式裝配廣泛應用於多種產品類型的製造中,卡扣裝配是結構性的鎖定機製,通過一個機器學習框架將人類識別成功快速裝配的能力遷移到自主機器人裝配上。

基於多任務學習和負反饋的深度召回模型

基於行為序列的深度學習推薦模型搭配高性能的近似檢索算法可以實現既準又快的召回性能,如何利用這些豐富的反饋信息改進召回模型的性能

張帆博士與Yiannis Demiris教授團隊提出高效的機器人學習抓取衣服方法

機器人輔助穿衣通常人工的將衣服附在機器人末端執行器上,忽略機器人識別衣服抓取點並進行抓取的過程,從而將問題簡化

百度算法大牛35頁PPT講解基於EasyDL訓練並部署企業級高精度AI模型

百度AI開發平台高級研發工程師餅幹老師,為大家係統講解企業在AI模型開發中的難點,以及針對這些難點,百度EasyDL專業版又是如何解決的

Technica公司發布智能霧計算平台技術白皮書

SmartFog可以輕鬆地將人工智能分析微服務部署到雲、霧和物聯網設備上,其架構支持與現有係統的靈活集成,提供了大量的實現方案,要用下一代人工智能算法來彌補現有解決方案的不足。

深度學習在術前手術規劃中的應用

深度學習對推動術前手術規劃尤其重要,手術規劃中要根據現有的醫療記錄來計劃手術程序,而成像對於手術的成功至關重要
 
資料獲取
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map