計算機視覺(CV)和自然語言處理(NLP)早先是兩個較為獨立的研究領域。CV 重點關注如何用計算機代替人眼對目標完成識別、跟蹤、測量等任務,對圖像進行處理;NLP 則研究計算機如何處理、運用自然語言,包括語言生成、問答、對話等任務。近年來,以深度神經網絡為代表的機器學習和模式識別技術被廣泛應用於 CV 和 NLP 領域,取得了目前最先進的效果。
近年來,研究者們試圖將動作控製也引入到「視覺-語言」任務的框架中。吳琦將此類任務命名為 V3A(Vision, Ask, Answer, Act),在給定視覺輸入後,我們希望機器能夠提出問題、回答問題、並通過和人以及機器之間的語言交流執行某些動作。
例如,「Vision+Ask」的任務包含視覺問題生成、根據問題生成查詢、圖像描述等;「Vision+Answer」的任務包含視覺問答、視覺對話等;「Vision+Act」的任務包含指稱表達、視覺對齊(visual grounding)、語言引導的視覺導航、具身視覺問答、具身指稱表達等。
|
|
資料獲取 | |
服務機器人在展館迎賓講解 |
|
新聞資訊 | |
== 資訊 == | |
» 機器人多模態視覺語言導航技術解析 | |
» 小型四足機器人老鼠SQuRo 可攜帶20 | |
» 為老年人設計人工智能技術-14項指導原則 | |
» 基於康複機器人內部傳感器的運動功能評價方 | |
» 協作機器人發展進入新賽道,突破“圍欄式” | |
» 工業和信息化部產業發展促進中心發布了《關 | |
» 中國信通院發布《人工智能白皮書(2022 | |
» 人工智能競賽白皮書——跑通數據價值閉環 | |
» 德勤管理谘詢發布報告《2022技術趨勢( | |
» 創澤集團受邀參加第十一屆APEC中小企業 | |
» 智能機器人拐點已至 機器人產業未來方向是 | |
» 關於發布共融機器人基礎理論與關鍵技術研究 | |
» 人工智能發展特點及麵臨挑戰 | |
» 中新天津生態城構建智慧城市產業大腦,用A | |
» 製定平台、應用、技術“三個”戰略和“四個 | |
== 機器人推薦 == | |
服務機器人(迎賓、講解、導診...) |
|
智能消毒機器人 |
|
安防巡檢機器人 |
|
人工智能垃圾站 |
|
== 信息推薦 == | |
機器人招商 Disinfection Robot 消毒機器人公司 機器人應用 智能垃圾站 消毒機器人價格 消毒機器人廠家 機器人政策 教育機器人 迎賓機器人 機器人開發 清潔機器人 消毒機器人 講解機器人 安防巡檢機器人 霧化消毒機器人 紫外線消毒機器人 地圖 |