創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人知識 > 微信提出推薦中的深度反饋網絡,在“看一看”數據集上達到SOTA  
 

微信提出推薦中的深度反饋網絡,在“看一看”數據集上達到SOTA

來源:AI科技大本營      編輯:創澤      時間:2020/5/22      主題:其他   [加盟]

在推薦係統中,用戶的顯式反饋、隱式反饋、正反饋和負反饋都能夠反映用戶對於被推薦物品的偏好。這些反饋信息在推薦係統中十分有用。然而,現在的大規模深度推薦模型往往以點擊為目標,隻看重以用戶點擊行為為代表的隱式正反饋,而忽略了其它有效的用戶反饋信息。

作者在本文中關注用戶多種顯式/隱式和正/負反饋信息,學習用戶的無偏興趣偏好。具體地,作者提出了一個Deep Feedback Network (DFN)模型,綜合使用了用戶的隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)以及顯式負反饋(點擊不感興趣按鈕行為)等信息。

DFN模型使用了internal feedback interaction component抓住用戶行為序列中的細粒度的行為級別的交互,然後通過external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。在實驗中,作者基於微信看一看的數據,進行了豐富的離線和在線實驗,模型與baseline相比均取得顯著提升。


1、模型背景與簡介

推薦係統在日常生活中被廣泛使用,為用戶獲取信息與娛樂提供便利。推薦係統算法往往基於用戶與係統的交互,這些交互行為可以大致分為以下兩類:顯式反饋與隱式反饋。顯式反饋從用戶對於物品的直接態度中獲取,例如評論中的一星到五星,或者微信看一看係統中的“不感興趣”按鈕。這類反饋能夠直接表達用戶的正向以及負向偏好,但是這類反饋的數量往往不多。隱式反饋從用戶的行為中間接獲得,例如用戶的點擊/不點擊行為。這些信息在推薦係統中往往是海量的,但是這些信息有著較多噪聲(用戶點擊的並不一定是他真正喜歡的)。另外,隱式反饋通常是以正反饋的形式出現,推薦中的隱式負反饋存在巨大噪聲(未展現信息或者未點擊信息並不一定意味著用戶不喜歡這些內容)。

在近期的深度推薦係統中,CTR導向的目標受到極大關注。因此,模型不可避免地隻關注和目標緊密相關的用戶點擊行為,忽略了其它用戶行為中蘊含的豐富信息。僅考慮CTR導向目標的推薦模型往往會遇到以下兩個問題:(1)CTR導向目標隻關注用戶喜歡什麼,沒有關注用戶不喜歡什麼。這樣,模型的推薦結果容易同質化和趨熱化,損害用戶體驗。因此,負反饋信息是必要的。(2)用戶除了被動地接受係統推薦的物品,有時也需要能夠主動和即時的反饋機製。用戶希望能夠高效和準確地告知係統自己喜歡或者不喜歡什麼。另外,用戶的顯式和隱式反饋之間也會存在割裂(用戶點擊的並不一定是他真正喜歡的)。因此,顯式反饋也是必要的。顯式信息和隱式信息能夠作為彼此的補充,相輔相成。已有工作通過使用用戶的未點擊/未曝光行為作為用戶的隱式負反饋,這樣會引入極大的噪聲。另外一些工作嚐試使用用戶的顯式負反饋信息。這些信息固然精確,但是也往往比較稀疏。

為了解決這些問題,綜合使用用戶多種顯式/隱式和正/負反饋信息學習更好的無偏用戶表示,作者提出了一個Deep Feedback Network (DFN)模型。圖1中給出了在微信看一看場景中的三種用戶反饋。DFN通過internal feedback interaction component抓住用戶行為序列中的細粒度行為級別的交互,然後通過external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。這些反饋特征會和其他用戶/物品特征混合,並行使用FM、Deep和Wide層進行特征交互,最後進行CTR預估。

作者基於微信看一看推薦係統,設計了離線和線上實驗,在多個指標上具有顯著提升。這篇工作的主要貢獻如下:

1、作者第一次融合隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)、顯式負反饋(點擊不感興趣按鈕行為)和它們之間的交互信息進行用戶行為建模;

2、作者提出了一個全新的Deep Feedback Network (DFN)模型,能夠學習到用戶無偏的興趣偏好;

3、模型在離線和在線任務上都得到了顯著提升,具有工業級實用價值。論文中也提出了一個feed流中的顯式負反饋預測任務。

 

2、模型結構

DFN模型主要分為三個階段:首先,deep feedback interaction module以用戶的多種反饋行為作為輸入,輸出用戶的反饋特征。然後,Feature Interaction Module進一步考慮用戶的其它特征和物品特征,使用FM、Deep和Wide層進行特征交互。最後,輸出層使用CTR作為訓練目標。圖2給出了DFN的整體結構。

deep feedback interaction module是模型的主要創新點。它包括了兩個組成部分:Internal Feedback Interaction Component和External Feedback Interaction Component。圖3給出了deep feedback interaction module的結構。

首先,在Internal Feedback Interaction Component中,用戶的隱式正反饋、隱式負反饋和顯式負反饋序列和target item一起,通過一個transformer層,得到了在各個序列內部細粒度的item-level的交互信息,然後經過average層得到三種反饋的特征表示,其中隱式正反饋特征中蘊含高質量的用戶正向偏好,顯式負反饋特征中蘊含高質量的用戶負向偏好。

第二步,在External Feedback Interaction Component中,隱式負反饋序列往往是三種行為中最多的行為,但也是噪聲最大的行為。作者把高質量的和target item交互後的隱式正反饋特征和顯式負反饋特征看作一種高質量指導,從用戶未點擊序列中挖掘用戶或許喜歡/不喜歡的物品,補充用戶的正向負向偏好。作者使用了一個attention層得到了兩種用戶弱正向/負向反饋特征。這兩種弱反饋特征和第一步的三種反饋特征拚接後成為最終的用戶反饋特征。

第三步,在Feature Interaction Module中,作者使用了FM、Wide和Deep層,對用戶其它特征、物品特征和用戶反饋特征等進行低階/高階特征交互。這一個模塊是為了充分利用各種特征輔助推薦,使得模型在真實工業級任務上達到最好的效果。使用Wide層主要是為了給潛在的特征工程留下接口。

最後,作者基於CTR loss進行訓練。除去傳統的正例和未點擊負例,作者還增加了一項預測用戶負反饋點擊的loss。由於在實際推薦係統中,用戶給出主動顯式負反饋的次數極少,顯式負反饋中的負向信息也極其強烈,所以作者單獨在loss中強調了這一項,並且給予了較大的訓練權值。

3、實驗結果

離線和線上實驗均在微信看一看上進行,離線數據集包含千萬級用戶在百萬級物品上的億級行為。模型離線CTR預估結果如圖4:

4、總結

在本文中,作者初步研究了推薦係統中的多種顯式/隱式和正/負反饋之間的協同合作機製。DFN模型能夠基於多種反饋信息即時學習到用戶的無偏的正負向興趣,在點擊預估和不感興趣預估等多個任務上均有提升效果。直觀而有效的模型也使得DFN能成功在工業級推薦係統中得到部署和驗證。我們預測用戶的顯式反饋,特別是顯式負反饋的信息將會未來推薦係統中起到更加重要的作用,在發掘推薦係統可解釋性同時提升用戶體驗。


創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



基於腦肌融合的軟體康複手研究

軟體機械手充分利用和發揮各種柔性材料的柔順性,及其非線性、粘彈性和遲滯特性等在軟體手運動和控製中潛在的“機械智能”作用,降低控製的複雜度,實現高靈活性、強適應性和良好交互性,在醫療康複領域有重要應用價值

情感分析技術:讓智能客服更懂人類情感

智能客服係統中人機結合的服務形式,從五個維度總結和介紹情感分析技術在智能客服係統中的應用場景,包括情感分析算法模型的原理及實際落地使用方式和效果分析

AI也會遭遇瓶頸 解析人工智能技術的存儲性能需求

AI人工智能技術需要構建強有力的IT基礎設施,人工智能的工作主要由采集、準備、訓練和推理四部分組成,每個部分需要讀寫不同類型的數據,工作負載也不盡相同,將給存儲設備帶來較大的挑戰。

自動化所提出神經元群體間側向交互的卷積脈衝神經網絡模型

基於梯度反向傳播的脈衝神經網絡(SNN)訓練方法逐漸興起。在這種訓練方法下,SNN能夠在保留神經元內部動力學的同時獲得較好的性能

基於激光雷達的SLAM(激光SLAM)研究

Cartographer跨平台和傳感器配置,MC2SLAM實時激光裏程計係統,LeGO-LOAM種輕量級和地麵優化的激光雷達裏程計和建圖方法,SUMA++開源的基於語義信息的激光雷達SLAM係統

學一個忘一個?人工智能遭遇“災難性遺忘”,克服“失憶”有何良策

人工智能為什麼會產生“災難性遺忘”?目前,解決災難性遺忘的方案有哪些?難點在哪?來看看專家怎麼說

抗疫“智”先鋒!創澤消毒機器人技高一籌!

創澤智能消毒機器人到山東省胸科醫院、濟南市傳染病醫院、濟南市疾病預防控製中心投入新冠肺炎消毒戰鬥

人與機器人交互時代的社會認知

與機器人互動時研究人的大腦將有助於更清晰、更深入地了解人機交互,從而為社交機器人的春天奠定基礎,將社會維度整合到人與這些機器的交流中來加速人與機器人的交互研究,有助於推動創造真正的社交機器人

騰訊優圖30頁AI生成內容報告詳解步入商業化元年的深度合成技術

騰訊研究院騰訊優圖實驗室共同完成報告《AI生成內容發展報告2020——“深度合成”(deep synthesis)商業化元年》總結出了人們對該技術的十個誤解,幫助人們更全麵地了解深度合成技術的發展和應用情況

關於做好《5G應用場景300例》宣傳推廣工作的通知

山東聯通、山東移動、山東電信在全國範圍內篩選了解決方案,編製了《5G應用場景300例》加快5G在重點產業領域的推廣應用,推動山東省省5G產業發展

自動駕駛網絡解決方案白皮書

白皮書係統闡述未來網絡架構、運維架構和其關鍵技術,通過網元、網絡和雲端的三層AI能力協同,使能網絡走向極簡超寬、運維邁向人機協同,為運營商和產業夥伴的數字化轉型提供實踐參考

政府工作報告:加強新基建,拓展5G應用,發展工業互聯網

對於 “新基建” 投資,工業互聯網建設,以及為企業提供金融支持、幫助企業渡過難關

錢鋒院士:人工智能賦能流程製造

智能、自主、可控是未來流程製造智能化的前沿研究方向,需要通過人工智能等現代信息技術與流程製造業的深度融合,拓展“智能+”,研究麵向複雜係統的多時空尺度的優化調控方法和技術

日照市垃圾分類排出時間表

2020年, 日照市實現公共機構生活垃圾分類全覆蓋,東港區基本建成生活垃圾分類示範片區,2022年,東港區實現生活垃圾分類全覆蓋,其他區縣至少各有1個街道基本建成生活垃圾分類示範片區。2025年,我市基本建成生活垃圾分類處理係統
 
資料獲取
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map