国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號

如何基于數(shù)據(jù)科學(xué)進(jìn)行用戶興趣分群?愛奇藝算法驗證和迭代思路公開
2022-08-23   DataFunTalk

愛奇藝商業(yè)智能部門總監(jiān)陸祁女士將介紹愛奇藝在用戶興趣分群上的探索和實踐,主要介紹如何基于數(shù)據(jù)科學(xué)進(jìn)行用戶興趣分群,如何基于事實數(shù)據(jù)生成用戶興趣標(biāo)簽,以及介紹算法驗證和迭代的思路,最后介紹如何基于用戶聚類的方法去做用戶興趣分群。 

全文將圍繞下面三點(diǎn)展開:

  • 數(shù)據(jù)科學(xué)VS用戶興趣分群
  • 基于事實生成的用戶興趣標(biāo)簽
  • 基于內(nèi)容聚類的用戶興趣分群探索

01 數(shù)據(jù)科學(xué)VS用戶興趣分群

首先通過下圖介紹一下數(shù)據(jù)科學(xué)專家的能力范圍。

圖片

注:圖片來源于網(wǎng)絡(luò),侵權(quán)刪?

數(shù)據(jù)科學(xué)家的能力主要由三方面:較強(qiáng)的數(shù)學(xué)功底和數(shù)字敏感程度、很強(qiáng)的問題解決能力(包括數(shù)據(jù)分析、數(shù)據(jù)建模和數(shù)據(jù)處理等能力)、很強(qiáng)的業(yè)務(wù)溝通能力。

圖片

雖然數(shù)據(jù)科學(xué)家面對的業(yè)務(wù)是比較個性化的,但是我們今天將提煉出一個較為通用且具有借鑒意義的課題進(jìn)行分享——用戶興趣分群,其本質(zhì)是通過大數(shù)據(jù)的挖掘和分析,反映出用戶對某個主題或事物不同程度的匹配價值和接受程度。其在互聯(lián)網(wǎng)的各行各業(yè)中是比較適用的,例如電商行業(yè)、服務(wù)行業(yè)、內(nèi)容行業(yè)等,也可以應(yīng)用到一些算法場景提高其準(zhǔn)確度和效果,例如廣告搜索推薦、運(yùn)營策略等。

02 基于事實生成的用戶興趣標(biāo)簽

1. 用戶興趣權(quán)重標(biāo)簽如何設(shè)計?

圖片

為了解不同用戶的興趣,采用最典型的方式就是給用戶打標(biāo)?;诓煌瑯I(yè)務(wù)的認(rèn)知,所提煉出的維度是各異的,但提取的流程類似,例如愛奇藝平臺這類內(nèi)容行業(yè)通常按照以下幾步提取用戶興趣偏好標(biāo)簽:

  • 基于業(yè)務(wù)認(rèn)知研究主題:選取不同興趣的主題,例如視頻內(nèi)容、視頻類型、相關(guān)明星、播放頻道、播放時間以及價格等。
  • 基于以上主題梳理用戶行為:用戶會通過一些觀影和互動等行為表現(xiàn)出對某一主題的傾向性,例如明星偏好,則可能存在關(guān)注、發(fā)彈幕評論、觀看相關(guān)視頻等行為。
  • 選取合適的維度和計算方法量化用戶行為:對于用戶各種顯式和隱式行為,需要一套合理的指標(biāo)體系進(jìn)行量化。針對觀影行為,可以從觀影次數(shù)、觀影時長等維度進(jìn)行量化。
  • 數(shù)據(jù)處理:在建立這個體系的過程中,對不同的指標(biāo)采用加權(quán)、降權(quán)、時間衰減、起始值等方法使量化結(jié)果更加合理科學(xué)。經(jīng)過數(shù)據(jù)權(quán)重等方法處理后,得到一個總和的權(quán)重,還需要將其進(jìn)行0—1的歸一化處理,如果有負(fù)向指標(biāo),可以做-1—1的置信度處理。

通過以上方法得到的結(jié)果,便可以反應(yīng)用戶的偏好傾向,得分越高表示該用戶對于該主題的偏好更加強(qiáng)烈。

2. 用戶興趣標(biāo)簽的驗證與迭代

圖片

上面介紹了生成標(biāo)簽的流程方法。在使用該標(biāo)簽之前,我們還需要審視一下這個標(biāo)簽的適用性,例如上述提到的可比性問題。將標(biāo)簽引入到不同業(yè)務(wù)之前需要進(jìn)行審視和驗證。

圖片?

對于標(biāo)簽的驗證,主要有兩種方法:?

  • 盲測用戶問卷:收集用戶反饋,例如用戶對明星喜好進(jìn)行判斷,便可提供整個權(quán)重的校準(zhǔn)依據(jù),基于此檢驗排序性,判斷標(biāo)簽合理性。
  • 線上不同場景ABTEST:上線權(quán)重標(biāo)簽前可在內(nèi)容過濾、排序等模型上進(jìn)行測試,利用實驗對照組觀察能否帶來明顯提升或正向效果,利用ABTEST的結(jié)果修正權(quán)重設(shè)計。

圖片?

權(quán)重標(biāo)簽更多的是做用戶中長期的偏好計算, 對于即時愛好的計算需要采用事實標(biāo)簽。權(quán)重標(biāo)簽也存在一些短板:

  • 權(quán)重解釋性:權(quán)重標(biāo)簽生成過程中,難免進(jìn)行一下復(fù)雜的數(shù)據(jù)處理,使得該標(biāo)簽對于業(yè)務(wù)方而言不夠簡單明了。
  • 每天全量decay:有些數(shù)據(jù)會融合各種衰減計算,使計算復(fù)雜度更高。
  • 不適合實時場景:對于每天實時發(fā)生的行為數(shù)據(jù)難以及時更新到權(quán)重標(biāo)簽中去,這樣的數(shù)據(jù)標(biāo)簽存在滯后性。

對于一些個性化的場景,會考慮給業(yè)務(wù)方提供事實標(biāo)簽,增加屬性維度,方便其更靈活使用。

3. 用戶興趣結(jié)構(gòu)化事實標(biāo)簽

圖片?

上圖展示了事實標(biāo)簽,主要分為了顯式行為和隱式行為,基本可以通過這些行為去判斷用戶對某一內(nèi)容或主題的偏好程度。其中顯式行為可以直觀表現(xiàn)用戶的偏好,而隱式行為雖不能直觀表現(xiàn)用戶態(tài)度,但對于應(yīng)用場景而言是有意義的統(tǒng)計數(shù)據(jù)。

03 基于內(nèi)容聚類的用戶興趣分群探索

我們通過以上方法對用戶進(jìn)行打標(biāo)之后,如何針對性的做一些內(nèi)容推送或者運(yùn)營策略?

1. 用戶興趣圈層分類方法

圖片

我們常用的對用戶進(jìn)行分組的思維通常是基于用戶屬性,根據(jù)人口統(tǒng)計學(xué)的思想分為少男/少女、男青年/女青年、中高齡等人群。這種分法對于內(nèi)容平臺不夠有針對性,因此可以采用第二種圈層方法——基于內(nèi)容屬性進(jìn)行興趣圈層。具有以下優(yōu)勢:

  • 通過算法發(fā)現(xiàn)看似完全不同內(nèi)容之間意想不到的關(guān)聯(lián)性。
  • 對于內(nèi)容運(yùn)營,可為人工運(yùn)營場景提供數(shù)據(jù)支持。
  • 對于內(nèi)容供給規(guī)劃方,可將純業(yè)務(wù)經(jīng)驗驅(qū)動轉(zhuǎn)變?yōu)榇髷?shù)據(jù)驅(qū)動。

2. 圈層聚類方法

圖片

對于圈層聚類,首先是對內(nèi)容進(jìn)行聚類,如果兩個內(nèi)容的受眾群體的重合度較高意味著內(nèi)容的相似度較高,可劃分為同類內(nèi)容。利用用戶圈層聚類系統(tǒng),可客觀、精準(zhǔn)定位目標(biāo)人群,具有以下優(yōu)勢:

  • 客觀觀影行為:基于用戶真實播放行為為依據(jù),避免了打標(biāo)過程中人的先知經(jīng)驗判斷,更加客觀。
  • 顆粒度可控:圈層劃分粒度可根據(jù)業(yè)務(wù)需求進(jìn)行選擇,例如規(guī)劃可以選擇粗粒度,運(yùn)營方則可選擇更細(xì)的粒度。
  • 數(shù)據(jù)獲取便捷:可利用算法自動聚類圈人。

圖片?

通過經(jīng)典的相似度計算方法可以計算不同內(nèi)容專輯的用戶相似度,但在實際應(yīng)用中會碰到很多問題,因此通過以下修正提升任意兩個內(nèi)容之間重合度的可比性:

  • 修正1:修正內(nèi)容體量差異、頻道規(guī)模差異對用戶重合度計算的影響。
  • 修正2:修正內(nèi)容上線時間早晚、上線時間間隔對用戶重合度計算的影響。

圖片

在上述優(yōu)化方法的基礎(chǔ)上,還可以采用層次聚類等聚類方法進(jìn)行更深層次的優(yōu)化。通過剪枝線的滑動,控制內(nèi)容聚合的顆粒度,通過計算兩兩內(nèi)容的用戶相似度,將用戶最相似的內(nèi)容先聚在一起,依次向上聚集。

圖片

以上是一個例子,分別采用了內(nèi)容聚類方法和標(biāo)簽的方法進(jìn)行的分類。左圖是對于某興趣圈層用戶聚類得到的內(nèi)容,右圖是通過傳統(tǒng)標(biāo)簽打標(biāo)分類得到??梢园l(fā)現(xiàn)左圖的綜合歸納的內(nèi)容和用戶特征是可以推測出用戶的核心訴求,即求追經(jīng)典、優(yōu)質(zhì)IP等,內(nèi)容形成一定價值體系,在娛樂同時可以向觀眾輸出觀點(diǎn)、產(chǎn)生火花碰撞。與右圖的純類別分類方法相比,更加符合用戶需求。

04 問答

Q1:怎么衡量用戶標(biāo)簽的業(yè)務(wù)落地和收益?

A1:在愛奇藝團(tuán)隊中主要應(yīng)用在兩個方向,一個是人工運(yùn)營和規(guī)劃上,一個是與算法結(jié)合的一些模型應(yīng)用上以及用戶畫像挖掘等方向。收益可以體現(xiàn)在利用線上ABTEST得到數(shù)據(jù)效果,以及人工運(yùn)營的投放和活動上。

Q2:用戶聚類和推薦算法之間是個什么關(guān)系?

A2:用戶聚類的結(jié)果會作為信號直接輸入到算法團(tuán)隊,但在推薦層面,模型中其實已經(jīng)包含大量用戶行為和內(nèi)容選擇的信號輸入,原始數(shù)據(jù)中,已經(jīng)體現(xiàn)了這類用戶行為的數(shù)據(jù)信息。這個內(nèi)容聚類更多是從業(yè)務(wù)的角度,相對于打標(biāo)的方法幫助業(yè)務(wù)方更好理解其聚類過程。

Q3:如何甄別用戶在某興趣圈層是否為核心人群或邊緣人群?

A3:如采用傳統(tǒng)權(quán)重標(biāo)簽的方法,可以直接通過權(quán)重就能表現(xiàn)標(biāo)簽的偏好程度。而對于內(nèi)容聚類的層面,例如二次元,天然形成一堆相似內(nèi)容,運(yùn)營便可以精準(zhǔn)投放到該類內(nèi)容背后的用戶。

Q4:一些高熱度節(jié)目會不會對于用戶重疊度分析上帶來偏差?

A4:這個問題就是上文提到的關(guān)于內(nèi)容體量的相似度修正,對于體量特別大和特別小的內(nèi)容需要計算兩兩內(nèi)容用戶重合度的基準(zhǔn)值(期望),去除內(nèi)容體量的影響。

今天的分享就到這里,謝謝大家。

熱詞搜索:

上一篇:火山引擎 RTC 音頻 AI 降噪的應(yīng)用與實踐 原創(chuàng)
下一篇:最后一頁

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
www亚洲一区| 男女男精品网站| 欧美va亚洲va在线观看蝴蝶网| 国产午夜亚洲精品理论片色戒| 一区二区三区在线观看欧美 | 综合欧美亚洲日本| 粉嫩aⅴ一区二区三区四区| 67194成人在线观看| 亚洲国产成人av网| 91啦中文在线观看| 亚洲乱码一区二区三区在线观看| 国产综合色视频| 精品国产乱码久久久久久牛牛| 日本不卡中文字幕| 日韩一区二区三区免费观看| 麻豆精品新av中文字幕| 日韩欧美高清dvd碟片| 九九九精品视频| 久久精品在线观看| 成人美女视频在线看| 亚洲男人的天堂av| 欧美午夜片在线观看| 午夜精品久久久久久久久久| 6080午夜不卡| 久久成人综合网| 国产精品福利电影一区二区三区四区| 懂色av中文一区二区三区| 国产精品电影一区二区三区| 欧美视频一区二区| 日本vs亚洲vs韩国一区三区| 久久久亚洲精华液精华液精华液 | 久久夜色精品国产噜噜av| 成人深夜视频在线观看| 国产精品福利影院| 欧美三级在线看| 国产一区二区不卡| 亚洲私人黄色宅男| 91精品国产综合久久精品图片| 粉嫩av一区二区三区在线播放| 国产欧美日韩三级| 欧美自拍丝袜亚洲| 精品一区二区三区在线播放 | 成人黄色小视频| 亚洲一区二区三区在线| 日韩女优av电影| 99精品在线免费| 乱中年女人伦av一区二区| 国产精品久久久久婷婷二区次| 欧美亚洲一区二区在线观看| 国产综合色产在线精品| 亚洲视频1区2区| 久久久激情视频| 4438x亚洲最大成人网| av不卡在线观看| 精品一区二区三区欧美| 一区二区三区高清不卡| 国产日韩欧美精品综合| 精品视频在线看| www.成人网.com| 欧美性色综合网| 国产盗摄女厕一区二区三区| 天天影视网天天综合色在线播放 | 成人动漫在线一区| 麻豆国产一区二区| 石原莉奈一区二区三区在线观看| 亚洲国产精品激情在线观看| 日韩女优视频免费观看| 欧美另类变人与禽xxxxx| 99国产一区二区三精品乱码| 国产最新精品精品你懂的| 天天爽夜夜爽夜夜爽精品视频| 亚洲欧美日韩一区二区| 国产区在线观看成人精品| 精品裸体舞一区二区三区| 制服丝袜亚洲精品中文字幕| 91国产成人在线| 日本精品免费观看高清观看| 99久久免费视频.com| 日韩一二在线观看| 欧美日韩综合在线| 欧美日韩精品一区二区三区四区| 91丝袜呻吟高潮美腿白嫩在线观看| 国产一区二区三区| 激情偷乱视频一区二区三区| 久久国产精品免费| 九一久久久久久| 国产精品性做久久久久久| 国产一区 二区| 成人黄色小视频| 色婷婷精品久久二区二区蜜臂av | 欧美情侣在线播放| 欧美日韩专区在线| 欧美久久一二区| 欧美一区二区三区不卡| 日韩欧美在线网站| 久久奇米777| 国产精品无码永久免费888| 国产精品色噜噜| 亚洲黄色小说网站| 日韩国产欧美视频| 寂寞少妇一区二区三区| 国产伦精品一区二区三区免费| 国产成人精品三级麻豆| 91亚洲永久精品| 欧美日韩午夜在线视频| 欧美电影免费观看高清完整版| 久久天堂av综合合色蜜桃网 | 成人精品一区二区三区四区| 91影院在线观看| 在线播放/欧美激情| 久久网站热最新地址| 亚洲人精品午夜| 午夜精品爽啪视频| 国产自产2019最新不卡| 成人av电影免费观看| 欧美性一二三区| 精品成人佐山爱一区二区| 日韩伦理av电影| 老司机精品视频导航| 成人国产精品免费| 91精品中文字幕一区二区三区| 久久久精品免费观看| 樱桃国产成人精品视频| 精品一区二区精品| 欧美性大战久久| 久久综合狠狠综合久久激情| 综合激情成人伊人| 久久 天天综合| 欧美色老头old∨ideo| 中文字幕欧美激情一区| 奇米影视7777精品一区二区| 91免费精品国自产拍在线不卡| 精品久久久久久亚洲综合网| 亚洲精品日韩综合观看成人91| 久久se精品一区精品二区| 色欧美日韩亚洲| 欧美激情一区二区| 色综合久久66| 久久久国际精品| 精品亚洲国内自在自线福利| 在线观看视频91| 国产精品网友自拍| 国产乱妇无码大片在线观看| 91精品国产乱码| 午夜视频在线观看一区二区三区 | 一区二区三区四区五区视频在线观看| 国产一区二区三区免费播放| 欧美一级艳片视频免费观看| 亚洲精品成人少妇| 99久久er热在这里只有精品15| 久久中文娱乐网| 激情综合五月天| 欧美成人一区二区| 久久精品二区亚洲w码| 91精品国产免费| 日本特黄久久久高潮| 欧美日韩激情一区二区三区| 亚洲美女视频在线观看| 99re这里都是精品| 中文字幕在线观看不卡视频| 成人一道本在线| 国产精品成人免费精品自在线观看 | 国产精品入口麻豆九色| 蜜臀av性久久久久蜜臀aⅴ四虎 | 一区二区不卡在线播放| 91女厕偷拍女厕偷拍高清| 亚洲欧洲韩国日本视频| 99re视频精品| 一区二区三区国产精品| 日本精品免费观看高清观看| 亚洲精选在线视频| 欧美三区在线观看| 日本不卡的三区四区五区| 精品黑人一区二区三区久久| 国产精品主播直播| 国产亚洲女人久久久久毛片| 成人黄色av电影| 亚洲永久精品国产| 日韩一区二区电影网| 看电影不卡的网站| 欧美国产日产图区| 91免费国产在线| 美女视频黄久久| 中文字幕二三区不卡| 91久久精品一区二区三区| 天堂成人国产精品一区| 久久日一线二线三线suv| 91首页免费视频| 青青青爽久久午夜综合久久午夜| 精品处破学生在线二十三| 91麻豆精东视频| 日本免费新一区视频| 欧美国产成人在线| 欧美绝品在线观看成人午夜影视| 美美哒免费高清在线观看视频一区二区 | 日韩一级二级三级| 色婷婷综合久久久中文字幕| 午夜精品视频一区| 亚洲国产精品二十页| 欧美裸体bbwbbwbbw|