為什麼你的 App 知道你想買什麼|回形針_風聞
观察者网用户_239377-2019-01-16 22:26
-文字稿-
數字生活讓人疑神疑鬼。
你剛在微信上和朋友説要去日本玩,就在朋友圈看到了機票廣告,你老婆剛給你打電話讓你買奶粉,你就在淘寶看到了奶粉推薦。

這些廣告都是怎麼來的?為什麼這些 APP 都知道你想買什麼?
淘寶當然不會竊聽你的電話,是你的行為數據讓淘寶意識到了你需要嬰兒奶粉。
註冊一個賬號,你需要輸入自己的名字,手機號,有時候還會補充性別,所在地。但這只是微不足道基礎數據。

更重要的,是你的消費記錄,打車頻率,關注的公眾號,玩過的遊戲,理財習慣,有沒有車貸房貸買過保險,發過的紅包,這些行為最後會變成幾千個事實標籤,成為你行為數據的一部分。

採集事實標籤並不難,難的是建立模型,從雜亂的標籤中找到你真正的興趣,進而構建用户畫像。
舉個例子,你打開一篇內容標籤為美女的文章,並不意味着你真的愛看美女,可能只是不小心點到。這時,就需要通過你更多的行為來判斷這篇文章對你的吸引力。

這是一個非常初級的內容標籤權重算法:
興趣標籤(美女)權重 = 行為權重 x 訪問時長 x 衰減因子
行為權重:什麼都不幹1分,評論+0.5,點贊+0.5,轉發+2,收藏+1
時長權重:10S以內權重為0.5,10S-60S為1,60S以上為2
衰減因子:0-3天內權重為1,3-7天權重為0.85,7-15天權重為0.7,15-30天權重為0.5,30天以上權重為0.1
行為權重對應你是否有評論、點贊、轉發、收藏等操作,不同操作有不同的數值,累加成行為權重。

停留時間越長,時間權重也越高。最後,短期行為也無法代表長期興趣,單次閲讀行為的權重會隨着時間流逝不斷衰減。

於是,你每次打開美女類內容都會生成一個興趣權重,把一段時間內你所有的美女類興趣權重進行累加,再用 S 形函數標準化,就能得到一個「0—10」區間的興趣標籤值。
數值越高,你對美女就越感興趣。

除了內容興趣,這種算法思路可以在消費能力,消費興趣,社交習慣等多個維度建立模型,計算你的偏好。
之後,這些偏好會被轉換為特徵向量。假設你的美女興趣標籤值是8,消費能力是5,社交偏好是2,就可以用向量表示為 r (8,5,2)。

我們可以把特徵向量理解成多維空間上的一個座標,通過把每一個用户的向量座標帶入餘弦公式或距離公式中,就能計算出和你相似的人,進而把用户分類。
但行為數據只能計算偏好,無法判斷你的性別、學歷等個人屬性。
這就需要把已知性別和學歷的用户作為樣本,一部分用來訓練模型,一部分測試準確度。今天各大平台對於用户性別的預測準確度已經可以達到90%以上。

最後,微信淘寶們就能得到一個這樣的用户畫像:
這樣,廣告主就可以找到他們想要的消費者了。
這是騰訊廣告投放平台的後台。廣告主可以自由組合包含消費水平、婚戀情況、內容興趣,消費行為在內的上千個定向標籤供,最後選定廣告位和投放時間,根據系統計算的 1.5 元每千次曝光的建議出價,就完成了一次精準投放。

之後,一個住在北京朝陽有過奶粉消費記錄的已婚男青年在即將刷到廣告位的那一瞬間,廣告平台會發起競價請求,最後,價高的廣告將出現在你的眼前。

如果你對這個話題感興趣,可以在騰訊廣告平台的開發者文檔,進一步瞭解你的行為數據被處理到了什麼樣的程度,比如篩選出“ 2017.7.1 至 2017.7.15 去過上海機場 3 次以上的人”。

另外,通過行為推薦商品的效果往往不如通過同類推薦商品。找到和你一樣的人,把他們的的瀏覽和消費記錄推薦給你,往往比直接猜你喜歡什麼效果更好。

需要説明的是,微信淘寶們採集的行為數據不僅只對應你的賬號,更與你的手機唯一識別碼綁定在一起。
*安卓手機上可以採集到的的唯一設備編碼叫 IMEI,在 iPhone 上叫 IDFA
這意味着, 你就算不註冊不登錄,你的行為數據一樣會被採集。

同時,廣告平台也可以根據你的手機識別碼在其他 App 上為你投放廣告,這樣,你刷抖音的時候也能看到淘寶的奶粉廣告了。

別太緊張,根據《個人信息安全規範》,商業廣告平台的所有標籤都應該避免精確定位到個人,以保護你的隱私安全 。
如果你是 iPhone 用户,還可以通過在設置中關閉 IDFA 碼限制 App 們對你的數據採集。
