Netflix 如何使用大數據創建內容並增強用戶體驗
已發表: 2019-03-21截至 2018 年第四季度,Netflix 擁有美國流媒體行業 51% 的市場份額和超過 1.48 億的全球流媒體用戶,無疑是一股不可忽視的力量。
更有趣的是,Netflix 有望實現盈利。 下圖由 Statista 提供,顯示了 Netflix 從 2002 年到 2018 年的年收入,有一點很清楚:Netflix 正在持續且呈指數增長。
與大多數其他品牌不同,Netflix 的增長更多地歸功於內容和用戶體驗,而不是營銷,而這些內容在很大程度上受到大數據的影響。
儘管做出了違反直覺的決定,但大數據正在幫助 Netflix 蓬勃發展
雖然許多組織尚未有效利用可用數據,但 Netflix 是一個值得注意的例外。
Netflix 很容易成為最違反直覺的公司之一。 Netflix 在 2016 年決定全面封鎖 VPN,這就是 Netflix 違反直覺的一個重要例子。
儘管當時有超過 3000 萬 Netflix 用戶居住在不使用 VPN 或其他位置屏蔽服務(並且 Netflix 現在記錄其大部分訂閱收益)無法使用 Netflix 服務的國家/地區。
同年,Netflix 不顧用戶的抗議和數十萬用戶的流失,提高了價格並拒絕讓步。
然而,Netflix自那以後才發展壯大。
下圖顯示了 Netflix 自 2016 年做出有爭議的禁止 VPN 和提高價格的決定以來的訂戶增長。
那麼,儘管疏遠了其基礎的很大一部分,Netflix 如何能夠繼續快速增長? 通過利用大數據準確找出用戶想要什麼並將其提供給他們。
Netflix 在內容和用戶體驗上押下重註,Netflix 的大部分預算都花在了內容上。 2019 年,Netflix 承諾為內容提供 150 億美元的預算。 相比之下,他們為營銷投入了微薄的 29 億美元。
雖然關注 Netflix 龐大的內容預算很容易,但最好關注用於為這些內容提出想法的過程以及大數據的作用。
Netflix 的大數據基礎設施
Netflix 使用數據處理軟件和傳統商業智能工具(例如 Hadoop 和 Teradata)以及自己的開源解決方案(例如 Lipstick 和 Genie)來收集、存儲和處理海量信息。 這些平台會影響其決定向觀眾創建和推廣什麼內容。
Netflix 不使用傳統的基於數據中心的 Hadoop 數據倉庫。 為了允許它存儲和處理快速增長的數據集,它使用亞馬遜的 S3 來存儲其數據,允許它為訪問相同數據的不同工作負載啟動多個 Hadoop 集群。 在 Hadoop 生態系統中,它使用 Hive 進行臨時查詢和分析,使用 Pig 進行 ETL(提取、轉換、加載)和算法。
然後,它創建了自己的 Genie 項目,以幫助處理規模不斷擴大的海量數據。 所有這些都指向一件事:Netflix 非常注重擁有大量數據並能夠處理這些數據以確保它準確了解用戶的需求。
結果簡直是驚人的。 Netflix 能夠確保其原創內容的高參與率,因此 90% 的 Netflix 用戶都參與了其原創內容。
Netflix 的內容大數據方法非常成功,以至於與電視行業相比,Netflix 更新了 93% 的原創劇集,在第一季之後,只有 35% 的節目會更新。
紙牌屋:Netflix 大數據案例研究
Netflix 使用大數據來構思成功內容的最常被引用的例子之一是紙牌屋電視劇。 有充分的理由。
一些快速的事實:
- 當 Netflix 想在 2013 年推出紙牌屋節目時,與電視行業的標準做法不同,Netflix 沒有推出試點。 相反,它甚至在第一集播出之前就委託了該節目的兩季(估計花費超過 1 億美元)。 對於一場不能保證成功的節目來說,這是一場非常大的賭博,或者是這樣認為的。
- 《紙牌屋》節目一炮而紅,六年後,儘管圍繞其明星凱文·史派西 (Kevin Spacey) 出現了動盪,但該節目仍然在 IMDB 上的 420,000 多條評論中獲得 8.8 分(滿分 10 分),使其躋身大片之列,如阿凡達和黑道家族。
- 根據 Netflix 的說法,《紙牌屋》如此成功,以至於它是美國和其他 40 個國家/地區流媒體最多的內容。
雖然Netflix對紙牌屋兩季的承諾對外人來說是一場賭博,但業內人士已經知道該節目會成功
事實上,Netflix 對紙牌屋的成功充滿信心,以至於一位高管在接受 GIGAOM 採訪時告訴 GIGAOM,他們不需要花費數百萬美元來讓人們收看該節目。 他們只知道人們會看。
由於 Netflix 與其訂閱者的直接關係,以及關於觀眾如何與其內容互動的大量數據,該公司可以輕鬆確定人們想要什麼樣的內容。
以紙牌屋為例,通過分析其數據,Netflix 意識到當時其 3300 萬訂閱者中有很大一部分在其平台上從頭到尾播放了導演大衛芬奇的作品《社交網絡》,以及凱文史派西在觀眾中總是很成功。
更重要的是,Netflix的數據顯示,其平台上的英國版紙牌屋大受歡迎。 而那些看過英國版紙牌屋的人也看過凱文史派西飾演或大衛芬奇導演的其他電影。
根據這些數據,Netflix 得出的結論是,一部在英國已經成功、由備受喜愛的演員凱文·史派西和導演大衛·芬奇主演的美國觀眾將大受歡迎。
Netflix 是對的
在推出紙牌屋後的三個月內,Netflix 在美國增加了 200 萬訂戶,在國際上增加了 100 萬訂戶。
這意味著該公司的利潤估計增加了 7,200 萬美元,在短短幾個月內幾乎收回了其在紙牌屋節目中的初始投資。
《紙牌屋》第一季的續訂率高達 93%,因此它的成功並非孤立事件。 其他系列,如 Orange Is The New Black、Arrested Development 和 The Crown 使用依賴大數據的類似過程引入了好評。
Netflix 如何使用數據來提升用戶體驗
在收集數據方面,Netflix 擁有超過 1.48 億訂戶的龐大用戶群為其提供了巨大優勢。 然後重點關注以下指標:
- 觀看日期內容
- 觀看內容的設備
- 觀看內容的性質如何因設備而異
- 在其平台上搜索
- 重新觀看的部分內容
- 內容是否暫停
- 用戶位置數據
- 在一天和一周中觀看內容的時間以及它如何影響觀看的內容類型
- 來自第三方(如 Nielsen)的元數據
- 來自 Facebook 和 Twitter 的社交媒體數據
收集到數據後,Netflix 會以多種方式使用這些數據。 最重要的用途之一是製定和驗證原始編程思想,如上述紙牌屋示例中所述。
可以說更重要的是 Netflix 掌握有效使用數據的方式,讓人們參與到其內容中。
Netflix 非常擅長有針對性的內容推廣,估計其平台上 80% 的流媒體內容都受到其推薦系統的影響。
這個推薦系統的設計方式是:
- Netflix 專注於通過個性化內容排名器為每個用戶提供用戶想要的東西,該排名器根據收集到的有關用戶的個人信息來組織每個 Netflix 用戶的收藏。 像 Netflix 一樣,您可以使用大數據來確保交付給每個用戶的內容受到用戶個人活動和與您的品牌互動的影響,從而確保每個用戶的內容體驗都是獨一無二的。
- Netflix 不僅根據內容的流行程度,還根據有關用戶的可用個人信息,對熱門內容和熱門內容進行排名。 內容根據用戶的 Netflix 活動進行推廣。 這裡的關鍵教訓是,雖然人們對流行的東西感興趣,但他們仍然希望它受到他們興趣的影響。 在向用戶宣傳“熱門內容”時,重要的是要確保它與他們的個人興趣相關。
- 最近瀏覽的內容是根據用戶是否會繼續觀看或重新觀看,或者用戶是否因為沒有發現有趣的內容而停止觀看的分析來排序的。 這是確保 Netflix 不會讓用戶感到厭煩的關鍵; 自從您投資了相同的內容後,您可能很想繼續宣傳相同的內容。 如果用戶活動表明缺乏興趣,最好將內容降級並提供更有趣的內容。
- 內容親和度算法會推薦與用戶剛剛觀看的內容相似的內容。 需要注意的是,人們更有可能想要消費與他們剛剛消費的內容類似的內容。
綜上所述
在不厭倦技術性的情況下,Netflix 顯然是大數據力量的一個很好的例子。 雖然您可能沒有資源來創建自己的項目以提高大數據效率,就像 Netflix 通過創建其 Genie 項目所做的那樣,但大數據行業正在迅速發展,並且存在許多開源工具來幫助您收集和處理基本數據準確了解您的用戶想要什麼。
以 Netflix 為例,可以有效地利用大數據來增強您的內容和用戶體驗,並確保您的業務增長。
Gabrielle Sadeh 是一名數字營銷顧問。 她可以在 Twitter @GabrielleSadeh上找到。