Netflix 如何使用大数据创建内容并增强用户体验

已发表: 2019-03-21

截至 2018 年第四季度,Netflix 拥有美国流媒体行业 51% 的市场份额和超过 1.48 亿的全球流媒体用户,无疑是一股不可忽视的力量。

更有趣的是,Netflix 有望实现盈利。 下图由 Statista 提供,显示了 Netflix 从 2002 年到 2018 年的年收入,有一点很清楚:Netflix 正在持续且呈指数增长。

Netflix 2002 年至 2018 年年收入统计

与大多数其他品牌不同,Netflix 的增长更多地归功于内容和用户体验,而不是营销,而这些内容在很大程度上受到大数据的影响。

尽管做出了违反直觉的决定,但大数据正在帮助 Netflix 蓬勃发展

虽然许多组织尚未有效利用可用数据,但 Netflix 是一个值得注意的例外。

Netflix 很容易成为最违反直觉的公司之一。 Netflix 在 2016 年决定全面封锁 VPN,这就是 Netflix 违反直觉的一个重要例子。

尽管当时有超过 3000 万 Netflix 用户居住在不使用 VPN 或其他位置屏蔽服务(并且 Netflix 现在记录其大部分订阅收益)无法使用 Netflix 服务的国家/地区。

同年,Netflix 不顾用户的抗议和数十万用户的流失,提高了价格并拒绝让步。

然而,Netflix自那以后才发展壮大。

下图显示了 Netflix 自 2016 年做出有争议的禁止 VPN 和提高价格的决定以来的订户增长。

2016 年 prie 上涨后 Netflix 用户增长的统计数据

那么,尽管疏远了其基础的很大一部分,Netflix 如何能够继续快速增长? 通过利用大数据准确找出用户想要什么并将其提供给他们。

Netflix 在内容和用户体验上押下重注,Netflix 的大部分预算都花在了内容上。 2019 年,Netflix 承诺为内容提供 150 亿美元的预算。 相比之下,他们为营销投入了微薄的 29 亿美元。

虽然关注 Netflix 庞大的内容预算很容易,但最好关注用于为这些内容提出想法的过程以及大数据的作用。

Netflix 的大数据基础设施

Netflix 使用数据处理软件和传统商业智能工具(例如 Hadoop 和 Teradata)以及自己的开源解决方案(例如 Lipstick 和 Genie)来收集、存储和处理海量信息。 这些平台会影响其决定向观众创建和推广什么内容。

Netflix 不使用传统的基于数据中心的 Hadoop 数据仓库。 为了允许它存储和处理快速增长的数据集,它使用亚马逊的 S3 来存储其数据,允许它为访问相同数据的不同工作负载启动多个 Hadoop 集群。 在 Hadoop 生态系统中,它使用 Hive 进行临时查询和分析,使用 Pig 进行 ETL(提取、转换、加载)和算法。

然后,它创建了自己的 Genie 项目,以帮助处理规模不断扩大的海量数据。 所有这些都指向一件事:Netflix 非常注重拥有大量数据并能够处理这些数据以确保它准确了解用户的需求。

结果简直是惊人的。 Netflix 能够确保其原创内容的高参与率,因此 90% 的 Netflix 用户都参与了其原创内容。

Netflix 的内容大数据方法非常成功,以至于与电视行业相比,Netflix 更新了 93% 的原创剧集,在第一季之后,只有 35% 的节目会更新。

纸牌屋:Netflix 大数据案例研究

Netflix 使用大数据来构思成功内容的最常被引用的例子之一是纸牌屋电视剧。 有充分的理由。

一些快速的事实:

  • 当 Netflix 想在 2013 年推出纸牌屋节目时,与电视行业的标准做法不同,Netflix 没有推出试点。 相反,它甚至在第一集播出之前就委托了该节目的两季(估计花费超过 1 亿美元)。 对于一场不能保证成功的节目来说,这是一场非常大的赌博,或者是这样认为的。
  • 《纸牌屋》节目一炮而红,六年后,尽管围绕其明星凯文·史派西 (Kevin Spacey) 出现了动荡,但该节目仍然在 IMDB 上的 420,000 多条评论中获得 8.8 分(满分 10 分),使其跻身大片之列,如阿凡达和黑道家族。
  • 根据 Netflix 的说法,《纸牌屋》如此成功,以至于它是美国和其他 40 个国家/地区流媒体最多的内容。

虽然Netflix对纸牌屋两季的承诺对外人来说是一场赌博,但业内人士已经知道该节目会成功

事实上,Netflix 对纸牌屋的成功充满信心,以至于一位高管在接受 GIGAOM 采访时告诉 GIGAOM,他们不需要花费数百万美元来让人们收看该节目。 他们只知道人们会看。

由于 Netflix 与其订阅者的直接关系,以及关于观众如何与其内容互动的大量数据,该公司可以轻松确定人们想要什么样的内容。

以纸牌屋为例,通过分析其数据,Netflix 意识到当时其 3300 万订阅者中有很大一部分在其平台上从头到尾播放了导演大卫芬奇的作品《社交网络》,以及凯文史派西在观众中总是很成功。

更重要的是,Netflix的数据显示,其平台上的英国版纸牌屋大受欢迎。 而那些看过英国版纸牌屋的人也看过凯文史派西饰演或大卫芬奇导演的其他电影。

根据这些数据,Netflix 得出的结论是,一部在英国已经成功、由备受喜爱的演员凯文·史派西和导演大卫·芬奇主演的美国观众将大受欢迎。

Netflix 是对的

在推出纸牌屋后的三个月内,Netflix 在美国增加了 200 万订户,在国际上增加了 100 万订户。

这意味着该公司的利润估计增加了 7,200 万美元,在短短几个月内几乎收回了其在纸牌屋节目中的初始投资。

《纸牌屋》第一季的续订率高达 93%,因此它的成功并非孤立事件。 其他系列,如 Orange Is The New Black、Arrested Development 和 The Crown 使用依赖大数据的类似过程引入了好评。

Netflix 如何使用数据来提升用户体验

在收集数据方面,Netflix 拥有超过 1.48 亿订户的庞大用户群为其提供了巨大优势。 然后重点关注以下指标:

  • 观看日期内容
  • 观看内容的设备
  • 观看内容的性质如何因设备而异
  • 在其平台上搜索
  • 重新观看的部分内容
  • 内容是否暂停
  • 用户位置数据
  • 在一天和一周中观看内容的时间以及它如何影响观看的内容类型
  • 来自第三方(如 Nielsen)的元数据
  • 来自 Facebook 和 Twitter 的社交媒体数据

收集到数据后,Netflix 会以多种方式使用这些数据。 最重要的用途之一是制定和验证原始编程思想,如上述纸牌屋示例中所述。

可以说更重要的是 Netflix 掌握有效使用数据的方式,让人们参与到其内容中。

Netflix 非常擅长有针对性的内容推广,估计其平台上 80% 的流媒体内容都受到其推荐系统的影响。

这个推荐系统的设计方式是:

  • Netflix 专注于通过个性化内容排名器为每个用户提供用户想要的东西,该排名器根据收集到的有关用户的个人信息来组织每个 Netflix 用户的收藏。 像 Netflix 一样,您可以使用大数据来确保交付给每个用户的内容受到用户个人活动和与您的品牌互动的影响,从而确保每个用户的内容体验都是独一无二的。
  • Netflix 不仅根据内容的流行程度,还根据有关用户的可用个人信息,对热门内容和热门内容进行排名。 内容根据用户的 Netflix 活动进行推广。 这里的关键教训是,虽然人们对流行的东西感兴趣,但他们仍然希望它受到他们兴趣的影响。 在向用户宣传“热门内容”时,重要的是要确保它与他们的个人兴趣相关。
  • 最近浏览的内容是根据用户是否会继续观看或重新观看,或者用户是否因为没有发现有趣的内容而停止观看的分析来排序的。 这是确保 Netflix 不会让用户感到厌烦的关键; 自从您投资了相同的内容后,您可能很想继续宣传相同的内容。 如果用户活动表明缺乏兴趣,最好将内容降级并提供更有趣的内容。
  • 内容亲和度算法会推荐与用户刚刚观看的内容相似的内容。 需要注意的是,人们更有可能想要消费与他们刚刚消费的内容类似的内容。

综上所述

在不厌倦技术性的情况下,Netflix 显然是大数据力量的一个很好的例子。 虽然您可能没有资源来创建自己的项目以提高大数据效率,就像 Netflix 通过创建其 Genie 项目所做的那样,但大数据行业正在迅速发展,并且存在许多开源工具来帮助您收集和处理基本数据准确了解您的用户想要什么。

以 Netflix 为例,可以有效地利用大数据来增强您的内容和用户体验,并确保您的业务增长。

Gabrielle Sadeh 是一名数字营销顾问。 她可以在 Twitter @GabrielleSadeh找到。