使用 Tableau 探索 IMDb 前 250 强
已发表: 2015-08-31使用 Tableau 探索 IMDb 前 250 强
在这个博客中,我们将构建一个仪表板和故事来探索 IMDb(互联网电影数据库)前 250 部电影。 我们将借助全局过滤器和仪表板操作构建交互式仪表板,以便用户可以探索数据并回答自己的问题。 在 Story 的帮助下,我们将尝试回答一些任何人都能想到的常见问题。 此博客的另一个要点是在仪表板中使用/嵌入网页对象,以超链接到数据源之外的其他基于 Web 的信息,具体取决于数据和用户的选择。
数据
出于本博客的目的,我们将从 IMDb 官方网站获取数据。 数据可在此处和此处获得。 可能需要花费一些时间来收集数据和分析所需的指标。 例如,从上面第一个链接中获取数据的结果将具有电影的 IMDb 评级,但没有用户投票信息。
而来自第二个链接的采购数据将包含大部分信息,包括每部电影的票数和用户评分以及发布日期。
确保收集每部电影的 URL,以便在稍后阶段将网页对象嵌入 Dashboard 中。 可以检索电影的 URL,如下所示。 收集数据的方法留给本博客的读者。
可以参考可提供大量信息的替代界面。 请阅读允许使用的版权信息。
为了所有人的利益,我们将快速了解我使用的数据的结构以及其中的维度和度量。
数据来自 imdb.com,并针对 Tableau 的使用进行了适当的格式化。 我们拥有 1921 年至 2015 年间排名前 250 部电影的数据,其中包含每部电影的用户投票和评分等信息。 下表为您提供了数据集中存在的重要维度和度量的快速概览。
方面 | 措施 |
---|---|
电影标题 | 秩 |
电影网址 | 收视率 |
发行年份 | 投票 |
这次我们将开始制作交互式仪表板来稍后回答我们的问题,而不是预先提出问题。
可视化建筑
第 1 步 - 连接到数据。
从包含数据的 excel 或文本文件中打开数据工作表。 请注意,我们在下面打开的文件 IMDb250_RatingsAndVotes 中有我们上面讨论的所有维度和度量。
第 2 步 - 转到表 1 并分析/查看加载的数据
第 3 步 – 创建一个工作表,将每个维度和度量配置为过滤器
本博客的想法是构建一个可自我探索的仪表板,我们需要将控制权交给用户,以使用维度和度量的可能值。
对于除电影 URL 之外的每个维度和度量,我们将创建一个单独的全局过滤器,并将它们显示为具有适当样式的快速过滤器。
要创建全局过滤器,请右键单击所选过滤器,然后单击应用工作表以选择所有使用此数据源,如下所示。 过滤器架中维度或度量旁边显示的数据库或圆柱体图标表明它是一个全局过滤器。
因此,我们将所有维度和度量配置为全局过滤器,如下表 1 所示。请注意,我们将电影标题配置为通配符匹配过滤器,并将发行年份配置为多个值(自定义列表)。 可以将 Sheet1 重命名为 Filters。
第 4 步 – 创建数据的简单表格视图
第 5 步 - 创建一个带有过滤器和表格的仪表板
我们将创建一个带有过滤器和表格工作表的简单仪表板,并使用仪表板操作、网页嵌入和一点点格式化来使其具有交互性。
第 6 步 - 将网页添加到仪表板
双击左窗格仪表板部分中的网页,将弹出编辑 URL 对话框。 可以将其留空,然后单击“确定”。
它将在表格和过滤器之间嵌入一个空白网页对象,如下所示。
第 7 步 – 为仪表板创建 URL 操作
我们将通过创建一个动作来向仪表板添加交互性,每当我们单击表格中的电影时,它将在仪表板的嵌入式网页对象区域中打开其相应的 URL(IMDb 上的电影链接以获取详细信息)。
以下是在仪表板中添加该操作的步骤。 在此之前,不要忘记将电影 URL 添加为工具提示或表格表中的单独列。
为添加 URL 操作指定适当的名称,然后选择源表作为表,在其中选择电影时将打开电影URL属性中捕获的 URL。
创建后的仪表板操作应如下所示。
第 8 步 – 实时查看仪表板操作
单击表格中的任何电影,它应该会在 IMDb 上打开该电影的链接,其中包含有关电影、照片、预告片、描述等的详细信息。
有人可能会争辩说,这里没有优化仪表板的布局以便更好地查看,但其想法是在此处展示仪表板和嵌入式 Web 对象的功能。 作为建议,可以将顶部的过滤器组织为一行,以便为网页对象和表格腾出更多空间。
这是在布局方面略微优化的仪表板版本。
第 9 步 - 使用各种仪表板创建故事
使用上述步骤,我创建了各种仪表板,可以使用这些仪表板创建故事。 故事不过是仪表板的集合。 它就像一本书,每一页都有一些新的故事。 可以为故事中的每一页赋予标题,只需将仪表板或工作表拖放到页面上即可。 下面是一个简单的故事,其中包含三个磁贴/页面,每个磁贴/页面用于不同的数据视图和分析。
现在让我们做一些分析。
有没有评分大于或等于 9 但票数低于 700K 的电影?
使用我们可探索的仪表板,您可以相应地调整过滤器以查看结果。 1974年只有一部电影具有这样的特点,即1974年的第二部,评分为9,但票数接近700K。
前 50 部电影的评分特征如何?
过滤排名以检索名为评级和电影的故事第二页上的前 50 部电影。
似乎前 50 部电影的平均评分在 8.5 和 8.6 左右,其中 9 部电影在 8.5 桶中。 顺便说一句,角斗士是我最喜欢的电影。
标题包含“The”的电影的票数有何特点?
在第三个仪表板投票和电影中过滤值为“*The*”的电影标题。 电影标题中似乎没有明确的模式,其中包含“The”和投票。
请继续关注通过 Tableau 的可视化了解更多信息。
关于 Tableau
Tableau (NYSE: DATA) 总部位于华盛顿州西雅图,其使命是帮助人们查看和理解数据。 它提供了一个专注于商业智能的数据可视化产品组合。
可以访问 Tableau 官方网站,了解有关 Tableau 及其产品和功能的更多详细信息。