使用 Tableau 探索 IMDb 前 250 強
已發表: 2015-08-31使用 Tableau 探索 IMDb 前 250 強
在這個博客中,我們將構建一個儀表板和故事來探索 IMDb(互聯網電影數據庫)前 250 部電影。 我們將藉助全局過濾器和儀表板操作構建交互式儀表板,以便用戶可以探索數據並回答自己的問題。 在 Story 的幫助下,我們將嘗試回答一些任何人都能想到的常見問題。 此博客的另一個要點是在儀表板中使用/嵌入網頁對象,以超鏈接到數據源之外的其他基於 Web 的信息,具體取決於數據和用戶的選擇。
數據
出於本博客的目的,我們將從 IMDb 官方網站獲取數據。 數據可在此處和此處獲得。 可能需要花費一些時間來收集數據和分析所需的指標。 例如,從上面第一個鏈接中獲取數據的結果將具有電影的 IMDb 評級,但沒有用戶投票信息。
而來自第二個鏈接的採購數據將包含大部分信息,包括每部電影的票數和用戶評分以及發布日期。
確保收集每部電影的 URL,以便在稍後階段將網頁對象嵌入 Dashboard 中。 可以檢索電影的 URL,如下所示。 收集數據的方法留給本博客的讀者。
可以參考可提供大量信息的替代界面。 請閱讀允許使用的版權信息。
為了所有人的利益,我們將快速了解我使用的數據的結構以及其中的維度和度量。
數據來自 imdb.com,並針對 Tableau 的使用進行了適當的格式化。 我們擁有 1921 年至 2015 年間排名前 250 部電影的數據,其中包含每部電影的用戶投票和評分等信息。 下表為您提供了數據集中存在的重要維度和度量的快速概覽。
方面 | 措施 |
---|---|
電影標題 | 秩 |
電影網址 | 收視率 |
發行年份 | 投票 |
這次我們將開始製作交互式儀表板來稍後回答我們的問題,而不是預先提出問題。
可視化建築
第 1 步 - 連接到數據。
從包含數據的 excel 或文本文件中打開數據工作表。 請注意,我們在下面打開的文件 IMDb250_RatingsAndVotes 中有我們上面討論的所有維度和度量。
第 2 步 - 轉到表 1 並分析/查看加載的數據
第 3 步 – 創建一個工作表,將每個維度和度量配置為過濾器
本博客的想法是構建一個可自我探索的儀表板,我們需要將控制權交給用戶,以使用維度和度量的可能值。
對於除電影 URL 之外的每個維度和度量,我們將創建一個單獨的全局過濾器,並將它們顯示為具有適當樣式的快速過濾器。
要創建全局過濾器,請右鍵單擊所選過濾器,然後單擊應用工作表以選擇所有使用此數據源,如下所示。 過濾器架中維度或度量旁邊顯示的數據庫或圓柱體圖標表明它是一個全局過濾器。
因此,我們將所有維度和度量配置為全局過濾器,如下表 1 所示。請注意,我們將電影標題配置為通配符匹配過濾器,並將發行年份配置為多個值(自定義列表)。 可以將 Sheet1 重命名為 Filters。
第 4 步 – 創建數據的簡單表格視圖
第 5 步 - 創建一個帶有過濾器和表格的儀表板
我們將創建一個帶有過濾器和表格工作表的簡單儀表板,並使用儀表板操作、網頁嵌入和一點點格式化來使其具有交互性。
第 6 步 - 將網頁添加到儀表板
雙擊左窗格儀表板部分中的網頁,將彈出編輯 URL 對話框。 可以將其留空,然後單擊“確定”。
它將在表格和過濾器之間嵌入一個空白網頁對象,如下所示。
第 7 步 – 為儀表板創建 URL 操作
我們將通過創建一個動作來向儀表板添加交互性,每當我們單擊表格中的電影時,它將在儀表板的嵌入式網頁對象區域中打開其相應的 URL(IMDb 上的電影鏈接以獲取詳細信息)。
以下是在儀表板中添加該操作的步驟。 在此之前,不要忘記將電影 URL 添加為工具提示或表格表中的單獨列。
為添加 URL 操作指定適當的名稱,然後選擇源表作為表,在其中選擇電影時將打開電影URL屬性中捕獲的 URL。
創建後的儀表板操作應如下所示。
第 8 步 – 實時查看儀表板操作
單擊表格中的任何電影,它應該會在 IMDb 上打開該電影的鏈接,其中包含有關電影、照片、預告片、描述等的詳細信息。
有人可能會爭辯說,這裡沒有優化儀表板的佈局以便更好地查看,但其想法是在此處展示儀表板和嵌入式 Web 對象的功能。 作為建議,可以將頂部的過濾器組織為一行,以便為網頁對象和表格騰出更多空間。
這是在佈局方面略微優化的儀表板版本。
第 9 步 - 使用各種儀表板創建故事
使用上述步驟,我創建了各種儀表板,可以使用這些儀表板創建故事。 故事不過是儀表板的集合。 它就像一本書,每一頁都有一些新的故事。 可以為故事中的每一頁賦予標題,只需將儀表板或工作表拖放到頁面上即可。 下面是一個簡單的故事,其中包含三個磁貼/頁面,每個磁貼/頁面用於不同的數據視圖和分析。
現在讓我們做一些分析。
有沒有評分大於或等於 9 但票數低於 700K 的電影?
使用我們可探索的儀表板,您可以相應地調整過濾器以查看結果。 1974年只有一部電影具有這樣的特點,即1974年的第二部,評分為9,但票數接近700K。
前 50 部電影的評分特徵如何?
過濾排名以檢索名為評級和電影的故事第二頁上的前 50 部電影。
似乎前 50 部電影的平均評分在 8.5 和 8.6 左右,其中 9 部電影在 8.5 桶中。 順便說一句,角斗士是我最喜歡的電影。
標題包含“The”的電影的票數有何特點?
在第三個儀表板投票和電影中過濾值為“*The*”的電影標題。 電影標題中似乎沒有明確的模式,其中包含“The”和投票。
請繼續關注通過 Tableau 的可視化了解更多信息。
關於 Tableau
Tableau (NYSE: DATA) 總部位於華盛頓州西雅圖,其使命是幫助人們查看和理解數據。 它提供了一個專注於商業智能的數據可視化產品組合。
可以訪問 Tableau 官方網站,了解有關 Tableau 及其產品和功能的更多詳細信息。