Erkunden der IMDb Top 250 mit Tableau
Veröffentlicht: 2015-08-31Erkunden der IMDb Top 250 mit Tableau
In diesem Blog werden wir ein Dashboard und eine Story erstellen, um die 250 besten Filme der IMDb (Internet Movie Database) zu erkunden. Wir werden mithilfe globaler Filter und Dashboard-Aktionen ein interaktives Dashboard erstellen, damit Benutzer Daten untersuchen und ihre eigenen Fragen beantworten können. Mit Hilfe von Story werden wir versuchen, einige der häufigsten Fragen zu beantworten, die jeder denken kann. Die andere Erkenntnis aus diesem Blog ist die Verwendung/Einbettung von Webseitenobjekten in Dashboards, um Hyperlinks zu zusätzlichen webbasierten Informationen außerhalb der Datenquelle zu erstellen, abhängig von den Daten und der Auswahl des Benutzers.
Daten
Für die Zwecke dieses Blogs beziehen wir die Daten von der offiziellen IMDb-Website. Die Daten gibt es hier und hier. Möglicherweise muss einige Zeit aufgewendet werden, um die Daten und die erforderlichen Metriken für die Analyse zu sammeln. Beispielsweise wird das Ergebnis der Datenbeschaffung aus dem ersten Link oben eine IMDb-Bewertung für Filme haben, aber keine Informationen zu Benutzerstimmen.
Während die Beschaffung von Daten aus dem zweiten Link die meisten Informationen enthält, einschließlich der Anzahl der Stimmen und der Benutzerbewertung für jeden Film sowie des Veröffentlichungsdatums.
Stellen Sie sicher, dass Sie die URL für jeden Film sammeln, die für die spätere Übung zum Einbetten von Webseitenobjekten in Dashboard erforderlich ist. Man kann die URL der Filme wie unten gezeigt abrufen. Die Methode der Datenerhebung bleibt den Lesern dieses Blogs überlassen.
Man kann auf alternative Schnittstellen verweisen, wo viele Informationen verfügbar sind. Bitte lesen Sie die Copyright-Informationen für die erlaubte Verwendung.
Zum Nutzen aller werden wir die Struktur der von mir verwendeten Daten sowie die darin enthaltenen Dimensionen und Maße schnell verstehen.
Die Daten wurden von imdb.com bezogen und entsprechend für die Nutzung durch Tableau formatiert. Wir haben Daten für die 250 besten Filme zwischen den Jahren 1921 bis 2015 mit Informationen wie Benutzerstimmen und Bewertungen für jeden Film. Die folgende Tabelle gibt Ihnen einen schnellen Überblick über wichtige Dimensionen und Kennzahlen, die im Datensatz vorhanden sind.
Maße | Mittel |
---|---|
Filmtitel | Rang |
Film-URL | Bewertungen |
Erscheinungsjahr | Stimmen |
Anstatt Fragen im Voraus zu stellen, werden wir dieses Mal damit beginnen, ein interaktives Dashboard zu erstellen, um unsere Fragen später zu beantworten.
Visualisierungsgebäude
Schritt 1 – Verbinden Sie sich mit den Daten.
Öffnen Sie das Datenarbeitsblatt aus der Excel- oder Textdatei, die die Daten enthält. Beachten Sie, dass wir alle Dimensionen und Kennzahlen, die wir oben besprochen haben, in der unten geöffneten Datei IMDb250_RatingsAndVotes haben.
Schritt 2 – Gehen Sie zu Blatt 1 und analysieren/überprüfen Sie die geladenen Daten
Schritt 3 – Erstellen Sie ein Blatt mit jeder als Filter konfigurierten Dimension und Kennzahl
Die Idee in diesem Blog ist es, ein selbsterforschbares Dashboard zu erstellen, für das wir die Kontrolle in die Hände des Benutzers geben müssen, um mit möglichen Werten von Dimensionen und Kennzahlen herumzuspielen.
Für jede Dimension und Kennzahl mit Ausnahme der Film-URL erstellen wir einen individuellen globalen Filter und zeigen sie als Schnellfilter mit entsprechendem Stil an.
Um einen globalen Filter zu erstellen, klicken Sie mit der rechten Maustaste auf den ausgewählten Filter und dann auf Arbeitsblätter anwenden , um Alle, die diese Datenquelle verwenden , wie unten gezeigt auszuwählen. Das neben der Dimension oder Kennzahl im Filtercontainer angezeigte Datenbank- oder Zylindersymbol zeigt an, dass es sich um einen globalen Filter handelt.
Wir haben also alle Dimensionen und Kennzahlen als globale Filter konfiguriert, wie unten in Blatt 1 gezeigt. Beachten Sie, dass der Filmtitel als Wildcard-Übereinstimmungsfilter und das Erscheinungsjahr als mehrere Werte (benutzerdefinierte Liste) konfiguriert sind. Man kann Sheet1 in Filters umbenennen.
Schritt 4 – Erstellen Sie eine einfache tabellarische Ansicht der Daten
Schritt 5 – Erstellen Sie ein Dashboard mit Filtern und Tabellenblättern
Wir werden ein einfaches Dashboard mit Filtern und Tabellenblättern erstellen und Dashboard-Aktionen, Webseiten-Einbettung und ein wenig Formatierung verwenden, um es interaktiv zu machen.
Schritt 6 – Fügen Sie eine Webseite zum Dashboard hinzu
Doppelklicken Sie im linken Bereich des Dashboards auf Webseite, um das Dialogfeld URL bearbeiten zu öffnen. Man kann es leer lassen und auf OK klicken.
Es wird ein leeres Webseitenobjekt zwischen Tabelle und Filter eingebettet, wie unten gezeigt.
Schritt 7 – URL-Aktion für Dashboard erstellen
Wir werden dem Dashboard Interaktivität hinzufügen, indem wir eine Aktion erstellen, bei der jedes Mal, wenn wir auf einen Film in der Tabelle klicken, die entsprechende URL (Filmlink auf IMDb für Details) im Objektbereich der eingebetteten Webseite im Dashboard geöffnet wird.
Im Folgenden finden Sie die Schritte zum Hinzufügen dieser Aktion im Dashboard. Vergessen Sie vorher nicht, die Film-URL als Tooltip oder als separate Spalte im Tabellenblatt hinzuzufügen.
Geben Sie der Aktion „URL hinzufügen“ einen geeigneten Namen , und wählen Sie anschließend das Quellblatt als Tabelle aus, in der bei der Auswahl eines Films eine URL geöffnet wird, die im Attribut „Film-URL“ erfasst ist.
Die einmal erstellte Dashboard-Aktion sollte wie unten gezeigt aussehen.
Schritt 8 – Sehen Sie sich die Dashboard-Aktion live an
Klicken Sie auf einen beliebigen Film in der Tabelle und es sollte der Link auf IMDb für diesen Film geöffnet werden, der Details über den Film, Fotos, Trailer, Beschreibung usw. enthält.
Man kann argumentieren, dass das Layout des Dashboards hier nicht für eine bessere Anzeige optimiert ist, aber die Idee ist, hier die Leistungsfähigkeit von Dashboards und eingebetteten Webobjekten zu demonstrieren. Als Vorschlag kann man die Filter oben als Reihe anordnen, um mehr Platz für Webseitenobjekte und Tabellen zu schaffen.
Dies ist eine leicht optimierte Version des Dashboards in Bezug auf das Layout.
Schritt 9 – Erstellen Sie eine Story mit verschiedenen Dashboards
Mit den obigen Schritten habe ich verschiedene Dashboards erstellt, mit denen eine Story erstellt werden kann. Eine Story ist nichts anderes als eine Sammlung von Dashboards. Es ist wie ein Buch mit Seiten, in denen jede Seite eine neue Geschichte enthält. Man kann jeder Seite in der Story einen Titel geben und muss das Dashboard oder die Blätter einfach per Drag & Drop auf die Seite ziehen. Unten ist eine einfache Geschichte mit drei Kacheln/Seiten, die jeweils für eine andere Ansicht der Daten und Analysen erstellt wurden.
Lassen Sie uns jetzt eine Analyse durchführen.
Gibt es einen Film, der eine Bewertung größer oder gleich 9 hat, aber weniger als 700.000 Stimmen hat?
Mit unserem durchsuchbaren Dashboard können Sie die Filter entsprechend anpassen, um die Ergebnisse anzuzeigen. Es gibt nur einen Film mit solchen Eigenschaften, God Father Part – II von 1974, bei dem die Bewertung 9 beträgt, aber die Stimmen nahe bei 700.000 liegen.
Wie sieht die Bewertungscharakteristik von Top 50 Filmen aus?
Filtern Sie die Ränge, um die 50 besten Filme auf einer zweiten Story-Seite mit dem Namen Bewertungen und Filme abzurufen.
Es scheint, als ob die durchschnittliche Bewertung für die Top-50-Filme zwischen 8,5 und 8,6 liegt, mit 9 Filmen in einem 8,5-Eimer. Übrigens ist Gladiator mein Lieblingsfilm.
Wie stimmen die charakteristischen Filme mit Titeln, die „The“ enthalten?
Filtern Sie den Filmtitel mit dem Wert „*The*“ im dritten Dashboard Votes & Movies. Es scheint, als gäbe es kein klares Muster im Filmtitel mit „The“ und Stimmen.
Bleiben Sie dran, um mehr durch Visualisierung mit Tableau zu lernen.
Über Tableau
Tableau (NYSE: DATA) mit Hauptsitz in Seattle, Washington, hat es sich zur Aufgabe gemacht, Menschen dabei zu helfen, Daten zu sehen und zu verstehen. Sie bietet ein auf Business Intelligence ausgerichtetes Produktportfolio für die Datenvisualisierung.
Weitere Einzelheiten zu Tableau und seinem Produktangebot und seinen Funktionen finden Sie auf der offiziellen Tableau-Website.