Odkrywanie IMDb Top 250 z Tableau
Opublikowany: 2015-08-31Odkrywanie IMDb Top 250 z Tableau
W tym blogu zbudujemy pulpit nawigacyjny i historię, aby poznać 250 najlepszych filmów IMDb (Internet Movie Database). Zbudujemy interaktywny dashboard za pomocą globalnych filtrów i akcji dashboardu, aby użytkownicy mogli eksplorować dane i odpowiadać na własne pytania. Z pomocą Story postaramy się odpowiedzieć na kilka typowych pytań, na które każdy może sobie pomyśleć. Innym wnioskiem z tego bloga będzie użycie/osadzenie obiektów stron internetowych w Dashboardzie w celu hiperłącza do dodatkowych informacji internetowych poza źródłem danych, w zależności od danych i wyboru użytkownika.
Dane
Na potrzeby tego bloga będziemy pozyskiwać dane z oficjalnej strony internetowej IMDb. Dane dostępne są tutaj i tutaj. Być może trzeba będzie poświęcić trochę czasu na zebranie danych i wymaganych metryk do analizy. Np. wynik pozyskania danych z pierwszego linku powyżej będzie miał ocenę IMDb dla filmów, ale nie będzie zawierał informacji o głosach użytkowników.
Natomiast pozyskiwanie danych z drugiego łącza będzie zawierało większość informacji, w tym liczbę głosów i ocenę użytkowników dla każdego filmu wraz z datą premiery.
Upewnij się, że zebrałeś adres URL dla każdego filmu, który będzie wymagany do ćwiczenia osadzania obiektów strony internetowej w Dashboard na późniejszym etapie. Można pobrać adres URL filmów, jak pokazano poniżej. Sposób zbierania danych pozostawiamy czytelnikom tego bloga.
Można odwołać się do alternatywnych interfejsów, w których dostępnych jest wiele informacji. Przeczytaj informacje o prawach autorskich, aby uzyskać dozwolone użycie.
Dla dobra wszystkich szybko zrozumiemy strukturę danych, których użyłem oraz wymiary i miary w nich zawarte.
Dane pochodzą z imdb.com i są odpowiednio sformatowane pod kątem konsumpcji Tableau. Mamy dane dla 250 najlepszych filmów w latach 1921-2015 z takimi informacjami, jak głosy użytkowników i oceny dla każdego filmu. Poniższa tabela zawiera szybki przegląd ważnych wymiarów i miar występujących w zbiorze danych.
Wymiary | Środki |
---|---|
Tytuł filmu | Ranga |
URL filmu | Oceny |
Rok wydania | Głosy |
Zamiast zadawać pytania z góry, tym razem zaczniemy tworzyć interaktywny pulpit nawigacyjny, aby później odpowiedzieć na nasze pytania.
Wizualizacja budynku
Krok 1 – Połącz się z danymi.
Otwórz arkusz danych z programu Excel lub pliku tekstowego, który zawiera dane. Zwróć uwagę, że wszystkie wymiary i miary, które omówiliśmy powyżej, znajdują się w pliku IMDb250_RatingsAndVotes, który został otwarty poniżej.
Krok 2 – Przejdź do Arkusza 1 i przeanalizuj/przejrzyj załadowane dane
Krok 3 – Utwórz arkusz z każdym wymiarem i miarą skonfigurowaną jako filtr
Ideą tego bloga jest zbudowanie pulpitu nawigacyjnego do samodzielnej eksploracji, nad którym musimy oddać kontrolę w ręce użytkownika, aby mógł bawić się możliwymi wartościami wymiarów i miar.
Dla każdego wymiaru i miary z wyjątkiem adresu URL filmu utworzymy indywidualny filtr globalny i pokażemy je jako szybki filtr z odpowiednim stylem.
Aby utworzyć globalny filtr, kliknij prawym przyciskiem myszy wybrany filtr , a następnie kliknij Zastosuj arkusze , aby wybrać Wszystkie korzystające z tego źródła danych , jak pokazano poniżej. Ikona bazy danych lub cylindra wyświetlana obok wymiaru lub miary na półce filtrów wskazuje, że jest to filtr globalny.
Mamy więc wszystkie wymiary i miary skonfigurowane jako filtr globalny, jak pokazano poniżej w Arkuszu 1. Zauważ, że mamy tytuł filmu skonfigurowany jako filtr dopasowania symboli wieloznacznych, a rok wydania jako wiele wartości (lista niestandardowa). Można zmienić nazwę Arkusz1 na Filtry.
Krok 4 – Utwórz prosty tabelaryczny widok danych
Krok 5- Utwórz pulpit nawigacyjny z filtrami i arkuszami tabel
Stworzymy prosty pulpit nawigacyjny z filtrami i arkuszami tabel oraz użyjemy działań pulpitu nawigacyjnego, osadzania stron internetowych i odrobiny formatowania, aby był interaktywny.
Krok 6 – Dodaj stronę internetową do pulpitu nawigacyjnego
Kliknij dwukrotnie stronę internetową w lewym panelu sekcji Pulpit nawigacyjny, co spowoduje wyświetlenie okna dialogowego Edytuj adres URL. Można pozostawić to pole puste i kliknąć OK.
Umieści pusty obiekt strony internetowej między tabelą a filtrami, jak pokazano poniżej.
Krok 7 – Utwórz akcję URL dla pulpitu nawigacyjnego
Dodamy interaktywność do pulpitu nawigacyjnego, tworząc akcję, dzięki której za każdym razem, gdy klikniemy film w tabeli, otworzy się odpowiadający mu adres URL (link do filmu na IMDb, aby uzyskać szczegółowe informacje) w osadzonym obszarze obiektu strony internetowej na pulpicie nawigacyjnym.
Poniżej znajdują się kroki, aby dodać tę akcję na pulpicie nawigacyjnym. Wcześniej nie zapomnij dodać adresu URL filmu jako podpowiedzi lub oddzielnej kolumny w arkuszu tabeli.
Nadaj odpowiednią nazwę akcji Dodaj adres URL, a następnie wybierz arkusz źródłowy jako Tabela, w której po wybraniu filmu otworzy się adres URL przechwycony w atrybucie URL filmu.
Po utworzeniu akcji Dashboard powinno wyglądać tak, jak pokazano poniżej.
Krok 8 – Zobacz na żywo akcję na desce rozdzielczej
Kliknij dowolny film w tabeli i powinien otworzyć link na IMDb do tego filmu, który będzie zawierał szczegółowe informacje o filmie, zdjęciach, zwiastunie, opisie itp.
Można argumentować, że układ pulpitu nawigacyjnego nie jest tutaj zoptymalizowany pod kątem lepszego przeglądania, ale chodzi o zademonstrowanie tutaj możliwości pulpitu nawigacyjnego i osadzonych obiektów internetowych. Jako sugestię można uporządkować filtry na górze jako wiersz, aby zrobić więcej miejsca na obiekt strony internetowej i tabelę.
Jest to nieco zoptymalizowana wersja dashboardu pod względem układu.
Krok 9 – Stwórz historię za pomocą różnych pulpitów nawigacyjnych
Korzystając z powyższych kroków stworzyłem różne dashboardy, za pomocą których można stworzyć Story. Historia to nic innego jak zbiór kokpitów. To jest jak książka ze stronami, na której każda strona zawiera nową historię. Można nadać tytuł każdej stronie w wątku i po prostu przeciągnąć i upuścić pulpit nawigacyjny lub arkusze na stronę. Poniżej znajduje się prosta historia z trzema kafelkami/stronami, z których każda została zbudowana dla innego widoku danych i analizy.
Zróbmy teraz trochę analizy.
Czy jest jakiś film, który ma ocenę większą lub równą 9, ale głosuje mniej niż 700K?
Korzystając z naszego eksploracyjnego pulpitu nawigacyjnego, można odpowiednio dostosować filtry, aby zobaczyć wyniki. Jest tylko jeden film o takich cechach God Father Part – II z 1974 roku, w którym ocena to 9, ale głosy zbliżają się do 700 tys.
Jak wygląda ocena charakterystyczna dla 50 najlepszych filmów?
Filtruj rankingi, aby pobrać 50 najlepszych filmów na drugiej stronie historii o nazwie Oceny i filmy.
Wygląda na to, że średnia ocena dla 50 najlepszych filmów wynosi około 8,5 i 8,6 z 9 filmami w przedziale 8,5. Swoją drogą Gladiator to mój ulubiony film.
Jak głosy charakterystyczne dla filmów z tytułem zawierającym „The”?
Filtruj tytuł filmu o wartości „*The*” w trzecim panelu Głosy i filmy. Wygląda na to, że nie ma wyraźnego wzoru w tytule filmu zawierającym „The” i głosy.
Bądź na bieżąco, aby dowiedzieć się więcej dzięki wizualizacji z Tableau.
O Tableau
Tableau (NYSE: DATA) z siedzibą w Seattle w stanie Waszyngton ma misję pomagania ludziom w zobaczeniu i zrozumieniu danych. Oferuje portfolio produktów do wizualizacji danych skoncentrowane na analizie biznesowej.
Można odwiedzić oficjalną stronę Tableau, aby znaleźć więcej informacji na temat Tableau oraz jego oferty produktów i funkcji.