Explorând Top 250 IMDb cu Tableau
Publicat: 2015-08-31Explorând Top 250 IMDb cu Tableau
În acest blog vom construi un tablou de bord și o poveste pentru a explora Top 250 de filme IMDb (Internet Movie Database). Vom construi un tablou de bord interactiv cu ajutorul filtrelor globale și acțiunilor tabloului de bord, astfel încât utilizatorii să poată explora datele și să răspundă la propriile întrebări. Cu ajutorul Story vom încerca să răspundem la câteva dintre întrebările comune care pot fi gândite de oricine. Cealaltă concluzie de la acest blog va fi utilizarea/încorporarea obiectelor paginii web în Dashboard pentru a face hyperlink către informații suplimentare bazate pe web în afara sursei de date, în funcție de date și de selecția utilizatorului.
Date
În scopul acestui blog vom furniza datele de pe site-ul oficial IMDb. Datele sunt disponibile aici și aici. S-ar putea să fie nevoie să petreceți ceva timp pentru a colecta datele și metrica necesară pentru analiză. De exemplu, rezultatul obținerii de date de la primul link de mai sus va avea rating IMDb pentru filme, dar nu va avea informații despre voturile utilizatorilor.
În timp ce datele de aprovizionare de la al doilea link vor avea majoritatea informațiilor, inclusiv numărul de voturi și evaluarea utilizatorilor pentru fiecare film, împreună cu data lansării.
Asigurați-vă că colectați URL-ul pentru fiecare film, care va fi necesar pentru exercițiul de încorporare a obiectelor paginii web în Dashboard într-o etapă ulterioară. Se poate prelua adresa URL a filmelor, așa cum se arată mai jos. Metoda de colectare a datelor este lăsată la latitudinea cititorilor acestui blog.
Se poate face referire la interfețe alternative unde sunt disponibile o mulțime de informații. Vă rugăm să citiți informațiile privind drepturile de autor pentru utilizarea permisă.
Pentru beneficiul tuturor, vom înțelege rapid structura datelor pe care le-am folosit și dimensiunile și măsurile din acestea.
Datele au fost preluate de la imdb.com și au fost formatate corespunzător pentru consumul Tableau. Avem date pentru primele 250 de filme între anii 1921 și 2015, cu informații precum voturile utilizatorilor și evaluarea fiecărui film. Tabelul de mai jos vă oferă o imagine de ansamblu rapidă a dimensiunilor și măsurilor importante prezente în setul de date.
Dimensiuni | Măsuri |
---|---|
Titlul filmului | Rang |
Adresa URL a filmului | Evaluări |
Anul lansării | Voturi |
În loc să punem întrebări în avans, de data aceasta vom începe să facem un tablou de bord interactiv pentru a răspunde la întrebările noastre mai târziu.
Clădirea de vizualizare
Pasul 1 - Conectați-vă la date.
Deschideți foaia de lucru cu date din fișierul Excel sau text care conține datele. Rețineți că avem toate dimensiunile și măsurile despre care am discutat mai sus în fișierul IMDb250_RatingsAndVotes deschis mai jos.
Pasul 2 – Accesați Fișa 1 și analizați/revizuiți datele încărcate
Pasul 3 – Creați o foaie cu fiecare dimensiune și măsură configurată ca filtru
Ideea din acest blog este de a construi un tablou de bord auto-explorabil pentru care trebuie să dăm control în mâinile utilizatorului pentru a se juca cu posibilele valori ale dimensiunilor și măsurilor.
Pentru fiecare dimensiune și măsură, cu excepția URL-ului filmului, vom crea un filtru global individual și le vom afișa ca filtru rapid cu stilul adecvat.
Pentru a crea un filtru global, faceți clic dreapta pe filtrul ales și apoi faceți clic pe Aplicare foi de lucru pentru a selecta Toate utilizând această sursă de date , așa cum se arată mai jos. Pictograma baza de date sau cilindru afișată pe lângă dimensiunea sau măsura în raftul de filtre indică faptul că este un filtru global.
Deci avem toate dimensiunile și măsurile configurate ca filtru global, așa cum se arată mai jos în Foaia 1. Rețineți că avem Titlul filmului configurat ca filtru de potrivire cu wild card și Anul lansării ca valori multiple (listă personalizată). Se poate redenumi Sheet1 în Filters.
Pasul 4 – Creați o vizualizare tabelară simplă a datelor
Pasul 5- Creați un tablou de bord cu filtre și foi de tabel
Vom crea un tablou de bord simplu cu filtre și foi de tabel și vom folosi acțiuni de tablou de bord, încorporarea paginilor web și puțină formatare pentru a-l face interactiv.
Pasul 6 – Adăugați o pagină web la tabloul de bord
Faceți dublu clic pe Pagina Web în secțiunea Dashboard din panoul din stânga, care va apărea caseta de dialog Editare URL. Se poate lăsa necompletat și face clic pe OK.
Acesta va încorpora un obiect de pagină web gol între Tabel și Filtre, așa cum se arată mai jos.
Pasul 7 – Creați o acțiune URL pentru tabloul de bord
Vom adăuga interactivitate la tabloul de bord prin crearea unei acțiuni prin care, ori de câte ori facem clic pe un film din tabel, acesta va deschide adresa URL corespunzătoare (linkul filmului pe IMDb pentru detalii) în zona obiectului paginii web încorporate de pe tabloul de bord.
Mai jos sunt pașii pentru adăugarea acelei acțiuni în tabloul de bord. Înainte de aceasta, nu uitați să adăugați adresa URL a filmului ca indicație sau o coloană separată în foaia Tabel.
Dați un nume adecvat acțiunii Adăugați URL, urmat de alegerea foii sursă ca tabel în care, atunci când selectați un film, se va deschide o adresă URL , așa cum este capturată în atributul URL film.
Acțiunea tabloului de bord odată creată ar trebui să arate așa cum se arată mai jos.
Pasul 8 – Vedeți acțiunea tabloului de bord în direct
Faceți clic pe orice film din tabel și ar trebui să deschidă linkul pe IMDb pentru acel film, care va avea detalii despre film, fotografii, trailer, descriere etc.
Se poate argumenta că aspectul tabloului de bord nu este optimizat aici pentru o vizualizare mai bună, dar ideea este de a demonstra capacitatea tabloului de bord și a obiectelor web încorporate aici. Ca sugestie, puteți organiza filtrele de sus ca un rând pentru a face mai mult spațiu pentru obiectul paginii web și tabel.
Aceasta este o versiune ușor optimizată a tabloului de bord în ceea ce privește aspectul.
Pasul 9 – Creați o poveste cu diferite tablouri de bord
Folosind pașii de mai sus, am creat diverse tablouri de bord cu ajutorul cărora poate fi creată o poveste. O poveste nu este altceva decât o colecție de tablouri de bord. Este ca o carte cu pagini în care fiecare pagină are o poveste nouă. Se poate da titlu fiecărei pagini din poveste și pur și simplu trebuie să trageți și să plasați tabloul de bord sau foile pe pagină. Mai jos este o poveste simplă cu trei piese/pagini, fiecare construită pentru o vizualizare diferită a datelor și a analizei.
Să facem niște analize acum.
Există vreun film care are o evaluare mai mare sau egală cu 9, dar cu voturi mai mici de 700K?
Folosind tabloul de bord explorabil, puteți ajusta filtrele în consecință pentru a vedea rezultatele. Există un singur film cu astfel de caracteristici God Father Part – II din 1974, unde ratingul este 9, dar voturile sunt aproape de 700K.
Cum arată evaluarea caracteristică a celor mai bune 50 de filme?
Filtrați clasamentele pentru a regăsi primele 50 de filme pe o a doua pagină de poveste numită Evaluări și filme.
Se pare că ratingul mediu pentru primele 50 de filme este de aproximativ 8,5 și 8,6 cu 9 filme în 8,5 găleți. Apropo, Gladiator este filmul meu preferat.
Cum funcţionează voturile caracteristice filmelor cu titlul care conţine „The”?
Filtrați titlul filmului cu valoarea „*The*” în al treilea tablou de bord Voturi și filme. Se pare că nu există un model clar în titlul filmului care să aibă „The” în el și voturi.
Rămâneți la curent pentru mai multe învățare prin vizualizare cu Tableau.
Despre Tableau
Tableau (NYSE: DATA), cu sediul în Seattle, Washington, are misiunea de a ajuta oamenii să vadă și să înțeleagă datele. Oferă un portofoliu de produse pentru vizualizarea datelor axat pe business intelligence.
Puteți vizita site-ul web oficial Tableau pentru a găsi mai multe detalii despre Tableau și oferta de produse și caracteristicile sale.