Esplorando la Top 250 di IMDb con Tableau
Pubblicato: 2015-08-31Esplorando la Top 250 di IMDb con Tableau
In questo blog creeremo una dashboard e una storia per esplorare i migliori 250 film di IMDb (Internet Movie Database). Costruiremo una dashboard interattiva con l'aiuto di filtri globali e azioni della dashboard in modo che gli utenti possano esplorare i dati e rispondere alle proprie domande. Con l'aiuto di Story cercheremo di rispondere ad alcune delle domande comuni che possono essere poste da chiunque. L'altro asporto di questo blog sarà quello di utilizzare/incorporare oggetti Pagina Web nel dashboard per creare collegamenti ipertestuali a informazioni aggiuntive basate sul Web al di fuori dell'origine dati, a seconda dei dati e della selezione dell'utente.
Dati
Ai fini di questo blog, forniremo i dati dal sito Web ufficiale di IMDb. I dati sono disponibili qui e qui. Potrebbe essere necessario dedicare del tempo per raccogliere i dati e la metrica richiesta per l'analisi. Ad esempio, il risultato dell'acquisizione dei dati dal primo collegamento sopra avrà una valutazione IMDb per i film ma non avrà informazioni sui voti degli utenti.
Considerando che l'approvvigionamento dei dati dal secondo collegamento avrà la maggior parte delle informazioni, incluso il numero di voti e la valutazione degli utenti per ciascun film insieme alla data di uscita.
Assicurati di raccogliere l'URL per ciascuno dei film che sarà richiesto per l'esercizio di incorporamento di oggetti Pagina Web in Dashboard in una fase successiva. Si può recuperare l'URL dei film come mostrato di seguito. La modalità di raccolta dei dati è lasciata ai lettori di questo blog.
Si può fare riferimento a interfacce alternative dove sono disponibili molte informazioni. Si prega di leggere le informazioni sul copyright per l'utilizzo consentito.
A beneficio di tutti capiremo rapidamente la struttura dei dati che ho utilizzato e le dimensioni e le misure ivi contenute.
I dati sono stati ricavati da imdb.com e formattati in modo appropriato per il consumo di Tableau. Disponiamo di dati per i 250 migliori film tra il 1921 e il 2015 con informazioni come i voti degli utenti e la valutazione per ciascuno dei film. La tabella seguente offre una rapida panoramica delle dimensioni e delle misure importanti presenti nel set di dati.
Dimensioni | Le misure |
---|---|
Titolo del film | Classifica |
URL del film | Giudizi |
Anno di pubblicazione | Voti |
Invece di porre domande in anticipo, questa volta inizieremo a creare una dashboard interattiva per rispondere alle nostre domande in un secondo momento.
Costruzione di visualizzazione
Passaggio 1: connettersi ai dati.
Apri il foglio di lavoro Dati da Excel o da un file di testo che contiene i dati. Nota che abbiamo tutte le dimensioni e le misure di cui abbiamo discusso sopra nel file IMDb250_RatingsAndVotes aperto di seguito.
Passaggio 2: vai al foglio 1 e analizza/rivedi i dati caricati
Passaggio 3: creare un foglio con ciascuna dimensione e misura configurata come filtro
L'idea in questo blog è quella di costruire una dashboard auto-esplorabile per la quale dobbiamo dare il controllo nelle mani dell'utente per giocare con i possibili valori di dimensioni e misure.
Per ogni dimensione e misura, ad eccezione dell'URL del film, creeremo un filtro globale individuale e lo mostreremo come filtro rapido con uno stile appropriato.
Per creare un filtro globale, fare clic con il pulsante destro del mouse sul filtro scelto e quindi fare clic su Applica fogli di lavoro per selezionare Tutto utilizzando questa origine dati come mostrato di seguito. L'icona del database o del cilindro visualizzata accanto alla dimensione o alla misura nello spazio dei filtri indica che si tratta di un filtro globale.
Quindi abbiamo tutte le dimensioni e le misure configurate come filtro globale come mostrato di seguito nel Foglio 1. Si noti che il titolo del film è configurato come filtro di corrispondenza con caratteri jolly e l'anno di rilascio come valori multipli (elenco personalizzato). Si può rinominare Sheet1 in Filtri.
Passaggio 4: creare una semplice visualizzazione tabellare dei dati
Passaggio 5: crea un dashboard con filtri e fogli di tabella
Creeremo una semplice dashboard con Filtri e fogli di tabella e utilizzeremo le azioni della dashboard, l'incorporamento di pagine Web e un po' di formattazione per renderlo interattivo.
Passaggio 6: aggiungere una pagina Web al dashboard
Fare doppio clic su Pagina Web nella sezione Dashboard del riquadro sinistro che apparirà nella finestra di dialogo Modifica URL. Si può lasciare vuoto e fare clic su OK.
Incorporerà un oggetto pagina Web vuoto tra Tabella e Filtri come mostrato di seguito.
Passaggio 7: crea un'azione URL per il dashboard
Aggiungeremo l'interattività alla dashboard creando un'azione in base alla quale ogni volta che facciamo clic su un film nella tabella si aprirà l'URL corrispondente (collegamento del film su IMDb per i dettagli) nell'area degli oggetti della pagina Web incorporata nella dashboard.
Di seguito sono riportati i passaggi per aggiungere tale azione nella dashboard. Prima di questo, non dimenticare di aggiungere l'URL del film come suggerimento o una colonna separata nel foglio Tabella.
Assegna un nome appropriato all'azione Aggiungi URL seguita dalla scelta del foglio di origine come Tabella in cui quando si seleziona un film si aprirà un URL come acquisito nell'attributo URL del film.
Dashboard Action una volta creata dovrebbe apparire come mostrato di seguito.
Passaggio 8: vedere l'azione della dashboard in tempo reale
Fai clic su qualsiasi film nella tabella e dovrebbe aprire il collegamento su IMDb per quel film che conterrà dettagli sul film, foto, trailer, descrizione ecc.
Si può obiettare che il layout della dashboard non è ottimizzato qui per una migliore visualizzazione, ma l'idea è quella di dimostrare la capacità della dashboard e degli oggetti Web incorporati qui. Come suggerimento, puoi organizzare i filtri in alto come una riga per fare più spazio per l'oggetto e la tabella della pagina web.
Questa è una versione leggermente ottimizzata della dashboard in termini di layout.
Passaggio 9: crea una storia con vari dashboard
Utilizzando i passaggi precedenti ho creato vari dashboard utilizzando i quali è possibile creare una storia. Una storia non è altro che una raccolta di dashboard. È come un libro con pagine in cui ogni pagina ha una nuova storia. Si può dare un titolo a ciascuna pagina della storia e basta trascinare e rilasciare dashboard o fogli sulla pagina. Di seguito è riportata una semplice storia con tre riquadri/pagine ciascuno creato per una visualizzazione diversa dei dati e dell'analisi.
Facciamo ora un po' di analisi.
C'è qualche film che ha una valutazione maggiore o uguale a 9 ma vota meno di 700.000?
Utilizzando la nostra dashboard esplorabile è possibile regolare i filtri di conseguenza per vedere i risultati. C'è solo un film con tali caratteristiche God Father Part – II del 1974 in cui la valutazione è 9 ma i voti sono vicini a 700K.
Come appare la caratteristica di valutazione dei primi 50 film?
Filtra le classifiche per recuperare i primi 50 film in una seconda pagina della storia denominata Valutazioni e Film.
Sembra che la valutazione media per i primi 50 film sia di circa 8,5 e 8,6 con 9 film in 8,5 bucket. A proposito, Il Gladiatore è il mio film preferito.
Come funzionano i voti caratteristici dei film con titolo contenente “The”?
Filtra il titolo del film con il valore "*The*" nella terza dashboard Voti e film. Sembra che non ci sia uno schema chiaro nel titolo del film con "The" e voti.
Resta sintonizzato per ulteriori informazioni tramite la visualizzazione con Tableau.
A proposito di Tableau
Tableau (NYSE: DATA) con sede a Seattle, Washington, ha la missione di aiutare le persone a vedere e comprendere i dati. Offre un portafoglio di prodotti per la visualizzazione dei dati incentrato sulla business intelligence.
È possibile visitare il sito Web ufficiale di Tableau per trovare maggiori dettagli su Tableau e sulla sua offerta di prodotti e funzionalità.