สำรวจ IMDb Top 250 ด้วย Tableau
เผยแพร่แล้ว: 2015-08-31สำรวจ IMDb Top 250 ด้วย Tableau
ในบล็อกนี้ เราจะสร้างแดชบอร์ดและเรื่องราวเพื่อสำรวจ IMDb (ฐานข้อมูลภาพยนตร์ทางอินเทอร์เน็ต) ภาพยนตร์ 250 อันดับแรก เราจะสร้างแดชบอร์ดแบบโต้ตอบโดยใช้ตัวกรองทั่วโลกและการดำเนินการของแดชบอร์ด เพื่อให้ผู้ใช้สามารถสำรวจข้อมูลและตอบคำถามของตนเองได้ ด้วยความช่วยเหลือของ Story เราจะพยายามตอบคำถามทั่วไปสองสามข้อที่ทุกคนสามารถคิดได้ อีกประเด็นหนึ่งจากบล็อกนี้คือการใช้/ฝังออบเจ็กต์ของหน้าเว็บในแดชบอร์ดเพื่อเชื่อมโยงไปยังข้อมูลบนเว็บเพิ่มเติมภายนอกแหล่งข้อมูล ขึ้นอยู่กับข้อมูลและการเลือกของผู้ใช้
ข้อมูล
สำหรับวัตถุประสงค์ของบล็อกนี้ เราจะรวบรวมข้อมูลจากเว็บไซต์ทางการของ IMDb ข้อมูลมีอยู่ที่นี่และที่นี่ อาจต้องใช้เวลาสักครู่เพื่อรวบรวมข้อมูลและตัวชี้วัดที่จำเป็นสำหรับการวิเคราะห์ เช่น ผลลัพธ์ของการจัดหาข้อมูลจากลิงค์แรกด้านบนจะมีการจัดเรต IMDb สำหรับภาพยนตร์ แต่จะไม่มีข้อมูลการโหวตของผู้ใช้
ในขณะที่การจัดหาข้อมูลจากลิงก์ที่สองจะมีข้อมูลส่วนใหญ่รวมถึงจำนวนโหวตและคะแนนของผู้ใช้สำหรับภาพยนตร์แต่ละเรื่องพร้อมกับวันที่เผยแพร่
ตรวจสอบให้แน่ใจว่าได้รวบรวม URL ของภาพยนตร์แต่ละเรื่องซึ่งจำเป็นสำหรับการฝึกฝังวัตถุของเว็บเพจในแดชบอร์ดในภายหลัง หนึ่งสามารถดึง URL ของภาพยนตร์ดังที่แสดงด้านล่าง วิธีการเก็บรวบรวมข้อมูลจะปล่อยให้ผู้อ่านบล็อกนี้
สามารถอ้างถึงอินเทอร์เฟซอื่นที่มีข้อมูลมากมาย โปรดอ่านข้อมูลลิขสิทธิ์สำหรับการใช้งานที่ได้รับอนุญาต
เพื่อประโยชน์ของทั้งหมด เราจะเข้าใจโครงสร้างของข้อมูลที่ฉันใช้และมิติข้อมูลและการวัดในนั้นอย่างรวดเร็ว
ข้อมูลได้มาจาก imdb.com และจัดรูปแบบอย่างเหมาะสมสำหรับการใช้ Tableau เรามีข้อมูลสำหรับภาพยนตร์ 250 อันดับแรกระหว่างปี 1921 ถึง 2015 พร้อมข้อมูลต่างๆ เช่น การโหวตของผู้ใช้และการจัดประเภทสำหรับภาพยนตร์แต่ละเรื่อง ตารางด้านล่างแสดงภาพรวมโดยย่อของมิติข้อมูลสำคัญและหน่วยวัดที่มีอยู่ในชุดข้อมูล
ขนาด | มาตรการ |
---|---|
ชื่อหนัง | อันดับ |
URL ภาพยนตร์ | คะแนน |
ปีที่วางจำหน่าย | โหวต |
แทนที่จะถามคำถามล่วงหน้า คราวนี้เราจะเริ่มสร้างแดชบอร์ดแบบโต้ตอบเพื่อตอบคำถามของเราในภายหลัง
การสร้างภาพ
ขั้นตอนที่ 1 – เชื่อมต่อกับข้อมูล
เปิดแผ่นงานข้อมูลจาก excel หรือไฟล์ข้อความที่มีข้อมูล โปรดทราบว่าเรามีมิติข้อมูลและการวัดทั้งหมดที่เรากล่าวถึงข้างต้นในไฟล์ IMDb250_RatingsAndVotes ที่เปิดอยู่ด้านล่าง
ขั้นตอนที่ 2 – ไปที่แผ่นที่ 1 และวิเคราะห์/ตรวจสอบข้อมูลที่โหลด
ขั้นตอนที่ 3 – สร้างแผ่นงานที่มีแต่ละมิติและการวัดที่กำหนดค่าเป็นตัวกรอง
แนวคิดในบล็อกนี้คือการสร้างแดชบอร์ดที่สำรวจตัวเองได้ ซึ่งเราจำเป็นต้องให้การควบคุมในมือของผู้ใช้เพื่อเล่นกับค่ามิติและการวัดที่เป็นไปได้
สำหรับทุกขนาดและการวัดยกเว้น URL ของภาพยนตร์ เราจะสร้างตัวกรองสากลแต่ละรายการและแสดงเป็นตัวกรองด่วนพร้อมสไตล์ที่เหมาะสม
ในการสร้างตัวกรองสากล ให้ คลิกขวาที่ตัวกรองที่เลือก จากนั้นคลิกที่ Apply Worksheets เพื่อเลือก All Using This Data Source ดังที่แสดงด้านล่าง ไอคอนฐานข้อมูลหรือรูปทรงกระบอกที่แสดงนอกเหนือจากมิติหรือหน่วยวัดในชั้นตัวกรองแสดงว่าเป็นตัวกรองส่วนกลาง
ดังนั้นเราจึงมีมิติข้อมูลและการวัดทั้งหมดที่กำหนดค่าเป็นตัวกรองส่วนกลางดังที่แสดงด้านล่างในชีต 1 โปรดทราบว่าเราได้กำหนดค่าชื่อภาพยนตร์เป็นตัวกรองการจับคู่แบบไวด์การ์ด และปีที่วางจำหน่ายเป็นค่าหลายค่า (รายการที่กำหนดเอง) สามารถเปลี่ยนชื่อ Sheet1 เป็นตัวกรองได้
ขั้นตอนที่ 4 – สร้างมุมมองตารางอย่างง่ายของข้อมูล
ขั้นตอนที่ 5- สร้างแดชบอร์ดพร้อมตัวกรองและแผ่นงานตาราง
เราจะสร้างแดชบอร์ดอย่างง่ายด้วยตัวกรองและแผ่นตาราง และใช้การดำเนินการของแดชบอร์ด การฝังหน้าเว็บ และการจัดรูปแบบเล็กน้อยเพื่อทำให้เป็นแบบโต้ตอบ
ขั้นตอนที่ 6 – เพิ่มหน้าเว็บไปยังแดชบอร์ด
ดับเบิลคลิกที่เว็บเพจในบานหน้าต่างด้านซ้ายส่วนแดชบอร์ดซึ่งจะมีป๊อปอัปกล่องโต้ตอบแก้ไข URL สามารถเว้นว่างไว้และคลิกตกลง
มันจะฝังวัตถุหน้าเว็บว่างระหว่างตารางและตัวกรองดังที่แสดงด้านล่าง
ขั้นตอนที่ 7 – สร้างการดำเนินการ URL สำหรับแดชบอร์ด
เราจะเพิ่มการโต้ตอบให้กับแดชบอร์ดโดยการสร้างการกระทำโดยทุกครั้งที่เราคลิกที่ภาพยนตร์ในตาราง URL นั้นจะเปิดขึ้น (ลิงก์ภาพยนตร์บน IMDb เพื่อดูรายละเอียด) ในพื้นที่วัตถุของหน้าเว็บที่ฝังบนแดชบอร์ด
ด้านล่างนี้คือขั้นตอนในการเพิ่มการกระทำนั้นในแดชบอร์ด ก่อนหน้านี้ อย่าลืมเพิ่ม Movie URL เป็นคำแนะนำเครื่องมือหรือคอลัมน์แยกต่างหากในตารางชีต
ตั้งชื่อ ที่เหมาะสมให้กับการทำงาน Add URL ตามด้วยการเลือก แผ่นงานต้นฉบับ เป็น Table ซึ่งเมื่อ เลือก ภาพยนตร์จะเปิด URL ตามที่บันทึกไว้ในแอตทริบิวต์ URL ของภาพยนตร์
Dashboard Action เมื่อสร้างแล้วควรมีลักษณะดังที่แสดงด้านล่าง
ขั้นตอนที่ 8 – ดูการดำเนินการของแดชบอร์ดในการถ่ายทอดสด
คลิกที่ภาพยนตร์เรื่องใดก็ได้ในตาราง และควรเปิดลิงก์บน IMDb สำหรับภาพยนตร์เรื่องนั้น ซึ่งจะมีรายละเอียดเกี่ยวกับภาพยนตร์ รูปภาพ ตัวอย่าง คำอธิบาย ฯลฯ
อาจมีคนโต้แย้งว่าเลย์เอาต์ของแดชบอร์ดไม่ได้รับการปรับให้เหมาะสมสำหรับการดูที่ดีขึ้น แต่แนวคิดก็คือการแสดงความสามารถของแดชบอร์ดและออบเจ็กต์เว็บที่ฝังไว้ที่นี่ ตามคำแนะนำ คุณสามารถจัดระเบียบตัวกรองด้านบนเป็นแถวเพื่อเพิ่มพื้นที่สำหรับวัตถุและตารางของหน้าเว็บ
นี่เป็นแดชบอร์ดเวอร์ชันที่ปรับให้เหมาะสมเล็กน้อยในแง่ของเลย์เอาต์
ขั้นตอนที่ 9 – สร้างเรื่องราวด้วยแดชบอร์ดต่างๆ
เมื่อใช้ขั้นตอนข้างต้น ฉันได้สร้างแดชบอร์ดต่างๆ ซึ่งสามารถสร้างเรื่องราวได้ เรื่องราวเป็นเพียงชุดของแดชบอร์ดเท่านั้น ก็เหมือนหนังสือที่มีหน้าแต่ละหน้ามีเรื่องใหม่ หนึ่งสามารถตั้งชื่อให้กับแต่ละหน้าในเรื่องและเพียงแค่ลากและวางแดชบอร์ดหรือแผ่นงานลงบนหน้า ด้านล่างนี้เป็นเรื่องราวง่ายๆ ที่มีสามไทล์/หน้าซึ่งสร้างขึ้นสำหรับมุมมองข้อมูลและการวิเคราะห์ที่แตกต่างกัน
ให้เราทำการวิเคราะห์ตอนนี้
มีหนังเรื่องไหนที่มีเรตติ้งมากกว่าหรือเท่ากับ 9 แต่โหวตน้อยกว่า 700K ไหม?
การใช้แดชบอร์ดที่สำรวจได้ของเราสามารถปรับตัวกรองตามความเหมาะสมเพื่อดูผลลัพธ์ได้ มีภาพยนตร์เรื่องเดียวที่มีลักษณะเช่นนี้ God Father Part – II ปี 1974 ที่มีเรทอยู่ที่ 9 แต่คะแนนโหวตใกล้จะถึง 700K
ลักษณะการจัดอันดับของภาพยนตร์ 50 อันดับแรกมีลักษณะอย่างไร?
กรองอันดับเพื่อดึงภาพยนตร์ 50 อันดับแรกในหน้าที่สองของเรื่องชื่อเรตติ้งและภาพยนตร์
ดูเหมือนว่าเรตติ้งเฉลี่ยของภาพยนตร์ 50 อันดับแรกจะอยู่ที่ประมาณ 8.5 และ 8.6 โดยมีภาพยนตร์ 9 เรื่องในถัง 8.5 อีกอย่างกลาดิเอเตอร์คือหนังเรื่องโปรดของฉัน
ลักษณะการโหวตของภาพยนตร์ที่มีชื่อเรื่องว่า “The” เป็นอย่างไร?
กรองชื่อภาพยนตร์ด้วยค่าเป็น “*The*” ในแดชบอร์ดที่สาม Votes & Movies ดูเหมือนว่าไม่มีรูปแบบที่ชัดเจนในชื่อภาพยนตร์ที่มีคำว่า “The” อยู่ในนั้นและโหวต
คอยติดตามการเรียนรู้เพิ่มเติมผ่านการแสดงภาพด้วย Tableau
เกี่ยวกับ Tableau
Tableau (NYSE: DATA) ซึ่งมีสำนักงานใหญ่ในซีแอตเทิล รัฐวอชิงตัน มีภารกิจในการช่วยให้ผู้คนมองเห็นและเข้าใจข้อมูล มีกลุ่มผลิตภัณฑ์สำหรับการแสดงข้อมูลเป็นภาพซึ่งเน้นที่ระบบธุรกิจอัจฉริยะ
สามารถเยี่ยมชมเว็บไซต์ Tableau อย่างเป็นทางการเพื่อค้นหารายละเอียดเพิ่มเติมเกี่ยวกับ Tableau และการเสนอผลิตภัณฑ์และคุณสมบัติต่างๆ