استكشاف IMDb Top 250 مع Tableau
نشرت: 2015-08-31استكشاف IMDb Top 250 مع Tableau
في هذه المدونة ، سننشئ لوحة تحكم وقصة لاستكشاف أفضل 250 فيلمًا في IMDb (قاعدة بيانات الأفلام على الإنترنت). سننشئ لوحة معلومات تفاعلية بمساعدة عوامل التصفية العالمية وإجراءات لوحة المعلومات بحيث يمكن للمستخدمين استكشاف البيانات والإجابة على أسئلتهم الخاصة. بمساعدة Story ، سنحاول الإجابة على بعض الأسئلة الشائعة التي يمكن لأي شخص التفكير فيها. ستكون الطريقة الأخرى من هذه المدونة هي استخدام / تضمين كائنات صفحة الويب في لوحة المعلومات للارتباط التشعبي إلى معلومات إضافية مستندة إلى الويب خارج مصدر البيانات ، اعتمادًا على البيانات وعلى تحديد المستخدم.
بيانات
لغرض هذه المدونة ، سنصدر البيانات من موقع IMDb الرسمي. البيانات متوفرة هنا وهنا. قد يضطر المرء إلى قضاء بعض الوقت من أجل جمع البيانات والمقاييس المطلوبة للتحليل. على سبيل المثال ، ستحصل نتيجة الحصول على البيانات من الرابط الأول أعلاه على تصنيف IMDb للأفلام ولكن لن تحتوي على معلومات تصويت المستخدم.
في حين أن الحصول على البيانات من الرابط الثاني سيحتوي على معظم المعلومات بما في ذلك عدد الأصوات وتقييم المستخدم لكل فيلم إلى جانب تاريخ الإصدار.
تأكد من جمع عنوان URL لكل فيلم سيكون مطلوبًا لممارسة تضمين كائنات صفحة الويب في لوحة المعلومات في مرحلة لاحقة. يمكن للمرء استرداد عنوان URL للأفلام كما هو موضح أدناه. طريقة جمع البيانات متروكة لقراء هذه المدونة.
يمكن للمرء أن يشير إلى واجهات بديلة حيث يتوفر الكثير من المعلومات. يرجى قراءة معلومات حقوق النشر للاستخدام المسموح به.
من أجل مصلحة الجميع ، سوف نفهم بسرعة بنية البيانات التي استخدمتها والأبعاد والقياسات الواردة فيها.
تم الحصول على البيانات من imdb.com وتنسيقها بشكل مناسب لاستهلاك Tableau. لدينا بيانات لأفضل 250 فيلمًا بين الأعوام من 1921 إلى 2015 مع معلومات مثل تصويت المستخدمين وتصنيفهم لكل فيلم. يمنحك الجدول أدناه نظرة عامة سريعة على الأبعاد والمقاييس المهمة الموجودة في مجموعة البيانات.
أبعاد | الإجراءات |
---|---|
عنوان الفيلم | مرتبة |
رابط الفيلم | التقييمات |
سنة الإصدار | الأصوات |
بدلاً من طرح السؤال مقدمًا ، سنبدأ هذه المرة في إنشاء لوحة معلومات تفاعلية للإجابة على أسئلتنا لاحقًا.
بناء التصور
الخطوة 1 - الاتصال بالبيانات.
افتح ورقة عمل البيانات من ملف Excel أو ملف نصي يحتوي على البيانات. لاحظ أن لدينا جميع الأبعاد والمقاييس التي ناقشناها أعلاه في الملف IMDb250_RatingsAndVotes المفتوح أدناه.
الخطوة 2 - انتقل إلى الورقة 1 وقم بتحليل / مراجعة البيانات المحملة
الخطوة 3 - قم بإنشاء ورقة مع كل بُعد والقياس الذي تم تكوينه كعامل تصفية
الفكرة في هذه المدونة هي بناء لوحة معلومات قابلة للاستكشاف الذاتي والتي نحتاج إلى منحها التحكم في أيدي المستخدم للتلاعب بالقيم المحتملة للأبعاد والمقاييس.
لكل بُعد وقياس باستثناء عنوان URL للفيلم ، سننشئ مرشحًا عالميًا فرديًا ونعرضه كمرشح سريع بنمط مناسب.
لإنشاء عامل تصفية عالمي ، انقر بزر الماوس الأيمن على الفلتر المختار ثم انقر فوق تطبيق أوراق العمل لتحديد الكل باستخدام مصدر البيانات هذا كما هو موضح أدناه. تشير أيقونة قاعدة البيانات أو الأسطوانة التي تظهر بجانب البعد أو القياس في رف المرشحات إلى أنه عامل تصفية عالمي.
لذلك لدينا جميع الأبعاد والمقاييس التي تم تكوينها كمرشح عام كما هو موضح أدناه في الورقة 1. لاحظ أن لدينا عنوان الفيلم مهيأ كمرشح مطابقة البطاقة البديلة وسنة الإصدار كقيم متعددة (قائمة مخصصة). يمكن للمرء إعادة تسمية Sheet1 إلى عوامل التصفية.
الخطوة 4 - إنشاء عرض جدولي بسيط للبيانات
الخطوة 5 - قم بإنشاء لوحة تحكم باستخدام المرشحات وأوراق الجدول
سننشئ لوحة تحكم بسيطة مع المرشحات وأوراق الجدول ونستخدم إجراءات لوحة المعلومات ، وتضمين صفحة الويب وقليلًا من التنسيق لجعلها تفاعلية.
الخطوة 6 - إضافة صفحة ويب إلى لوحة المعلومات
انقر نقرًا مزدوجًا فوق صفحة الويب في الجزء الأيسر من قسم لوحة المعلومات والذي سينبثق في مربع حوار تحرير عنوان URL. يمكن للمرء تركه فارغًا والنقر فوق موافق.
سيقوم بتضمين كائن صفحة ويب فارغ بين الجدول والفلاتر كما هو موضح أدناه.
الخطوة 7 - إنشاء إجراء URL للوحة القيادة
سنضيف تفاعلية إلى لوحة المعلومات من خلال إنشاء إجراء حيث كلما نقرنا على فيلم في الجدول ، سيفتح عنوان URL المقابل (رابط الفيلم على IMDb للحصول على التفاصيل) في منطقة كائن صفحة الويب المضمنة على لوحة القيادة.
فيما يلي خطوات إضافة هذا الإجراء في لوحة المعلومات. قبل ذلك ، لا تنس إضافة عنوان URL للفيلم كتلميح أداة أو عمود منفصل في ورقة الجدول.
أعط اسمًا مناسبًا لإجراء إضافة عنوان URL متبوعًا باختيار ورقة المصدر كجدول حيث عند تحديد فيلم سيفتح عنوان URL كما تم التقاطه في سمة عنوان URL للفيلم.
يجب أن يبدو إجراء لوحة المعلومات الذي تم إنشاؤه مرة واحدة كما هو موضح أدناه.
الخطوة 8 - شاهد إجراء لوحة القيادة في البث المباشر
انقر فوق أي فيلم في الجدول ويجب أن يفتح الرابط على موقع IMDb لهذا الفيلم والذي سيحتوي على تفاصيل حول الفيلم والصور والمقطورة والوصف وما إلى ذلك.
يمكن للمرء أن يجادل في أن تخطيط لوحة القيادة لم يتم تحسينه هنا لعرض أفضل ولكن الفكرة هي إظهار قدرة لوحة المعلومات وكائنات الويب المضمنة هنا. كاقتراح ، يمكن للمرء أن ينظم المرشحات في الأعلى كصف لإفساح مساحة أكبر لجدول وكائن صفحة الويب.
هذه نسخة محسّنة قليلاً من لوحة القيادة من حيث التخطيط.
الخطوة 9 - قم بإنشاء قصة باستخدام لوحات معلومات متنوعة
باستخدام الخطوات المذكورة أعلاه ، قمت بإنشاء العديد من لوحات المعلومات التي يمكن من خلالها إنشاء قصة. القصة ليست سوى مجموعة من لوحات المعلومات. إنه مثل كتاب به صفحات تحتوي كل صفحة فيه على قصة جديدة. يمكن للمرء أن يعطي عنوانًا لكل صفحة في القصة وعليه ببساطة سحب وإفلات لوحة القيادة أو الأوراق على الصفحة. يوجد أدناه قصة بسيطة من ثلاثة مربعات / صفحات تم تصميم كل منها لعرض مختلف للبيانات والتحليل.
دعونا نقوم ببعض التحليل الآن.
هل يوجد فيلم حصل على تقييم أكبر من أو يساوي 9 ولكنه صوت أقل من 700 ألف؟
باستخدام لوحة القيادة القابلة للاستكشاف الخاصة بنا ، يمكن للمرء ضبط المرشحات وفقًا لذلك لرؤية النتائج. لا يوجد سوى فيلم واحد بهذه الخصائص God Father الجزء الثاني لعام 1974 حيث التقييم 9 لكن الأصوات قريبة من 700 ألف.
كيف تبدو خاصية التصنيف لأفضل 50 فيلمًا؟
قم بتصفية الرتب لاسترداد أفضل 50 فيلمًا في الصفحة الثانية من القصة المسماة التقييمات والأفلام.
يبدو أن متوسط التصنيف لأفضل 50 فيلمًا هو حوالي 8.5 و 8.6 مع 9 أفلام في 8.5 دلو. بالمناسبة المصارع هو فيلمي المفضل.
كيف تتميز التصويتات بالأفلام التي يحتوي عنوانها على "The"؟
قم بتصفية عنوان الفيلم بقيمة "* The *" في لوحة المعلومات الثالثة الأصوات والأفلام. يبدو أنه لا يوجد نمط واضح في عنوان الفيلم الذي يحتوي على "The" والتصويت.
ترقبوا المزيد من التعلم من خلال التصور باستخدام Tableau.
حول تابلوه
يوجد مقر Tableau (NYSE: DATA) في سياتل ، واشنطن ، وهو لديه مهمة لمساعدة الأشخاص على رؤية البيانات وفهمها. يقدم مجموعة منتجات لتصور البيانات التي تركز على ذكاء الأعمال.
يمكن للمرء زيارة موقع Tableau الرسمي للعثور على مزيد من التفاصيل حول Tableau وعروض منتجاتها وميزاتها.