أهم 10 خوارزميات للتعلم الآلي: ما سبب أهميتها في عام 2021؟
نشرت: 2019-06-10جدول المحتويات
أسفل حفرة تعلم الآلة
تطبيقات الحياة الواقعية
ما المقصود بخوارزميات التعلم الآلي؟
أنواع التعلم الآلي
أفضل 10 خوارزميات لتعلم الآلة
يتم إحتوائه
في 2021، يمكن أن أجهزة الكمبيوتر ليس فقط نرى، ولكن يمكنهم القراءة والكتابة من تلقاء نفسها.
حسنًا ، دعنا نلقي نظرة على قصة الرعب الحديثة التي نعيش فيها بالفعل.
على سبيل المثال ، كيف سيكون رد فعلك إذا أخبرك أحدهم أنه قريبًا سيتم استبدال 30٪ من الوظائف بالأتمتة؟ إنه أمر شائن ، أليس كذلك؟
وما علاقة ذلك بخوارزميات التعلم الآلي ؟
لحسن الحظ ، هناك ضوء في نهاية النفق. اسمح لي بتوجيهك من خلاله.
في عام 2021 ، يمكن لأجهزة الكمبيوتر:
- التعرف على الأصوات والوجوه والكتابة اليدوية. (نمط CSI ...)
- التسمية التوضيحية للصور تلقائيًا.
- تعرف على كيفية التعرف على محتوى الصورة وتصنيفها وفقًا لميزة معينة.
- قم بالمهام نيابة عنك. (وأنشئ الخوارزميات اللازمة لسحبها).
القائمة تطول بالطبع.
كل يوم نجري عمليات بحث على الويب وزيارة مواقع الويب ووسائل التواصل الاجتماعي. ولا نسأل أنفسنا أبدًا السؤال الأساسي:
إلى أي مدى ذهبت تقنية الذكاء الاصطناعي؟
ها نحن ذا!
تثير إنجازات التكنولوجيا تساؤلات حول مستقبل البشرية.
ربما تعطينا هذه الحقائق بعض الأفكار:
(المصدر: فيوتشرزم ، دزير )
- في كوريا الجنوبية ، من بين كل 100 عامل ، 4.78 في المتوسط هم من الروبوتات .
- 88٪ من الموظفين في إثيوبيا معرضون لخطر فقدان وظائفهم للروبوتات.
- في مدينة نيويورك ، نسبة الموظفين المعرضين للخطر 40.7٪ .
- هناك حاجة إلى 9 أسطر من التعليمات البرمجية لكتابة برنامج التعلم الآلي.
- سيتم استبدال 97٪ من وظائف طهي الوجبات السريعة بالآلات.
- 98٪ من المزارعين سيفقدون وظائفهم بسبب الآلات.
- يمكن أن يدر التعلم الآلي ما يصل إلى مليار دولار سنويًا في صناعة الأدوية.
- في السنوات العشر المقبلة ، من المتوقع أن يحل التعلم الآلي محل 25٪ من الوظائف.
في عام 2021 ، يمكننا بالفعل امتلاك روبوت في المنزل.
يمكنك إجراء محادثة بطلاقة مع Jibo أو Tapia . يطلق عليهم الروبوتات الاجتماعية لسبب ما.
يتذكرون أسماء ووجوه وأصوات أصدقائك وأفراد أسرتك (وهذا ليس مخيفًا على الإطلاق!) ، يمكنهم مجالسة طفلك (أوه نعم!) ، وإذا تعرضت لحادث في المنزل فسوف يتصلون برقم 911 أنت. يمكن أن يكون هذا الأخير مفيدًا بشكل خاص عندما لا يكون هناك أي شخص آخر. لكننا سنصل إلى ذلك لاحقًا.
في الوقت الحاضر ، يمكن للخوارزميات "تعليم نفسها" اللغات ، وحتى ترجمة اللغة الإنجليزية المنطوقة إلى اللغة الصينية المكتوبة في وقت واحد مع طلاقة المتحدث العادي للغة الصينية. عاجلاً أم آجلاً ، ستصبح دراسة اللغات الأجنبية حتمًا عفا عليها الزمن.
وماذا عن هذا:
هواتفنا الذكية تتجسس علينا بالمعنى الحرفي للكلمة ... أنا متأكد من أنك تعرف بالضبط ما أتحدث عنه! تخيل - في غداء المكتب ذكرت (شفهيًا!) أنك تريد بدء مشاهدة لوسيفر . بالعودة إلى مكتبك ، تفتح Pinterest أو Facebook على هاتفك ، وها هو - الشيطان نفسه ... (نعم ، Tom Ellis حالم ، لكن هذا ليس الهدف!)
أنظمة التوصية في كل مكان حولنا. إذا قمت بإدخال بحث عن "Lego" ، فإن الصور ذات الصلة التي تظهر وتصنف على أنها Lego ، قد تم التعرف عليها من قبل منظمة العفو الدولية. بعبارة أخرى ، لم يتم التعليق عليها يدويًا على أنها كتل Lego بواسطة إنسان ...
لقد علمت الخوارزمية نفسها ما هذا من خلال النظر إلى ملايين الصور.
صرخة الرعب!
يتم بالفعل الاستفادة من كل هذه القدرات وأكثر من ذلك بكثير من قبل الشركات.
الآثار المترتبة هنا هي:
أولا، أجهزة الكمبيوتر تملك علموا أنفسهم يا رفاق! فكر في كل عمال الروبوت في المستقبل. سوف يتعلمون ويؤدون المهام بشكل أسرع من العاملين البشريين.
والثانية - وأنا أعلم ما كنت التفكير - OMG، محكوم الإنسانية جدا!
كثير من الناس يتفاعلون بهذه الطريقة.
كتب العديد من المؤلفين على مدى القرن الماضي عن مستقبل تهيمن فيه الروبوتات على البشر. يزدهر الذكاء الاصطناعي ، والروبوتات ستحكم العالم وتتغذى على البشر. التفرد قريب.
حسنًا ، هذا مكان جيد للتوقف.
الآن بعد أن حصلنا على ذلك من نظامنا ، فلنلقِ نظرة على ما هو حقيقي في الواقع.
أسفل حفرة تعلم الآلة
نحتاج إلى بعض السياق أولاً.
قبل 15000 عام ، تم اختراع واحدة من أكثر الألعاب المحبوبة في العالم. في مكان ما بين القرنين الثاني عشر والرابع عشر ، أصبحت تلك اللعبة تُعرف باسم الشطرنج .
لديها 10 أس 40 نتيجة محتملة (أي 1 مع 40 صفرًا في النهاية).
في عام 2017 ، استخدمت خوارزمية AlphaZero من Google التعلم الآلي لتعليم نفسها اللعب والفوز باللعبة.
استغرقت العملية برمتها ، بدءًا من إدخال اللعبة إلى الخوارزمية ، وحتى فوزها بأول مباراة لها ضد Stockfish - أحد أقوى محركات الشطرنج في العالم ، ما يلي:
(أظهر نفسك!)
4 ساعات.
أوتش!
نعم ، نحن على وشك ثورة في التعلم الآلي .
إذا نظرنا إلى الوراء ، فإن هذا ليس الاضطراب الأول من هذا النوع. تسببت الثورة الصناعية في نهاية القرن التاسع عشر وبداية القرن العشرين في حدوث اضطراب اجتماعي أيضًا ، ولكن في النهاية ، حققت البشرية والآلات توازنًا.
نعم ، الأمور تتغير ، وهذا أمر جيد في الواقع!
تمتلك برامج التعلم الآلي القدرة على النظر إلى مشكلة بأعين جديدة والتنقل عبر بيئات غير معروفة.
لذا ، كما نحن على وشك أن نرى ، إنها ليست قصة رعب بعد كل شيء.
أشبه بمعجزة تكنولوجية.
حاليا:
لماذا التصنيف مهم جدا؟
بالنسبة للمبتدئين، ما هو التعلم الجهاز عن طريق التعريف؟
في الأساس ، تتم برمجة الآلة لتعليم نفسها كيفية إنتاج برنامج وإنشاء الحلول. ينتج التعلم الآلي دائمًا أكثر الأرقام دقة (والتنبؤات إذا لزم الأمر) الممكنة.
فكر في تقنية يمكنها حل مجموعة واسعة من المشكلات المختلفة تمامًا.
وهذا هو جمالها!
الغرض الرئيسي للنظام هو التصنيف . وهذا ما يسمى أيضًا برؤية الكمبيوتر . سوف يتعلم من تلقاء نفسه أن يميز. وعدد المشاكل المختلفة في العالم التي يمكن اختزالها إلى مهمة التصنيف التي تبدو بسيطة ، هو أمر محير للغاية.
فقط تخيل القدرة على التصنيف بين:
- مواقف الشطرنج الجيدة والسيئة (اللعب)
- الجمل الصحيحة وغير الصحيحة نحويًا (ترجمة)
- طريق خاوية وواحد عليها سيارات أو مشاة (سيارات ذاتية القيادة)
- خلية سليمة وخلايا سرطانية (تشخيص طبي)
هذا هو بالضبط السبب الذي يجعل الخبراء في العديد من المجالات قد عفا عليهم الزمن. لست بحاجة إلى أن تكون خبيرًا لإنشاء رمز يؤدي مثل هذه المهام. الرجال الذين كتبوا برنامج الترجمة الفورية من الإنجليزية إلى الصينية لم يتحدثوا كلمة واحدة من الصينية.
ستعلم الخوارزمية نفسها كيف تكون خبيرًا.
ونعم ، من المهم التعرف عليها والتعرف عليها ... الطريقة التي تعرفنا بها على أجهزة الكمبيوتر في البداية.
نحن جيدون في التعامل مع أجهزة الكمبيوتر الآن. جيد جدًا لدرجة أننا نميل إلى تجسيدها (أو ربما هذا أنا فقط؟).
يبدو أن هذا هو الوقت المناسب لنسأل أنفسنا:
ماذا سيحدث لكل هؤلاء الأشخاص ، الذين سيفقدون وظائفهم في النهاية بسبب برامج الذكاء الاصطناعي والتعلم الآلي؟
هل سمعت عن شيء صغير يسمى الدخل الأساسي العام؟
من هنا تبدأ:
في المستقبل ، سيحصل المواطنون على دخل لا يشركهم في القيام بأي عمل. سيأتي المال من الكفاءة المجنونة التي ستوفرها الأتمتة والمدخرات التي ستأتي منها.
إما هذا أو - سيناريو أكثر واقعية - ستظهر العديد من أنواع الوظائف الجديدة. في نهاية القرن التاسع عشر ، كان حوالي 50٪ من سكان الولايات المتحدة يعملون في الزراعة. الآن ، بفضل الآلات القوية ، أقل من 2٪ مزارعون ومع ذلك يعمل الناس.
الآن ، ما الذي يمكن استخدام التعلم الآلي من أجله ؟
تطبيقات الحياة الواقعية
يمكن استخدام التعلم الآلي لاستنتاج حقائق جديدة من قاعدة البيانات.
دعونا نرى بعض المناطق حيث تعلم الآلة سوف تحدث فرقا كبيرا:
- القيادة المساعدة - يمكن للسيارات أن تضغط على المكابح تلقائيًا من أجلك ، عندما تقترب من السيارة التي أمامك. وبالتالي ، في مرحلة ما في المستقبل ، سوف تنسى البشرية تقريبًا معنى حادث السيارة . السيارات ذاتية القيادة في الطريق.
- الرعاية الصحية - تعزز كفاءة المهنيين الطبيين. سيصبح التعرف على المرض وتشخيصه أسهل بكثير وأكثر دقة بمساعدة التعلم الآلي. على سبيل المثال ، لا يمكن للبرامج مسح وتحديد صور الأنسجة السرطانية بشكل أفضل من البشر فحسب ، بل يمكنها أيضًا حساب معدلات بقاء المريض بناءً على قواعد بيانات ضخمة من السجلات الطبية. (تحقق من عمل جيريمي هوارد ومشروعه المسمى Enlitic . إنه لأمر مدهش!)
- اختراع الأدوية - بمساعدة التعلم الآلي ، يمكن لكل مريض أن يتلقى علاجًا مصممًا خصيصًا له.
- الزراعة - ستتم أتمتة الزراعة برؤية الكمبيوتر والتحكم الآلي: جودة المحاصيل والتنبؤ بها ، واكتشاف الأمراض ، ورعاية الثروة الحيوانية ، والإنتاج.
- قدرات اللغة المدعومة بالذكاء الاصطناعي - في المستقبل القريب سنتمكن من التواصل شفهيًا مع الترجمة في الوقت الفعلي باستخدام الذكاء الاصطناعي .
التعلم الآلي هو مجرد أداة ، وسيظل واحدًا في المستقبل المنظور.
لذلك لا داعي للقلق. الجلوس والاسترخاء.
الآن بعد أن رأينا ما هو التعلم الآلي ، دعنا نطرح السؤال التالي:
ما المقصود بخوارزميات التعلم الآلي؟
لذلك ، بعد أن حددنا مدى أهمية وفائدة التعلم الآلي لدينا في المستقبل ، دعونا نلقي نظرة فاحصة على الخوارزميات التي تجعل السحر يحدث.
من الطرق الرائعة لشرح خوارزميات التعلم الآلي مقارنتها بالبرمجة التقليدية.
في البرمجة التقليدية ، يعمل المبرمج في فريق مع خبير في المجال ، يتم تطوير البرنامج من أجله. كلما كانت المهمة أكثر تعقيدًا - كلما طال طول الكود وزادت صعوبة كتابته.
تعمل خوارزميات التعلم الآلي بشكل مختلف تمامًا. تتلقى الخوارزمية مجموعة بيانات للإدخال - ومجموعة اختيارية للإخراج. ثم يقوم بتحليلها (أو تحليلها) ويعمل على العملية التي يجب أن تحدث حتى تحدث نتيجة مفيدة. اليوم ، هذه وظيفة محجوزة لمبرمج بشري. في المستقبل ، سيتغير ذلك أيضًا.
أنواع التعلم الآلي
هناك 4 أنواع مختلفة من خوارزميات التعلم الآلي.
ها هم:
1. الإشراف على التعلم
تتم تسمية بيانات الإدخال في خوارزميات التعلم الخاضع للإشراف ، والمخرجات معروفة ودقيقة. من أجل استخدام هذه الفئة من الخوارزميات ، ستحتاج إلى كمية كبيرة من البيانات المصنفة. وقد لا تكون هذه مهمة سهلة دائمًا.
تقع خوارزميات تحت الملاحظة إلى فئتين - الانحدار والتصنيف. يفحص كل منها مجموعات مختلفة من البيانات.
خوارزميات الانحدار هي تلك التي تقوم بالتنبؤات والتنبؤات. وتشمل هذه ، من بين أمور أخرى ، التنبؤات الجوية ، والنمو السكاني ، وتقديرات متوسط العمر المتوقع ، وتوقعات السوق.
تُستخدم خوارزميات التصنيف للتشخيص ، واكتشاف الاحتيال في الهوية ، والاحتفاظ بالعملاء ، وكما يوحي الاسم - تصنيف الصور.
2. التعلم غير الخاضع للإشراف
يحدث عندما لا يتم تسمية بيانات الإدخال. ينظمون البيانات في هياكل عناقيد. وبالتالي فإن أي بيانات إدخال تكون جاهزة للتحليل على الفور.
نظرًا لعدم تصنيف البيانات ، لا توجد طريقة لتقييم دقة النتيجة. ومع ذلك ، ليست الدقة هي ما تم تصميم الخوارزميات غير الخاضعة للإشراف للمتابعة. المجموعات التي تنشئها الخوارزمية ليست مألوفة للبرنامج بأي حال من الأحوال. لذا فإن الفكرة هي إدخال البيانات وتحليلها وتجميعها في مجموعات.
تماما مثل خوارزميات أشرف، وتنقسم أبناء عمومتهم غير خاضعة للرقابة في 2 فئات - الحد من أبعاد والمجموعات.
من الواضح أن خوارزميات التجميع نفسها جزء من كل هذا. من المفيد تجميع البيانات في فئات ، حتى لا تضطر إلى التعامل مع كل قطعة بمفردها. تستخدم هذه الخوارزميات قبل كل شيء لتجزئة العملاء والتسويق المستهدف.
تُستخدم خوارزميات تقليل الأبعاد لاكتشاف الهيكل ، وتصور البيانات الضخمة ، واستنباط الميزات ، والضغط الهادف. إذا كان التجميع جانبًا واحدًا من العملة ، فسيكون تقليل الأبعاد هو الجانب الآخر. من خلال تجميع البيانات في مجموعات ، تقلل الخوارزميات حتمًا عدد المتغيرات (الأبعاد) ذات المعنى التي تصف مجموعة البيانات.
الآن ، هناك فئة من خوارزميات التعلم الآلي تجمع بين الفئتين السابقتين:
3. التعلم شبه الخاضع للإشراف
إنه يقف بين الخوارزميات الخاضعة للإشراف مع البيانات المصنفة ، والخوارزميات غير الخاضعة للإشراف مع البيانات غير المسماة .
تستخدم الخوارزميات شبه الخاضعة للإشراف كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المسماة. هذا يمكن أن يؤدي إلى تحسين دقة التعلم.
إنه أيضًا مصدر ارتياح كبير من حيث جمع البيانات نظرًا لأن الأمر يتطلب قدرًا كبيرًا من الموارد لإنشاء بيانات مصنفة.
4. تعزيز التعلم
على عكس الأنواع الثلاثة السابقة ، تختار خوارزميات التعزيز إجراءً بناءً على مجموعة بيانات. ثم يقومون بتقييم النتيجة وتغيير الاستراتيجية إذا لزم الأمر.
في خوارزميات التعزيز ، تقوم بإنشاء شبكة وحلقة من الإجراءات ، وهذا كل شيء. بدون إنشاء قاعدة بيانات ، لديك فائز. لماذا ا؟
حسنًا ، لقد كانت خوارزميات التعزيز هي التي اكتشفت ألعاب الداما والشطرنج والجو.
يعمل التعلم المعزز على مبدأ التجربة والخطأ. سيتم منح النظام مكافأة من نوع ما سيساعده في قياس معدل نجاحه. في حالة الألعاب - ستكون المكافأة هي لوحة النتائج. عندما يفوز النظام بنقطة ، فإنه يقيّمها على أنها حركة ناجحة وتصبح حالة هذه الخطوة أعلى. ستستمر في تكرار الحلقة حتى تنجح كل تحركاتها.
وبهذه الطريقة لدينا خوارزمية يمكنها إتقان لعبة الشطرنج في 4 ساعات.
الآن نحن نعرف!
على ما يرام. دعنا نلقي نظرة على الخوارزميات نفسها:
أفضل 10 خوارزميات لتعلم الآلة
الآن ، قبل أن نبدأ ، دعونا نلقي نظرة على أحد المفاهيم الأساسية في التعلم الآلي. الانحدار ، عندما يتعلق الأمر بخوارزميات انحدار التعلم الآلي ، يعني أن الخوارزمية ستحاول إنشاء علاقة بين متغيرين.
هناك العديد من أنواع الانحدار - الانحدار الخطي واللوجستي ومتعدد الحدود وانحدار المربعات الصغرى العادي وما إلى ذلك. سنغطي اليوم النوعين الأولين فقط لأنه بخلاف ذلك سيتم نشر هذا بشكل أفضل ككتاب بدلاً من مقالة.
كما سنرى بعد قليل ، فإن معظم الخوارزميات العشر الأولى هي خوارزميات تعلم خاضعة للإشراف ويتم استخدامها بشكل أفضل مع Python.
فيما يلي قائمة بأفضل 10 خوارزميات للتعلم الآلي :
1. الانحدار الخطي
إنه من بين أكثر خوارزميات التعلم الآلي شيوعًا. يعمل على إنشاء علاقة بين متغيرين من خلال ملاءمة معادلة خطية من خلال البيانات المرصودة.
بمعنى آخر ، يلاحظ هذا النوع من الخوارزميات ميزات مختلفة للوصول إلى نتيجة. إذا كان عدد المتغيرات أكبر من متغيرين - فسيتم استدعاء الخوارزمية الانحدار الخطي المتعدد.
يعد الانحدار الخطي أيضًا أحد خوارزميات التعلم الآلي الخاضعة للإشراف والتي تعمل جيدًا في Python . إنها أداة إحصائية قوية ويمكن تطبيقها للتنبؤ بسلوك المستهلك وتقدير التوقعات وتقييم الاتجاهات. يمكن للشركة الاستفادة من إجراء التحليل الخطي والتنبؤ بالمبيعات لفترة زمنية مقبلة.
لذلك ، إذا كان لدينا متغيرين ، أحدهما توضيحي والآخر تابع . يمثل المتغير التابع القيمة التي تريد البحث عنها أو عمل توقع بشأنها. المتغير التوضيحي مستقل. يعتمد المتغير التابع دائمًا على التفسير.
الهدف من التعلم الآلي الخطي هو معرفة ما إذا كانت هناك علاقة مهمة بين المتغيرين وإذا كان هناك ، لمعرفة ما يمثله بالضبط.
يعتبر الانحدار الخطي خوارزمية بسيطة للتعلم الآلي وبالتالي فهو شائع بين العلماء.
الآن ، هناك انحدار خطي ، وهناك انحدار لوجستي. دعونا نلقي نظرة على الفرق:
2. الانحدار اللوجستي
هذه واحدة من خوارزميات التعلم الآلي الأساسية . وهو المصنف ذات الحدين التي ليس لديها سوى 2 الدول، أو 2 القيم - التي يمكنك تعيين معاني يتم ضغط بيانات الإدخال ثم تحليلها.
على عكس الانحدار الخطي ، تقوم الخوارزميات اللوجستية بعمل تنبؤات باستخدام دالة غير خطية. تستخدم خوارزميات الانحدار اللوجستي للتصنيف وليس لمهام الانحدار. يشير "الانحدار" في الاسم إلى أن الخوارزميات تستخدم نموذجًا خطيًا وتدمجها في الفضاء المستقبلي.
الانحدار اللوجستي هو خوارزمية تعلم آلي خاضعة للإشراف ، والتي ، مثل الانحدار الخطي ، تعمل بشكل جيد في بايثون. من وجهة نظر رياضية ، إذا كان من المتوقع أن تكون بيانات مخرجات البحث من حيث المرضى / الأصحاء أو السرطان / عدم وجود سرطان ، فإن الانحدار اللوجستي هو الخوارزمية المثالية للاستخدام.
على عكس الانحدار الخطي حيث قد يكون لبيانات المخرجات قيم مختلفة ، يمكن أن يكون الانحدار اللوجستي ناتجًا فقط 1 و 0.
هناك ثلاثة أنواع من الانحدار اللوجستي ، بناءً على الاستجابة الفئوية. وهذه هي:
- الانحدار اللوجستي الثنائي - هذا هو النوع الأكثر استخدامًا إذا كان الناتج نوعًا ما من "نعم" / "لا".
- الانحدار اللوجستي متعدد الأسماء - عندما يكون هناك احتمال وجود 3 إجابات أو أكثر بدون ترتيب.
- الانحدار اللوجستي الترتيبي - مرة أخرى 3 إجابات أو أكثر ، ولكن مع الترتيب. على سبيل المثال ، عندما تكون النتائج المتوقعة على مقياس من 1 إلى 10.
دعونا نرى خوارزمية تصنيف رائعة أخرى:
3. التحليل الخطي التمييزي
تجد هذه الطريقة مجموعات خطية من الميزات ، تفصل بين بيانات الإدخال المختلفة. الغرض من خوارزمية LDA هو فحص متغير يمكن الاعتماد عليه كاتحاد خطي من الميزات. إنها تقنية تصنيف رائعة .
تفحص هذه الخوارزمية الصفات الإحصائية لبيانات الإدخال وتقوم بإجراء حسابات لكل فئة. يقيس قيمة الفصل ثم التباين بين جميع الفئات.
أثناء عملية نمذجة الاختلافات بين الفئات ، تفحص الخوارزمية بيانات الإدخال وفقًا للمتغيرات المستقلة.
تحتوي بيانات الإخراج على معلومات حول الفئة ذات القيمة الأعلى. تعمل خوارزميات التحليل الخطي التمييزي بشكل أفضل للفصل بين الفئات المعروفة . عندما نحتاج إلى تقسيم عدة عوامل رياضيًا إلى فئات ، فإننا نستخدم خوارزمية LDA.
4. K- أقرب الجيران
تعد خوارزمية kNN واحدة من خوارزميات التعلم الآلي الرائعة للمبتدئين . يقومون بعمل تنبؤات بناءً على البيانات القديمة المتاحة ، من أجل تصنيف البيانات إلى فئات بناءً على خصائص مختلفة.
وهي مدرجة في قائمة خوارزمية التعلم الآلي الخاضعة للإشراف ، والتي تستخدم في الغالب للتصنيف. يخزن البيانات المتاحة ويستخدمها لقياس أوجه التشابه في الحالات الجديدة.
وK في KNN هي المعلمة التي تشير إلى عدد من أقرب الجيران التي سيتم تضمينها في "عملية تصويت الأغلبية". بهذه الطريقة ، "يصوت" جيران كل عنصر لتحديد صفه.
واحدة من أفضل الطرق لاستخدام خوارزمية kNN هي عندما يكون لديك مجموعة بيانات صغيرة خالية من الضوضاء وجميع البيانات مصنفة. الخوارزمية ليست سريعة ولا تعلم نفسها التعرف على البيانات غير النظيفة. عندما تكون مجموعة البيانات أكبر ، فليس من الجيد استخدام kNN.
تعمل خوارزمية kNN على النحو التالي: أولاً ، يتم تحديد المعلمة K ، وبعد ذلك تقوم الخوارزمية بعمل قائمة بالإدخالات ، قريبة من نموذج البيانات الجديد. ثم يجد التصنيف الأكثر شيوعًا للمدخلات ، وأخيرًا ، يعطي تصنيفًا لمدخلات البيانات الجديدة.
فيما يتعلق بالتطبيقات الواقعية ، تستخدم محركات البحث خوارزميات kNN لتحديد ما إذا كانت نتائج البحث ذات صلة بالاستعلام. إنهم البطل المجهول الذي يوفر على المستخدمين الوقت عند إجراء بحث.
بعد ذلك تأتي شجرة-الثلاثي: انحدار الأشجار، الغابات عشوائية، وAdaBoost.
ها نحن ذا:
5. أشجار الانحدار (المعروفة أيضًا باسم أشجار القرار)
نعم ، يطلق عليهم اسم الأشجار ، ولكن بما أننا نتحدث عن خوارزميات التعلم الآلي ، تخيلهم مع الجذور في الأعلى والفروع والأوراق في الأسفل.
أشجار الانحدار هي نوع من خوارزمية التعلم الخاضعة للإشراف ، والتي - مفاجأة - تعمل بشكل جيد في بايثون. (معظم خوارزميات تعلم الآلة تفعل ذلك ، بالمناسبة).
تسمى هذه "الأشجار" أيضًا بأشجار القرار وتستخدم في النمذجة التنبؤية . إنها تتطلب جهدًا ضئيلًا نسبيًا من المستخدم من حيث كمية بيانات الإدخال.
تمثيلهم عبارة عن شجرة ثنائية ويقومون بحل مشاكل التصنيف. كما يوحي الاسم ، يستخدم هذا النوع من الخوارزمية نموذجًا شبيهًا بالشجرة من القرارات. يؤدون فحصًا متغيرًا أو اختيار ميزة. يمكن أن تكون بيانات الإدخال رقمية وقطعية.
الترجمة من فضلك!
بالتأكيد. في أي وقت تتخذ فيه قرارًا ، تنتقل إلى وضع جديد - مع اتخاذ قرارات جديدة. كل من الطرق الممكنة التي يمكنك أن تسلكها هي "فرع" ، في حين أن القرارات نفسها هي "العقد". نقطة البداية الأولية الخاصة بك هي العقدة الأساسية.
هذه هي الطريقة التي تنشئ بها خوارزمية شجرة القرار سلسلة من العقد والأوراق. الشيء المهم هنا هو أنهم جميعًا يأتون من عقدة واحدة. (في المقابل ، تنتج خوارزميات الغابة العشوائية عددًا من الأشجار ، لكل منها عقدة أولية.)
فيما يتعلق بالتطبيق الواقعي ، يمكن استخدام أشجار الانحدار للتنبؤ بمعدلات البقاء وأقساط التأمين وسعر العقارات ، بناءً على عوامل مختلفة.
"تنمو" أشجار الانحدار فروع القرارات حتى يتم الوصول إلى معيار التوقف. إنه يعمل بشكل أفضل مع كميات صغيرة من بيانات الإدخال لأنه بخلاف ذلك ، قد تحصل على مجموعة بيانات إخراج متحيزة.
تقرر الخوارزمية مكان الانقسام وتشكيل فرع جديد من قرار ، بناءً على خوارزميات متعددة. يتم تقسيم البيانات إلى مناطق من الملاحظات الفرعية ، والتي تتجمع حول جميع المتغيرات المتاحة.
6. الغابة العشوائية
تعد خوارزمية الغابة العشوائية شكلاً آخر من أشكال التعلم الآلي الخاضع للإشراف . إنه ينتج أشجار قرار متعددة ، بدلاً من شجرة واحدة فقط مثل أشجار الانحدار. يتم توزيع العقد بشكل عشوائي ولا يعتبر ترتيبها ذا أهمية لبيانات الإخراج. كلما زادت كمية الأشجار ، زادت دقة النتيجة.
يمكن استخدام هذا النوع من الخوارزمية لكل من التصنيف والانحدار. تتمثل إحدى الميزات الرائعة لخوارزمية الغابة العشوائية في أنها يمكن أن تعمل عندما تكون نسبة كبيرة من البيانات مفقودة . كما أن لديها القدرة على العمل مع مجموعة بيانات كبيرة.
في حالة الانحدار ، فإن هذه الخوارزميات ليست هي الخيار الأفضل ، لأنها لا تملك سيطرة كبيرة على ما يفعله النموذج.
يمكن أن تكون خوارزميات Random Forest مفيدة جدًا في التجارة الإلكترونية. إذا كنت بحاجة إلى تحديد ما إذا كان عملاؤك سيحبون زوجًا معينًا من الأحذية ، فأنت تحتاج فقط إلى جمع معلومات عن مشترياتهم السابقة.
يمكنك تضمين نوع الأحذية ، سواء كان لها كعب أم لا ، وجنس المشتري ، والنطاق السعري للأزواج السابقة التي طلبوها. ستكون هذه بيانات الإدخال الخاصة بك.
ستنشئ الخوارزمية أشجارًا كافية لتزويدك بتقدير دقيق.
على الرحب والسعة!
وهنا تأتي آخر خوارزمية نظام الشجرة:
7. AdaBoost
AdaBoost هو اختصار لـ Adaptive Boosting. فازت الخوارزمية بجائزة Godel في عام 2003 لمنشئيها.
مثل النظامين السابقين ، يستخدم هذا أيضًا نظام الأشجار. فقط بدلاً من العقد والأوراق المتعددة ، تنتج الأشجار في AdaBoost عقدة واحدة وورقتين فقط ، ويعرف أيضًا باسم الجذع .
خوارزميات AdaBoost تختلف بشكل كبير من الأشجار والغابات قرار عشوائي.
لنرى:
وهناك شجرة خوارزمية قرار استخدام متغيرات كثيرة قبل أن ينتج أحد المخرجات. جدعة يمكن فقط استخدام 1 متغير لاتخاذ قرار.
في حالة خوارزميات الغابة العشوائية ، فإن جميع الأشجار لها نفس القدر من الأهمية لاتخاذ القرار النهائي. تضع خوارزميات AdaBoost الأولوية لبعض جذوع الأشجار على الأخرى.
وأخيرًا وليس آخرًا ، فإن أشجار الغابات العشوائية أكثر فوضوية ، إذا جاز التعبير. بمعنى أن تسلسل الأشجار غير ذي صلة. لا تعتمد النتيجة على ترتيب إنتاج الأشجار. في المقابل ، بالنسبة لخوارزميات AdaBoost - الترتيب ضروري.
نتيجة كل شجرة هي الأساس للأشجار التالية. لذلك إذا كان هناك خطأ على طول الطريق ، فإن كل شجرة لاحقة تتأثر.
حسنًا ، ما الذي يمكن أن تفعله هذه الخوارزمية في الحياة الواقعية؟
تتألق خوارزميات AdaBoost بالفعل في مجال الرعاية الصحية ، حيث يستخدمها الباحثون لقياس مخاطر المرض. لديك البيانات ، لكن العوامل المختلفة لها جاذبية مختلفة. (تخيل أنك سقطت على ذراعك ويستخدم أطباؤك خوارزمية لتحديد ما إذا كانت مكسورة أم لا. إذا كانت بيانات الإدخال تحتوي على كل من الأشعة السينية لذراعك وصورة ظفرك المكسور ... حسنًا ، فمن الواضح تمامًا أي جدعة ستعطى أهمية أكبر لـ.)
الآن ، نحن خارج الغابة ، إذا جاز التعبير ، فلنلقِ نظرة على 3 أنواع أخرى من خوارزميات التعلم الآلي:
8. ساذج بايز
يكون هذا الخيار مفيدًا عندما يكون لديك مشكلة في تصنيف النص . إنها خوارزمية التعلم الآلي المستخدمة عندما يتعين على المرء التعامل مع مجموعات البيانات عالية الأبعاد ، مثل تصفية البريد العشوائي أو تصنيف المقالات الإخبارية.
تحمل الخوارزمية اسم التوقيع هذا لأنها تعتبر كل متغير مستقلاً. بمعنى آخر ، تعتبر الميزات المختلفة لبيانات الإدخال غير مرتبطة تمامًا. هذا يجعله مصنف احتمالي بسيط وفعال.
يشير جزء "Bayes" من الاسم إلى الرجل الذي اخترع النظرية المستخدمة في الخوارزمية ، وهو Thomas Bayes. نظريته ، كما قد تشك ، تفحص الاحتمال الشرطي للأحداث.
يتم حساب الاحتمالات على مستويين. أولا ، احتمال كل فئة. وثانيًا ، الاحتمال الشرطي وفقًا لعامل معين.
9. تعلم تكميم المتجهات
تعد خوارزمية Learning Vector Quantization ، أو LVQ ، واحدة من خوارزميات التعلم الآلي الأكثر تقدمًا .
على عكس kNN ، تمثل خوارزمية LVQ خوارزمية شبكة عصبية اصطناعية . بمعنى آخر ، يهدف إلى إعادة تكوين علم الأعصاب في الدماغ البشري.
تستخدم خوارزمية LVQ مجموعة من نواقل الكود كتمثيل. هذه في الأساس قوائم من الأرقام ، والتي لها نفس خصائص المدخلات والمخرجات مثل بيانات التدريب الخاصة بك.
10. دعم آلات المتجهات
هذه واحدة من أكثر خوارزميات التعلم الآلي شيوعًا .
تعد خوارزمية Support Vector Machines مناسبة للحالات القصوى من التصنيفات . المعنى - عندما تكون حدود قرار بيانات الإدخال غير واضحة. يعمل SVM كحدود أفضل لفصل فئات الإدخال.
يمكن استخدام SVMs في مجموعات البيانات متعددة الأبعاد. تقوم الخوارزمية بتحويل الفضاء غير الخطي إلى مساحة خطية. في بعدين يمكنك تصور المتغيرات كخط وبالتالي يكون لديك وقت أسهل في تحديد الارتباطات.
تم بالفعل استخدام SVMs في مجموعة متنوعة من المجالات في الحياة الواقعية:
- في التصوير الطبي ومهام التصنيف الطبي
- لدراسة جودة الهواء في المناطق المأهولة بالسكان بشكل كبير
- للمساعدة في التحليل المالي
- في خوارزميات ترتيب الصفحات لمحركات البحث
- للتعرف على النص والكائن.
يبدو مثل السكين السويسري لخوارزميات تعلم الآلة ، أليس كذلك؟
يتم إحتوائه
يمكن للبشر وأجهزة الكمبيوتر العمل معًا بنجاح.
باحثون يؤكدون لنا أن هذا يمكن الشراكة، وسوف تعطي نتائج مذهلة. تساعد خوارزميات التعلم الآلي البشرية بالفعل بعدة طرق.
يعد التصنيف من أهم وظائف التعلم الآلي وخوارزميات الذكاء الاصطناعي .
دعنا نرى أفضل 10 خوارزميات للتعلم الآلي مرة أخرى باختصار:
- الانحدار الخطي - تستخدم لتحديد العلاقة بين المتغيرات 2 - الانحدار اللوجستي - مصنف ذو الحدين ، لا يوجد سوى نتيجتين محتملتين لكل استعلام.
- التحليل التمييزي الخطي - يعمل بشكل أفضل لتصنيف البيانات بين الفئات المعروفة.
- K-Nearest Neighbor - لتصنيف البيانات إلى فئات.
- أشجار الانحدار - تستخدم في النمذجة التنبؤية.
- غابة عشوائية - تُستخدم مع مجموعات بيانات كبيرة ، وعندما تكون نسبة كبيرة من بيانات الإدخال مفقودة.
- AdaBoost - التصنيفات الثنائية.
- ساذج بايز - النمذجة التنبؤية.
- تعلم تكميم المتجهات - خوارزمية شبكة عصبية اصطناعية.
- دعم آلات المتجهات - الحالات القصوى من التصنيف في مجموعة بيانات متعددة الأبعاد.
كل هذه الخوارزميات (بالإضافة إلى الخوارزميات الجديدة التي لم تأتي بعد) ستضع الأساس لعصر جديد من الازدهار للبشرية. ستتيح (بل ومن الضروري) توفير دخل أساسي شامل لضمان بقاء الأشخاص الأقل قدرة. (من سوف يثور ويخرب مجتمعنا. حسنًا).
حسنًا ، من كان يظن أن مقالًا عن خوارزميات التعلم الآلي سيكون مثل هذا الخطأ. حسنًا ، هذا ما كان عليه اليوم.
نراكم قريبا شباب!
التعليمات
التعلم الآلي رائع ويسلط الضوء على مستقبل التكنولوجيا. هذا يأتي في بعض التكاليف. على سبيل المثال ، تستهلك أجهزة الكمبيوتر التي تستضيف برامج التعلم الآلي كميات هائلة من الكهرباء والموارد. هناك عيب آخر في التعلم الآلي حتى الآن وهو توضيح الكيان العرضي. في بعض الأحيان لا تستطيع الآلات التمييز بين ، دعنا نقول ، اسم آن هاثاواي وقيمة أسهم شركة بيركشاير هاثاواي. في كل مرة تحصل فيها الممثلة على بعض الاهتمام الإعلامي ، تكسب الشركة المال ...
التعلم الآلي هو طريقة الحساب. بينما تحتاج الخوارزميات "التقليدية" إلى مبرمج لكتابتها ، فإن خوارزميات التعلم الآلي تدرب نفسها بشكل أساسي. نعم ، لا تمزح!
هذا يعتمد على المهمة التي تحتاج إلى القيام بها. يعتمد اختيار أفضل خوارزمية للمهمة الحالية على حجم وجودة وتنوع المدخلات الخاصة بك ، بالإضافة إلى نوع بيانات الإخراج التي يطلبها المستخدم.
مثل أي شيء آخر ، تبدأ العملية بالتعرف على أساسيات الخوارزمية التي اخترتها لمشكلتك. سوف تحتاج إلى استشارة مصادر التعلم المختلفة واختيار المصدر الذي يناسبك بشكل أفضل. ثم ابدأ بتقسيم الخوارزمية إلى وحدات صغيرة. ابدأ بمثال بسيط ، وعندما تتحكم في الأشياء ، فإنك تتحقق من صحة ذلك من خلال تطبيق موثوق. ثم تكمل العملية برمتها. ربما يبدو الأمر أكثر صعوبة مما هو عليه. لكن الأمر يستحق المحاولة تمامًا!