كيف تغير معالجة اللغة الطبيعية طريقة البحث

نشرت: 2020-05-14

تسعى Google جاهدة لتعزيز أهمية القوائم المعروضة في صفحات نتائج محرك البحث (SERPs) مع كل تحديث للخوارزمية. التحديث الأخير لـ SERPs هو تمثيلات التشفير ثنائية الاتجاه من Google من المحولات (BERT) ، والتي تستخدم معالجة اللغة الطبيعية. يعتبر BERT أحد أهم التغييرات التي أدخلتها Google في السنوات الخمس الماضية - والتي تؤثر بشكل مباشر على واحد من كل 10 استعلامات بحث.

ويهدف إلى عرض نتائج أكثر صلة من خلال التفسير الصحيح لاستعلامات البحث المعقدة والمخصصة. في هذا المنشور ، سنناقش ما يعنيه هذا وكيف يغير طريقة البحث.

ما هو بيرت؟

إنها تقنية قائمة على الشبكة العصبية للتدريب المسبق على البرمجة اللغوية العصبية (NLP) والتي تمكن Google من تحديد سياق الكلمات في استعلام بحث معين بشكل أكثر دقة.

على سبيل المثال ، ضع في اعتبارك العبارات "ستة إلى 10" و "ربع إلى ستة" ، نفس حرف الجر "إلى" له معنى مختلف في كل عبارة ، والذي قد لا يكون واضحًا لمحركات البحث. ومع ذلك ، هنا حيث يصبح BERT مفيدًا ، حيث يمكنه التمييز بشكل فعال بين سياق حرف الجر في العبارة الأولى مقارنة بكيفية استخدامه في العبارة الثانية. من خلال فهم السياق ، يمكن أن يوفر نتائج أكثر صلة.

تسهل الشبكات العصبية للخوارزميات التعرف على الأنماط ، بينما يمكن للشبكات العصبية المدربة على مجموعات البيانات تحديد الأنماط. تتضمن تطبيقاته النموذجية محتوى الصور ، والتنبؤ باتجاهات السوق المالية وحتى التعرف على الكتابة اليدوية. في حين أن معالجة اللغة الطبيعية أو البرمجة اللغوية العصبية هي جزء بسيط من الذكاء الاصطناعي (AI) الذي يتعامل مع اللغويات.

  • تمكن البرمجة اللغوية العصبية لأجهزة الكمبيوتر من فهم كيفية تواصل البشر بشكل طبيعي.
  • تمكن خوارزميات البرمجة اللغوية العصبية (NLP) من التفسير والفهم والتعرف على أنماط اللغة.
  • تسلط نماذج البرمجة اللغوية العصبية الضوء على القواعد والكلمات لإيجاد معنى بكميات لا حصر لها من النص والكلام.

تشمل التطورات التي سهّلت من خلال البرمجة اللغوية العصبية (NLP) التي يستخدمها مستخدمو الإنترنت والشركات عبر الإنترنت كل يوم أدوات الاستماع الاجتماعي واقتراحات الكلمات وروبوتات الدردشة.

ماذا يعني هذا؟

BERT هي خوارزمية البرمجة اللغوية العصبية التي تستخدم الشبكات العصبية لإنتاج نماذج مدربة مسبقًا. يتم تدريب هذه النماذج باستخدام كميات لا حصر لها من البيانات المتاحة على الويب. النماذج المدربة مسبقًا هي نماذج عامة للغة البرمجة اللغوية العصبية يتم تحسينها بشكل أكبر لأداء مهام البرمجة اللغوية العصبية المحددة. في تشرين الثاني (نوفمبر) من العام الماضي ، قامت Google بفتح مصدر BERT ، مدعية أنها قدمت نتائج كاملة وذات صلة في 11 مهمة من مهام البرمجة اللغوية العصبية ، بما في ذلك مجموعة بيانات الإجابة على سؤال ستانفورد.

إن ثنائية الاتجاه لـ BERT تميزها عن الخوارزميات الأخرى ، حيث يتيح ذلك لها القدرة على إعطاء سياق لكلمة. يمكنه القيام بذلك ليس فقط من خلال النظر في أجزاء من الجملة التي تؤدي إلى تلك الكلمة ، ولكن أيضًا مع مراعاة الأجزاء التي تليها. تسمح ميزة ثنائية الاتجاه لمحركات البحث بفهم معنى كلمة مثل "فيلم" لها معنى مختلف عند استخدامها في "فيلم تظليل" بدلاً من استخدامها جنبًا إلى جنب مع "فيلم".

في البحث ، يسهل BERT فهم التفاصيل الأساسية للاستعلام ، خاصةً عندما يتعلق الأمر بالاستعلامات المعقدة والمحادثة أو تلك التي تحتوي على حروف جر فيها. على سبيل المثال ، في الاستعلام "يحتاج المسافر الهندي إلى بالي 2021 إلى تأشيرة" ، يشير حرف الجر "إلى" إلى أن المسافر ذاهب من الهند إلى بالي. من خلال تغيير حرف الجر ، يمكنك تغيير الجملة تمامًا ، والتي ستقرأ مثل "يحتاج مسافر هندي 2021 من بالي إلى تأشيرة" ، وقد يعني أن المسافرين من بالي ويحتاجون إلى تأشيرة للهند. يسمح BERT بفهم الاختلاف السياقي بين الجملتين.

ما الفرق بين BERT و RankBrain؟

كانت RankBrain أول طريقة ذكاء اصطناعي من Google تم تطبيقها في البحث. إنه يعمل بالتوازي مع خوارزميات ترتيب البحث العضوي ويقوم بإجراء تعديلات على النتائج المحسوبة بواسطة تلك الخوارزميات. يضبط RankBrain النتائج التي تقدمها الخوارزميات بناءً على الاستفسارات التاريخية.

يسهل RankBrain أيضًا Google في تفسير استعلامات البحث حتى يتمكن من عرض النتائج التي قد لا تحتوي على الكلمات نفسها مثل الاستعلام. على سبيل المثال ، عند البحث عن "ارتفاع معلم في دبي" ، سيُظهر لك تلقائيًا المعلومات المتعلقة ببرج خليفة.

من ناحية أخرى ، فإن المكون ثنائي الاتجاه لـ BERT يجعله يعمل بطريقة مختلفة تمامًا. عندما تنظر الخوارزميات التقليدية إلى المحتوى في الصفحة لقياس مدى الصلة بالموضوع ، فإن خوارزميات البرمجة اللغوية العصبية (NLP) تأخذها خطوة إلى الأمام من خلال النظر إلى المحتوى قبل أو بعد كلمة ما للحصول على سياق إضافي. نظرًا لأن التواصل البشري عادة ما يكون معقدًا ومتعدد الطبقات ، فإنه يجعل هذا التقدم في معالجة اللغة الطبيعية أمرًا ضروريًا.

معًا ، تستخدم Google BERT و RankBrain لمعالجة الاستفسارات وفهمها. BERT ليس بديلاً عن RankBrain ولكن يمكن تطبيقه جنبًا إلى جنب مع خوارزميات Google الأخرى أو بالاشتراك مع RankBrain ، اعتمادًا على مصطلح البحث.

تحسين البحث في المزيد من اللغات

من خلال القدرة على أخذ ما تعلمناه من لغة وتطبيقها على لغة أخرى ، يتم استخدام BERT لجعل نتائج البحث أكثر صلة بمستخدمي الإنترنت في جميع أنحاء العالم. على سبيل المثال ، ما تعلمناه من اللغات الأكثر استخدامًا على الويب ، مثل الإنجليزية ، يتم تطبيقه بعد ذلك على لغات أخرى. وبالتالي ، يتم تقديم نتائج محسّنة بلغات أخرى يبحث عنها الأشخاص أيضًا. علاوة على ذلك ، يعزز نموذج BERT أيضًا أهمية المقتطفات المميزة عبر البلدان واللغات.

كيف تؤثر BERT على عملك؟

يؤثر BERT أيضًا على مساعد Google من خلال تشغيله لتقديم مقتطفات مميزة أو نتائج ويب متأثرة بتحديث BERT. تعمل تقنية البرمجة اللغوية العصبية مثل BERT على تحسين فهم الآلة وهذا الابتكار مفيد بلا شك للعديد من المستخدمين والشركات عبر الإنترنت. ومع ذلك ، فيما يتعلق بـ SEO ، تظل المبادئ كما هي. إذا كانت لديك أفضل ممارسات تحسين محركات البحث (SEO) متأصلة في إستراتيجيتك التسويقية ، فيمكنك التأكد من نجاحك على الويب. ستستفيد مواقع الويب التي تنتج محتوى جديدًا وعالي الجودة وذات صلة وحديثة باستمرار من تحديث الخوارزمية هذا.

تعد كتابة محتوى فائق استنادًا إلى البحث عن الكلمات الرئيسية تمرينًا سيظل عامل ترتيب ذي أولوية عبر محركات البحث. أصحاب مواقع الويب الذين يركزون على حصول مستخدميهم على المحتوى الإعلامي والدقيق الذي يتوقعونه ، ينتهي بهم الأمر بترتيب جيد على SERP. ستساعد مراقبة أداء الصفحات أثناء إنشاء محتوى رائع مواقع الويب على أن تظل ذات صلة.

هل حل البرمجة اللغوية العصبية نية البحث؟

باستخدام BERT ، بغض النظر عن اللغة أو الكلمات المستخدمة في الاستعلام ، أصبحت فرص حصول Google على النتائج الصحيحة أعلى ولكنها لا تزال غير 100٪. على سبيل المثال ، حتى مع BERT ، أي شخص يبحث عن "ما هي الولاية الواقعة جنوب نبراسكا" ، فمن المحتمل أن يحصل على نتائج عن "جنوب نبراسكا" بدلاً من كانساس ، والتي من المحتمل أن تكون الإجابة التي يبحث عنها المستخدم.

تظل مساعدة الآلات على فهم اللغة مسعى مستمرًا واشتقاق معنى محدد من أي استعلام هو عملية معقدة. عندما يطبق Google البرمجة اللغوية العصبية على قائمة الكلمات الرئيسية الرئيسية ، فقد لا تحتوي أفضل النتائج المعروضة على بعض أو حتى واحدة فقط من الكلمات الرئيسية المطلوبة ، مما يجعل هذه النتائج غير ذات صلة. مع BERT ، صعدت Google من لعبتها من خلال تقديم تحديث متطور لخوارزميةها ، لكن البحث لا يزال يمثل مشكلة لم يتم حلها بسبب الطبيعة المعقدة للغة البشرية.