كيف يؤثر COVID-19 على التكنولوجيا القائمة على الذكاء الاصطناعي

نشرت: 2020-10-13

ملخص 30 ثانية:

  • أدى ظهور COVID-19 إلى الإضرار بفائدة مجموعات البيانات التي تم تجميعها قبل الجائحة - مما أدى إلى معدلات خطأ كبيرة على منصات الذكاء الاصطناعي التي تم تمكينها.
  • أحد المجالات التي تأثرت بهذه الظاهرة هو النطق. بينما تم تطوير مجموعات البيانات لاستيعاب متغيرات الحياة الواقعية مثل اللهجات وضوضاء الخلفية ، فهي ليست متنوعة بما يكفي لتمييز الأوامر الصوتية الصادرة من خلف قناع الوجه.
  • على سبيل المثال ، عانت النماذج الصوتية في المتوسط ​​من فقدان الجودة بنسبة 50 في المائة من المستخدمين الذين يرتدون أقنعة الوجه. حتى المحرك الأفضل أداءً تعرض لخسارة في الجودة بنسبة 25 بالمائة. كان التأثير أكبر لدى الأشخاص ذوي النبرة العالية ، حيث قامت الأقنعة بكتم وضوح الأصوات عالية النبرة
  • يتمثل الاختراق السريع للتخفيف من الكلمات الرئيسية والكلمات التي بها مشكلات في تطبيق يعمل بالطاقة الصوتية في استخدام البيانات التي تم جمعها بواسطة التطبيق نفسه لتحديد الكلمات التي يتم نسخها بشكل غير صحيح ؛ والسماح للتطبيق بوضع افتراضات تصحح النسخ من أجل إيصال المعنى المقصود للمستخدم.
  • يتعلق الحل طويل المدى بزيادة مجموعة البيانات وجمع عينات صوتية تحاكي بالفعل سيناريو الحياة الواقعية ؛ والتي ستحتاج في هذا الوقت إلى تضمين أصوات الكلام المكتومة في مجموعة متنوعة من البيئات
  • تواجه مجموعات بيانات التعرف على الوجوه نفس التحدي من مرتدي أقنعة الوجه.

تتطور الطرق التي نتفاعل بها مع التكنولوجيا باستمرار. نتذكر جميعًا كيف أفسحت كتابة أوامر DOS على لوحة المفاتيح المجال لبساطة WYSIWYG لنظام Windows الذي يتم التنقل فيه بالماوس ، واليوم ، هناك استخدام متزايد لشاشات اللمس. تتضمن الخطوة التطورية الكبيرة التالية في واجهات المستخدم - وهي كبيرة - الأوامر الصوتية وتقنيات التعرف على الوجه والذكاء الاصطناعي (AI).

ستستخدم الأجهزة الممكّنة للذكاء الاصطناعي هذه الواجهات للتنبؤ بالعديد من المهام والتنبؤ بها وتنفيذها - تسريع العمليات وتقليل الوقت الذي يخصصه المستخدمون لعملية التفاعل.

في حين أن هذا يشير إلى مستقبل واعد للغاية ، فقد تم تطبيق الفرامل مؤخرًا على العديد من المشاريع القائمة على الذكاء الاصطناعي. كيف ذلك؟ لأن البيانات التي تم جمعها لم تعد بالضرورة نظيفة أو دقيقة أو موثوقة.

لقد تراكمت في عالم ما قبل COVID-19 ، واستندت إلى افتراضات مستمدة من سوق ما قبل الوباء.

لذا ، مثلما اكتشف المهندس المعماري أن جميع القياسات في مخطط مشروعه غير صحيحة ، فقد عاد إلى لوحة الرسم لعدد من مبادرات الذكاء الاصطناعي.

دعونا نلقي نظرة فاحصة على التحدي.

الوصول هو أولا وقبل كل شيء

الهدف هو تسهيل الوصول إلى المعلومات والخدمات للجميع.

تحقيقًا لهذه الغاية ، نمت تقنية التعرف على الوجوه بشكل كبير ، حيث يتم الآن نشرها على نطاق واسع لعمليات تسجيل الوصول في المطار ، كميزة أمنية لفتح هواتفنا وأجهزتنا اللوحية ، ومنح الوصول إلى المناطق المحظورة.

أصبحت التجارب التي تدعم الصوت أكثر شيوعًا أيضًا. نشاهد أكشاكًا ذكية تعمل بالصوت في مطاعمنا للوجبات السريعة ، على سبيل المثال ، حيث يتم طلب البطاطس المقلية باستخدام صوتك فقط وروبوتات الدردشة التي تدعم الصوت ، وليس العمال المشغولين بالوفاء بالطلبات ، والتي تقدم الآن دعم العملاء وكل هذه الارتفاعات إلى يحل محل.

هذه كلها طرق رائعة للوصول إلى المعلومات ، وكما بدأنا في استيعابها في حياتنا الطبيعية ، اتضح أن هذه التقنيات قد تحتاج إلى تغيير كبير ، حيث تم تطويرها وتدريبها لعالم ما قبل الجائحة.

كيف يؤثر الوباء على الذكاء الاصطناعي؟

تم تطوير تقنيات الصوت على أساس افتراض أن الإعلان الواضح بشكل معقول سيقدم من قبل العميل.

لم يتم تدريب نماذج الذكاء الاصطناعي التي تفسر البيانات الصوتية على التعامل مع الأوامر التي تم كتمها بواسطة قناع الوجه - لأنها تعمل بشكل أساسي من خلال مقارنة الأصوات المستلمة مع مجموعات الكلام مع النسخ المرتبطة بنماذج صوتية واضحة للكلام.

هذا يعني أنه في عالم الوباء ، أصبح تقديم تجربة عملاء قائمة على الصوت أصعب بكثير.

وبالمثل ، نظرًا لأن قناع الوجه يغطي معظم مظهر الشخص ، فإن نماذج رؤية الكمبيوتر لا تتلقى الآن سوى معلومات من النصف العلوي من وجه العميل ... سيناريو بيانات لم يكن من المتوقع أن يضطروا للتعامل معه

في الواقع ، وجدت دراسة أجراها المعهد الوطني الأمريكي للمعايير والتكنولوجيا (NIST) أن خوارزميات التعرف على الوجه التي تم تطويرها قبل ظهور جائحة COVID-19 تواجه "صعوبة كبيرة" في تحديد الأشخاص بدقة.

كشفت دراسة NIST: "حتى أفضل خوارزميات التعرف على الوجه التجارية البالغ عددها 89 خوارزمية التي تم اختبارها كانت بها معدلات خطأ بين 5٪ و 50٪ في مطابقة أقنعة الوجه المطبقة رقميًا مع صور الشخص نفسه بدون قناع."

ونتيجة لذلك ، يترك العميل تجربة مستخدم غير سارة تتطلب منه الرجوع إلى الواجهات "اليدوية" ، مما يعيق بشكل كبير عملية تحديد الهوية.

كيف يظل الذكاء الاصطناعي مناسبًا في عالم وبائي حديث؟

تستخدم نماذج الذكاء الاصطناعي البيانات للتدريب ، ووضع افتراضات ، ثم تقديم استجابة للمستخدم. تشكل هذه البيانات بعد ذلك مجموعة البيانات التي تمثل مجموعة البيانات الكاملة التي تتم مقارنة العملية الحالية بها.

حتى وقت قريب ، تم تدريب نماذج الذكاء الاصطناعي باستخدام بيانات تنتمي إلى عالم غير وبائي ، حيث كانت الوجوه مرئية بالكامل ولم يتم حجب الأصوات بواسطة الأقنعة.

لقد تسبب جائحة COVID-19 في عدم حراسة منصات الذكاء الاصطناعي الخاصة بنا وسيحتاج الذكاء الاصطناعي إلى وقت للتكيف مع البيئة الجديدة. لكي تظل التجارب الصوتية والتعرف على الوجوه ملائمة ، تحتاج مجموعات البيانات إلى التكيف مع الجديد اليوم.

كيف يتم إعادة هندسة تقنية الصوت AI؟

يتمثل الاختراق السريع للتخفيف من الكلمات الرئيسية والكلمات التي بها مشكلات في تطبيق يعمل بالطاقة الصوتية في استخدام البيانات التي تم جمعها بواسطة التطبيق نفسه لتحديد الكلمات التي يتم نسخها بشكل غير صحيح ؛ والسماح للتطبيق بوضع افتراضات تصحح النسخ من أجل إيصال المعنى المقصود للمستخدم.

على سبيل المثال ، تطبيق يعمل بالصوت في بيئة وجبات سريعة يكتب "هل يمكنني الحصول على بعض الأحذية البرتقالية؟" يجب أن يأخذ في الاعتبار أن ما قصده المستخدم على الأرجح هو "عصير برتقال" وإصلاح الخطأ من النموذج على مستوى التطبيق ، أو اطلب من المستخدم النهائي التأكيد.

في النهاية ، سيحتاج المطورون إلى إعادة هندسة التطبيق لزيادة مجموعة البيانات وجمع عينات صوتية تحاكي سيناريوهات الحياة الواقعية ؛ والتي ستحتاج في هذه المرحلة إلى تضمين أصوات الكلام المكتومة في مجموعة متنوعة من البيئات.

كيف يتم إعادة هندسة التعرف على الوجه بالذكاء الاصطناعي؟

في الوقت الحالي ، يتم اعتماد بعض الحلول لتجنب الاعتماد فقط على التعرف على الوجوه - على سبيل المثال ، تقوم أجهزة Apple iPhone الآن بتعطيل خيار Face ID عند اكتشاف قناع الوجه.

قال شون مور ، الرئيس التنفيذي لشركة Trueface ، التي تبتكر تقنية التعرف على الوجه التي يستخدمها القوات الجوية الأمريكية.

تظهر النتائج بالفعل ، تُستخدم تقنية Computer Vision الآن للتعرف على الأشخاص الذين يرتدون أقنعة في الأماكن العامة أو قبل دخولهم متجرًا ، وبالتالي تظهر إمكانية استخدام التكنولوجيا من أجل سلامتهم أيضًا.

الاستنتاجات

من أجل التغلب على التحدي الذي يمثله الوباء ، يقوم علماء البيانات بجمع وتحليل البيانات الجديدة وذات الصلة لتكييف نماذجهم بنجاح لخدمة عملائهم النهائيين بشكل صحيح.

بينما في الماضي ، تم تنظيم جمع البيانات الصوتية للكلام المكتوم في حالات نادرة ومحددة ، أصبح الآن أولوية. وينطبق الشيء نفسه على مجموعات بيانات التعرف على الوجوه التي تتوسع للتعرف على صور الأشخاص الذين يرتدون أقنعة الوجه ، والتي تعمل أساسًا مع المنطقة حول العينين.

سيستغرق الأمر وقتًا ، لكن الشركات تتحرك بشكل أسرع للتكيف مع هذا الواقع الجديد. مع زيادة كمية البيانات التي يتم جمعها ، ستصبح نماذج الذكاء الاصطناعي أكثر ذكاءً وستواجه صعوبة أقل في خدمة العملاء النهائيين وتسهيل الوصول إلى التكنولوجيا مرة أخرى.

Sergio Bruccoleri هو مهندس التكنولوجيا الرائد في Pactera EDGE.