โควิด-19 ส่งผลต่อเทคโนโลยีที่ใช้ AI อย่างไร

เผยแพร่แล้ว: 2020-10-13

สรุป 30 วินาที:

  • การถือกำเนิดของโควิด-19 ได้ส่งผลกระทบต่อประโยชน์ของชุดข้อมูลที่รวบรวมก่อนเกิดโรคระบาด ส่งผลให้อัตราข้อผิดพลาดมีนัยสำคัญบนแพลตฟอร์ม AI ที่พวกเขาสนับสนุน
  • พื้นที่หนึ่งที่ได้รับผลกระทบจากปรากฏการณ์นี้คือการเปล่งเสียง แม้ว่าชุดข้อมูลจะได้รับการพัฒนาเพื่อรองรับตัวแปรในชีวิตจริง เช่น เสียงเน้นและเสียงรบกวนรอบข้าง แต่ก็ไม่ได้มีความหลากหลายมากพอที่จะแยกแยะคำสั่งเสียงออกจากเบื้องหลังหน้ากากได้
  • ตัวอย่างเช่น โมเดลเสียงประสบกับการสูญเสียคุณภาพโดยเฉลี่ย 50 เปอร์เซ็นต์จากผู้ใช้ที่สวมหน้ากาก แม้แต่เครื่องยนต์ที่มีสมรรถนะดีที่สุดก็ยังสูญเสียคุณภาพถึง 25 เปอร์เซ็นต์ ผู้คนที่มีเสียงแหลมสูงรู้สึกได้ถึงผลกระทบสูงสุด เนื่องจากหน้ากากปิดบังความชัดเจนของเสียงสูง
  • แฮ็คด่วนเพื่อลดคีย์เวิร์ดและคำที่มีปัญหาในแอพพลิเคชั่นที่ขับเคลื่อนด้วยเสียงคือการใช้ข้อมูลที่รวบรวมโดยแอพพลิเคชั่นเองเพื่อระบุคำที่ถอดเสียงอย่างไม่ถูกต้อง และเพื่อให้แอปพลิเคชันสร้างสมมติฐานที่แก้ไขการถอดความเพื่อส่งมอบความหมายที่ตั้งใจไว้ให้กับผู้ใช้
  • วิธีแก้ปัญหาระยะยาวคือการเพิ่มชุดข้อมูลและรวบรวมตัวอย่างเสียงที่เลียนแบบสถานการณ์จริง ซึ่ง ณ เวลานี้จะต้องรวมเสียงพูดที่ไม่ชัดในสภาพแวดล้อมที่หลากหลาย
  • ชุดข้อมูลการจดจำใบหน้ากำลังประสบปัญหาเดียวกันจากผู้สวมหน้ากาก

วิธีที่เราโต้ตอบกับเทคโนโลยีมีการพัฒนาอย่างต่อเนื่อง เราทุกคนจำได้ว่าการพิมพ์คำสั่ง DOS บนแป้นพิมพ์ทำให้เกิดความเรียบง่ายแบบ WYSIWYG ของ Windows ที่ใช้เมาส์นำทาง และในปัจจุบันมีการใช้งานหน้าจอสัมผัสเพิ่มมากขึ้น ก้าวต่อไปของวิวัฒนาการครั้งใหญ่ในอินเทอร์เฟซผู้ใช้ ซึ่งใหญ่มาก ได้แก่ คำสั่งเสียง เทคโนโลยีการจดจำใบหน้า และปัญญาประดิษฐ์ (AI)

เครื่องที่เปิดใช้งาน AI จะใช้อินเทอร์เฟซเหล่านี้เพื่อคาดการณ์ คาดการณ์ และดำเนินการกับงานจำนวนมาก - เร่งกระบวนการและลดเวลาที่ผู้ใช้ทุ่มเทให้กับกระบวนการเชื่อมต่อ

แม้ว่าสิ่งนี้จะชี้ให้เห็นถึงอนาคตที่สดใส แต่เมื่อเร็วๆ นี้ ระบบได้นำระบบเบรกไปใช้กับโครงการที่ใช้ AI หลายโครงการ มาได้ยังไง? เนื่องจากข้อมูลที่รวบรวมไม่จำเป็นต้องสะอาด แม่นยำ หรือเชื่อถือได้อีกต่อไป

มันถูกสะสมในโลกก่อนเกิดโควิด-19 และตั้งอยู่บนสมมติฐานที่ดึงมาจากตลาดก่อนเกิดโรคระบาด

เช่นเดียวกับสถาปนิกที่ค้นพบการวัดทั้งหมดบนพิมพ์เขียวของโครงการไม่ถูกต้อง ก็กลับไปที่กระดานวาดภาพสำหรับความคิดริเริ่มด้าน AI จำนวนหนึ่ง

มาดูความท้าทายกันดีกว่า

การเข้าถึงเป็นสิ่งแรกและสำคัญที่สุด

เป้าหมายคือทำให้ทุกคนเข้าถึงข้อมูลและบริการได้ง่ายขึ้น

ด้วยเหตุนี้ เทคโนโลยีการจดจำใบหน้าจึงเติบโตขึ้นอย่างทวีคูณ ซึ่งขณะนี้มีการใช้กันอย่างแพร่หลายสำหรับการเช็คอินที่สนามบิน เป็นคุณลักษณะด้านความปลอดภัยสำหรับการปลดล็อกโทรศัพท์และแท็บเล็ตของเรา และสำหรับการอนุญาตให้เข้าถึงพื้นที่จำกัด

ประสบการณ์ที่ใช้เสียงก็กลายเป็นเรื่องธรรมดามากขึ้นเช่นกัน เราเห็นสมาร์ทคีออสก์สั่งงานด้วยเสียงในร้านอาหารฟาสต์ฟู้ดของเรา เช่น ที่ที่คุณสั่งเฟรนช์ฟรายโดยใช้เพียงเสียงของคุณ และเป็นแชทบอทที่สั่งงานด้วยเสียง ไม่ใช่พนักงานที่ยุ่งกับการปฏิบัติตามคำสั่ง ซึ่งขณะนี้ให้การสนับสนุนลูกค้าและการขายต่อยอดเหล่านี้ให้กับ ซุปเปอร์ไซส์

ทั้งหมดนี้เป็นวิธีที่ยอดเยี่ยมในการเข้าถึงข้อมูล และในขณะที่เราเริ่มรวมเข้ากับชีวิตปกติของเรา ปรากฏว่าเทคโนโลยีเหล่านี้อาจต้องมีการเปลี่ยนแปลงอย่างมาก เนื่องจากเทคโนโลยีเหล่านี้ได้รับการพัฒนาและฝึกฝนสำหรับโลกก่อนเกิดโรคระบาด

การระบาดใหญ่ส่งผลกระทบต่อ AI อย่างไร

เทคโนโลยีเสียงได้รับการพัฒนาภายใต้สมมติฐานว่าลูกค้าจะเป็นผู้แจ้งประกาศที่ชัดเจนตามสมควร

โมเดล AI ที่ตีความข้อมูลเสียงร้องไม่ได้รับการฝึกฝนให้จัดการกับคำสั่งที่ปิดเสียงโดยหน้ากาก เนื่องจากทำงานโดยหลักโดยการเปรียบเทียบเสียงที่ได้รับกับคลังคำพูดที่มีการถอดความที่เชื่อมโยงกับตัวอย่างเสียงพูดที่ชัดเจน

ซึ่งหมายความว่าในโลกที่แพร่ระบาด ประสบการณ์ลูกค้าด้วยเสียงที่ประสบความสำเร็จนั้นยากขึ้นมากในการส่งมอบ

ในทำนองเดียวกัน เนื่องจากหน้ากากปิดบังใบหน้าส่วนใหญ่ ดังนั้นโมเดล Computer Vision จึงได้รับข้อมูลจากครึ่งบนของใบหน้าของลูกค้าเท่านั้น… สถานการณ์ข้อมูลที่พวกเขาไม่คาดว่าจะต้องรับมือ

อันที่จริง การศึกษาโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติของสหรัฐอเมริกา (NIST) พบว่าอัลกอริธึมการจดจำใบหน้าที่พัฒนาขึ้นก่อนเกิดการระบาดใหญ่ของโควิด-19 มี "ความยากลำบากอย่างมาก" ในการระบุตัวบุคคลได้อย่างแม่นยำ

ผลการศึกษาของ NIST เปิดเผยว่า "แม้แต่อัลกอริธึมการจดจำใบหน้าเชิงพาณิชย์ที่ดีที่สุด 89 รายการที่ได้รับการทดสอบก็มีอัตราข้อผิดพลาดระหว่าง 5% ถึง 50% ในการจับคู่มาสก์หน้าแบบดิจิทัลที่มีรูปถ่ายของบุคคลคนเดียวกันโดยไม่สวมหน้ากาก"

เป็นผลให้ลูกค้าได้รับประสบการณ์การใช้งานที่ไม่พึงประสงค์ซึ่งต้องการให้พวกเขาเปลี่ยนกลับเป็นอินเทอร์เฟซ "แบบแมนนวล" ซึ่งขัดขวางกระบวนการระบุตัวตนอย่างมาก

AI มีความเกี่ยวข้องอย่างไรในโลกการระบาดใหญ่ยุคใหม่?

โมเดล AI ใช้ข้อมูลในการฝึก ตั้งสมมติฐาน แล้วตอบสนองผู้ใช้ ข้อมูลนี้จะประกอบเป็นชุดข้อมูลซึ่งเป็นชุดข้อมูลทั้งหมดที่เปรียบเทียบการดำเนินการปัจจุบัน

จนกระทั่งเมื่อไม่นานนี้ แบบจำลอง AI ได้รับการฝึกด้วยข้อมูลที่เป็นของโลกที่ไม่เกิดโรคระบาด โดยที่ใบหน้าจะมองเห็นได้ชัดเจนและเสียงพูดไม่ถูกบังด้วยหน้ากาก

การระบาดใหญ่ของ COVID-19 ทำให้แพลตฟอร์ม AI ของเราไม่ปลอดภัย และ AI จะต้องใช้เวลาในการปรับตัวเข้ากับสภาพแวดล้อมใหม่ เพื่อให้ประสบการณ์เสียงและการจดจำใบหน้ามีความเกี่ยวข้อง ชุดข้อมูลจำเป็นต้องปรับให้เข้ากับชุดข้อมูลใหม่ในวันนี้

เทคโนโลยีเสียง AI ถูกออกแบบใหม่อย่างไร?

แฮ็คด่วนเพื่อลดคีย์เวิร์ดและคำที่มีปัญหาในแอพพลิเคชั่นที่ขับเคลื่อนด้วยเสียงคือการใช้ข้อมูลที่รวบรวมโดยแอพพลิเคชั่นเองเพื่อระบุคำที่ถอดเสียงอย่างไม่ถูกต้อง และเพื่อให้แอปพลิเคชันสร้างสมมติฐานที่แก้ไขการถอดความเพื่อส่งมอบความหมายที่ตั้งใจไว้ให้กับผู้ใช้

ตัวอย่างเช่น แอปพลิเคชันที่ขับเคลื่อนด้วยเสียงในสภาพแวดล้อมฟาสต์ฟู้ดที่เขียนว่า "ขอรองเท้าสีส้มหน่อยได้ไหม" ควรคำนึงว่าสิ่งที่ผู้ใช้น่าจะหมายถึงคือ "น้ำส้ม" และแก้ไขข้อผิดพลาดจากรุ่นในระดับแอปพลิเคชัน หรือขอให้ผู้ใช้ยืนยันขั้นสุดท้าย

ในท้ายที่สุด นักพัฒนาจะต้องออกแบบแอปพลิเคชันใหม่เพื่อเพิ่มชุดข้อมูลและรวบรวมตัวอย่างเสียงที่เลียนแบบสถานการณ์จริง ซึ่ง ณ จุดนี้จะต้องรวมเสียงพูดที่ไม่ชัดในสภาพแวดล้อมที่หลากหลาย

การจดจำใบหน้าของ AI ถูกออกแบบใหม่อย่างไร?

ขณะนี้ มีการนำวิธีแก้ปัญหาบางอย่างมาใช้เพื่อหลีกเลี่ยงการพึ่งพาการจดจำใบหน้าเพียงอย่างเดียว เช่น ตอนนี้ Apple iPhones ปิดใช้งานตัวเลือก Face ID เมื่อตรวจพบหน้ากาก

“หากบริษัท [การจดจำใบหน้า] ไม่ได้ดูสิ่งนี้ ไม่ได้จริงจังกับมัน ฉันไม่คาดว่าพวกเขาจะอยู่กันนานกว่านี้” ฌอน มัวร์ ซีอีโอของ Trueface ซึ่งสร้างเทคโนโลยีการจดจำใบหน้าที่ใช้โดย กองทัพอากาศสหรัฐ

ผลลัพธ์ที่ได้แสดงให้เห็นแล้ว ปัจจุบันเทคโนโลยี Computer Vision ใช้เพื่อจดจำผู้ที่สวมหน้ากากในที่สาธารณะหรือก่อนเข้าไปในร้าน จึงแสดงว่าเทคโนโลยีนี้สามารถนำไปใช้เพื่อความปลอดภัยของตนเองได้เช่นกัน

บทสรุป

เพื่อเอาชนะความท้าทายที่กำหนดโดยการระบาดใหญ่ นักวิทยาศาสตร์ด้านข้อมูลกำลังรวบรวมและวิเคราะห์ข้อมูลใหม่และที่เกี่ยวข้องเพื่อปรับแบบจำลองให้ประสบความสำเร็จเพื่อให้บริการแก่ลูกค้าปลายทางได้อย่างเหมาะสม

ในอดีต การรวบรวมข้อมูลเสียงของคำพูดที่ไม่ออกเสียงนั้นถูกควบคุมในบางกรณีและเฉพาะเจาะจง ตอนนี้จึงกลายเป็นเรื่องสำคัญอันดับต้นๆ เช่นเดียวกับชุดข้อมูลการจดจำใบหน้าที่กำลังขยายเพื่อจดจำภาพของผู้ที่สวมหน้ากาก ซึ่งโดยทั่วไปแล้วจะทำงานกับบริเวณรอบดวงตา

ต้องใช้เวลา แต่บริษัทต่างๆ ต่างเดินหน้าปรับตัวให้เข้ากับความเป็นจริงใหม่นี้ได้เร็วขึ้น เมื่อปริมาณข้อมูลที่รวบรวมเพิ่มขึ้น โมเดล AI จะฉลาดขึ้นและมีปัญหาน้อยลงในการให้บริการลูกค้าปลายทาง และทำให้เทคโนโลยีเข้าถึงได้ง่ายอีกครั้ง

Sergio Bruccoleri เป็นสถาปนิกชั้นนำด้านเทคโนโลยีที่ Pactera EDGE