Bagaimana COVID-19 memengaruhi teknologi berbasis AI

Diterbitkan: 2020-10-13

Ringkasan 30 detik:

  • Munculnya COVID-19 telah mengkompromikan kegunaan kumpulan data yang dikompilasi sebelum pandemi – menghasilkan tingkat kesalahan yang signifikan pada platform AI yang mereka berdayakan.
  • Salah satu area yang terpengaruh oleh fenomena ini adalah vokalisasi. Sementara kumpulan data dikembangkan untuk mengakomodasi variabel kehidupan nyata seperti aksen dan kebisingan latar belakang, mereka tidak cukup beragam untuk membedakan perintah suara yang dikeluarkan dari balik masker wajah.
  • Sebagai contoh, model suara rata-rata mengalami penurunan kualitas 50 persen dari pengguna yang memakai masker wajah. Bahkan mesin dengan performa terbaik pun mengalami penurunan kualitas sebesar 25 persen. Dampaknya terasa paling tinggi di antara orang-orang dengan suara bernada tinggi, karena topeng meredam kejelasan suara bernada tinggi.
  • Peretasan cepat untuk mengurangi kata kunci dan kata-kata bermasalah dalam aplikasi yang didukung suara adalah dengan menggunakan data yang dikumpulkan oleh aplikasi itu sendiri untuk mengidentifikasi kata-kata yang salah ditranskripsikan; dan membiarkan aplikasi membuat asumsi yang mengoreksi transkripsi untuk menyampaikan makna yang diinginkan kepada pengguna.
  • Solusi jangka panjang adalah tentang meningkatkan kumpulan data dan mengumpulkan sampel suara yang benar-benar meniru skenario kehidupan nyata; yang pada saat ini perlu menyertakan suara ucapan yang teredam di berbagai lingkungan
  • Kumpulan data pengenalan wajah mengalami tantangan yang sama dari pemakai masker wajah.

Cara kita berinteraksi dengan teknologi terus berkembang. Kita semua ingat bagaimana mengetik perintah DOS pada keyboard memberi jalan pada kesederhanaan WYSIWYG dari Windows yang dinavigasi dengan mouse, dan hari ini, ada peningkatan penggunaan layar sentuh. Langkah evolusi besar berikutnya dalam antarmuka pengguna – dan ini besar – termasuk perintah suara, teknologi pengenalan wajah, dan kecerdasan buatan (AI).

Mesin berkemampuan AI akan menggunakan antarmuka ini untuk mengantisipasi, memprediksi, dan mengeksekusi banyak tugas – mempercepat proses dan benar-benar meminimalkan waktu yang dihabiskan pengguna untuk proses antarmuka.

Meskipun ini menunjukkan masa depan yang sangat menjanjikan, baru-baru ini rem telah diterapkan pada banyak proyek berbasis AI. Bagaimana bisa? Karena data yang dikumpulkan tidak lagi harus bersih, akurat, atau dapat diandalkan.

Itu terakumulasi di dunia pra-COVID-19, dan didasarkan pada asumsi yang diambil dari pasar pra-pandemi.

Jadi seperti seorang arsitek yang menemukan semua pengukuran pada cetak biru proyek mereka salah, itu kembali ke papan gambar untuk sejumlah inisiatif AI.

Mari kita lihat lebih dekat tantangannya.

Aksesibilitas adalah yang pertama dan terpenting

Tujuannya adalah untuk mempermudah akses informasi dan layanan bagi semua orang.

Untuk tujuan ini, teknologi pengenalan wajah telah berkembang pesat, sekarang digunakan secara luas untuk check-in bandara, sebagai fitur keamanan untuk membuka kunci ponsel dan tablet kami, dan untuk memberikan akses ke area terlarang.

Pengalaman yang mendukung suara juga menjadi lebih umum. Kami melihat kios pintar yang diaktifkan dengan suara di restoran cepat saji kami, misalnya, di mana kentang goreng Anda dipesan hanya menggunakan suara Anda dan chatbot yang diaktifkan dengan suara, bukan pekerja yang sibuk memenuhi pesanan, yang sekarang menawarkan dukungan pelanggan dan semua peningkatan penjualan ke ukuran super.

Ini semua adalah cara yang bagus untuk mengakses informasi dan saat kita mulai mengasimilasinya ke dalam kehidupan normal kita, ternyata teknologi ini mungkin perlu diubah, secara dramatis, karena dikembangkan dan dilatih untuk dunia pra-pandemi.

Bagaimana pandemi mempengaruhi AI?

Teknologi suara dikembangkan dengan asumsi bahwa pemberitahuan yang cukup jelas akan disediakan oleh pelanggan.

Model AI yang menginterpretasikan data vokal tidak dilatih untuk menangani perintah yang diredam oleh masker wajah – karena mereka terutama bekerja dengan membandingkan suara yang diterima dengan korpus ucapan dengan transkripsi yang terkait dengan sampel suara ucapan yang jelas.

Ini berarti bahwa di dunia pandemi, pengalaman pelanggan berbasis suara yang sukses semakin sulit untuk disampaikan.

Demikian pula, karena masker wajah menutupi sebagian besar wajah seseorang, model Computer Vision sekarang hanya menerima informasi dari bagian atas wajah pelanggan… skenario data yang seharusnya tidak mereka tangani

Faktanya, sebuah studi oleh Institut Standar dan Teknologi Nasional AS (NIST) telah menemukan bahwa algoritma pengenalan wajah yang dikembangkan sebelum munculnya pandemi COVID-19 memiliki “kesulitan besar” dalam mengidentifikasi orang secara akurat.

Studi NIST mengungkapkan: “Bahkan yang terbaik dari 89 algoritma pengenalan wajah komersial yang diuji memiliki tingkat kesalahan antara 5% dan 50% dalam mencocokkan masker wajah yang diterapkan secara digital dengan foto orang yang sama tanpa masker.”

Akibatnya, pelanggan dibiarkan dengan pengalaman pengguna yang tidak menyenangkan yang mengharuskan mereka untuk kembali ke antarmuka "manual", yang secara signifikan menghambat proses identifikasi.

Bagaimana AI tetap relevan di dunia pandemi modern?

Model AI menggunakan data untuk melatih, membuat asumsi, dan kemudian memberikan respons kepada pengguna. Data ini kemudian merupakan kumpulan data yang merupakan seluruh kumpulan data yang dibandingkan dengan operasi saat ini.

Hingga baru-baru ini, model AI telah dilatih dengan data milik dunia non-pandemi, di mana wajah sepenuhnya terlihat dan vokalisasi tidak terhalang oleh topeng.

Pandemi COVID-19 membuat platform AI kami lengah dan AI akan membutuhkan waktu untuk beradaptasi dengan lingkungan baru. Agar Pengalaman Suara dan Pengenalan Wajah tetap relevan, kumpulan data perlu disesuaikan dengan yang baru hari ini.

Bagaimana teknologi suara AI direkayasa ulang?

Peretasan cepat untuk mengurangi kata kunci dan kata-kata bermasalah dalam aplikasi yang didukung suara adalah dengan menggunakan data yang dikumpulkan oleh aplikasi itu sendiri untuk mengidentifikasi kata-kata yang salah ditranskripsikan; dan membiarkan aplikasi membuat asumsi yang mengoreksi transkripsi untuk menyampaikan makna yang diinginkan kepada pengguna.

Misalnya, aplikasi yang didukung suara di lingkungan makanan cepat saji yang mentranskripsikan “Bolehkah saya mendapatkan sepatu oranye?” harus memperhitungkan bahwa apa yang kemungkinan besar dimaksudkan oleh pengguna adalah "jus jeruk" dan memperbaiki kesalahan dari model pada tingkat aplikasi, atau meminta konfirmasi dari pengguna akhir.

Pada akhirnya, pengembang perlu merekayasa ulang aplikasi untuk meningkatkan kumpulan data dan mengumpulkan sampel suara yang benar-benar meniru skenario kehidupan nyata; yang pada titik ini perlu menyertakan suara ucapan yang teredam di berbagai lingkungan.

Bagaimana pengenalan wajah AI direkayasa ulang?

Saat ini, solusi tertentu sedang diadopsi untuk menghindari hanya mengandalkan pengenalan wajah – misalnya, Apple iPhone sekarang menonaktifkan opsi ID Wajah ketika masker wajah terdeteksi.

“Jika perusahaan [pengenalan wajah] tidak melihat ini, tidak menganggapnya serius, saya tidak melihat mereka ada lebih lama lagi,” kata Shaun Moore, CEO Trueface, yang menciptakan teknologi pengenalan wajah yang digunakan oleh angkatan udara AS.

Hasilnya sudah terlihat, teknologi Computer Vision sekarang digunakan untuk mengenali orang yang memakai masker di tempat umum atau sebelum memasuki toko dan itu menunjukkan bahwa teknologi itu juga bisa digunakan untuk keselamatan diri sendiri.

Kesimpulan

Untuk mengatasi tantangan yang ditimbulkan oleh pandemi, para ilmuwan data mengumpulkan dan menganalisis data baru dan relevan untuk berhasil mengadaptasi model mereka guna melayani pelanggan akhir mereka dengan benar.

Jika dulu pengumpulan data suara dari suara teredam diatur dalam kasus yang jarang dan spesifik, sekarang menjadi prioritas. Hal yang sama berlaku untuk kumpulan data pengenalan wajah yang diperluas untuk mengenali gambar orang dengan masker wajah, yang pada dasarnya bekerja dengan area di sekitar mata.

Ini akan memakan waktu, tetapi perusahaan bergerak lebih cepat untuk beradaptasi dengan kenyataan baru ini. Seiring bertambahnya jumlah data yang dikumpulkan, model AI akan menjadi lebih pintar dan memiliki lebih sedikit kesulitan dalam melayani pelanggan akhir dan membuat teknologi mudah diakses kembali.

Sergio Bruccoleri adalah Arsitek Teknologi Utama di Pactera EDGE.