COVID-19, yapay zeka tabanlı teknolojiyi nasıl etkiliyor?
Yayınlanan: 2020-10-1330 saniyelik özet:
- COVID-19'un ortaya çıkışı, pandemi öncesi derlenen veri kümelerinin kullanışlılığını tehlikeye atarak, güçlendirdikleri yapay zeka platformlarında önemli hata oranlarına neden oldu.
- Bu fenomenden etkilenen bir alan seslendirmedir. Veri kümeleri, vurgular ve arka plan gürültüsü gibi gerçek yaşam değişkenlerini barındırmak için geliştirilmiş olsa da, bir yüz maskesinin arkasından verilen sesli komutları ayırt edecek kadar çeşitli değildir.
- Örneğin, ses modelleri yüz maskesi takan kullanıcılardan ortalama yüzde 50 kalite kaybı yaşadı. En iyi performans gösteren motor bile yüzde 25 kalite kaybı yaşadı. Maskeler tiz seslerin anlaşılırlığını boğduğu için, etki tiz sesli insanlar arasında en yüksek düzeyde hissedildi.
- Sesle çalışan bir uygulamadaki sorunlu anahtar sözcükleri ve sözcükleri hafifletmek için hızlı bir yol, uygulamanın kendisi tarafından toplanan verileri yanlış biçimde kopyalanan sözcükleri belirlemek için kullanmaktır; ve uygulamanın, kullanıcıya amaçlanan anlamı iletmek için transkripsiyonu düzelten varsayımlar yapmasına izin vermek.
- Uzun vadeli çözüm, tamamen veri kümesini artırmak ve gerçek hayat senaryosunu taklit eden ses örneklerini toplamakla ilgilidir; bu noktada çok çeşitli ortamlarda boğuk konuşma seslerini içermesi gerekecek
- Yüz tanıma veri setleri, yüz maskesi takanlardan aynı zorluğu yaşıyor.
Teknolojiyle etkileşim kurma yöntemlerimiz sürekli olarak gelişmektedir. Hepimiz bir klavyede DOS komutlarını yazmanın, fareyle gezinen Windows'un WYSIWYG basitliğine nasıl yol açtığını hatırlıyoruz ve bugün, dokunmatik ekranların kullanımı giderek artıyor. Kullanıcı arayüzlerindeki bir sonraki büyük evrimsel adım – ve çok büyük – sesli komutları, yüz tanıma teknolojilerini ve yapay zekayı (AI) içerir.
AI özellikli makineler, çok sayıda görevi öngörmek, tahmin etmek ve yürütmek için bu arayüzleri kullanacak - süreçleri hızlandıracak ve aslında kullanıcıların arayüz sürecine ayırdığı zamanı en aza indirecek.
Bu çok umut verici bir geleceğe işaret ederken, son zamanlarda birçok AI tabanlı projeye fren uygulandı. Nasıl olur? Çünkü toplanan veriler artık mutlaka temiz, doğru veya güvenilir değil.
COVID-19 öncesi bir dünyada birikmişti ve pandemi öncesi bir pazardan alınan varsayımlara dayanıyordu.
Bir mimarın projesinin planındaki tüm ölçümlerin yanlış olduğunu keşfetmesi gibi, bir dizi AI girişimi için çizim tahtasına geri döndü.
Hadi meydan okumaya daha yakından bakalım.
Erişilebilirlik her şeyden önce
Amaç, bilgi ve hizmetlere erişimi herkes için kolaylaştırmaktır.
Bu amaçla, yüz tanıma teknolojisi katlanarak büyüdü ve artık havalimanı check-in'lerinde, telefonlarımızın ve tabletlerimizin kilidini açmak ve kısıtlı alanlara erişim sağlamak için bir güvenlik özelliği olarak yaygın bir şekilde kullanılıyor.
Sesle etkinleştirilen deneyimler de daha yaygın hale geliyor. Örneğin, patates kızartmalarınızın yalnızca sesinizi kullanarak sipariş edildiği fast food restoranlarımızda sesle etkinleştirilen akıllı kiosklar görüyoruz ve artık müşteri desteği ve tüm bu ek satışları sunan, siparişleri yerine getirmekle meşgul işçiler değil, sesli sohbet robotları var. süper boyut.
Bunların hepsi bilgiye erişmenin harika yollarıdır ve onları normal yaşamlarımıza asimile etmeye başladığımızda, bu teknolojilerin pandemi öncesi bir dünya için geliştirilip eğitildikleri için önemli ölçüde değiştirilmesi gerekebileceği ortaya çıktı.
Salgın yapay zekayı nasıl etkiler?
Ses teknolojileri, müşteri tarafından makul ölçüde net bir bildirimin sağlanacağı varsayımı altında geliştirildi.
Ses verilerini yorumlayan yapay zeka modelleri, bir yüz maskesi tarafından susturulan komutları işlemek için eğitilmediler - çünkü bunlar öncelikle alınan sesleri konuşma gövdeleriyle ve net konuşma ses örneklerine bağlı transkripsiyonlarla karşılaştırarak çalışırlar.
Bu, pandemi dünyasında başarılı bir ses tabanlı müşteri deneyimi sunmanın çok daha zor hale geldiği anlamına geliyor.
Benzer şekilde, bir yüz maskesi bir kişinin yüzünün çoğunu kapladığı için, Computer Vision modelleri artık yalnızca müşterinin yüzünün üst yarısından bilgi alıyor…
Aslında ABD Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) tarafından yapılan bir araştırma, COVID-19 pandemisinin ortaya çıkmasından önce geliştirilen yüz tanıma algoritmalarının insanları doğru bir şekilde tanımlamada "büyük zorluk" yaşadığını buldu.
NIST araştırması şunu ortaya koyuyor: "Test edilen 89 ticari yüz tanıma algoritmasının en iyisi bile, dijital olarak uygulanan yüz maskelerini aynı kişinin maskesiz fotoğraflarıyla eşleştirmede %5 ile %50 arasında hata oranlarına sahipti."
Sonuç olarak, müşteri, tanımlama sürecini önemli ölçüde engelleyen "manuel" arayüzlere geri dönmelerini gerektiren hoş olmayan bir kullanıcı deneyimi ile karşı karşıya kalır.
Yapay zeka modern bir pandemik dünyada nasıl alakalı kalır?
Yapay zeka modelleri, verileri eğitmek, varsayımlarda bulunmak ve ardından kullanıcıya yanıt vermek için kullanır. Bu veriler daha sonra mevcut işlemin karşılaştırıldığı tüm veri yığını olan veri kümesini oluşturur.
Yakın zamana kadar, AI modelleri, yüzlerin tamamen görülebildiği ve seslendirmelerin maskeler tarafından engellenmediği, salgın olmayan bir dünyaya ait verilerle eğitilmişti.
COVID-19 salgını, AI platformlarımızı hazırlıksız yakaladı ve AI'nın yeni ortama uyum sağlaması için zamana ihtiyacı olacak. Ses Deneyimleri ve Yüz Tanıma'nın alakalı kalması için veri kümelerinin bugün yeniye ayarlanması gerekiyor.
AI ses teknolojisi nasıl yeniden tasarlanıyor?
Sesle çalışan bir uygulamadaki sorunlu anahtar sözcükleri ve sözcükleri hafifletmek için hızlı bir yol, uygulamanın kendisi tarafından toplanan verileri yanlış biçimde kopyalanan sözcükleri belirlemek için kullanmaktır; ve uygulamanın, kullanıcıya amaçlanan anlamı iletmek için transkripsiyonu düzelten varsayımlar yapmasına izin vermek.
Örneğin, bir fast food ortamında "Biraz turuncu ayakkabı alabilir miyim?" yazan sesle çalışan bir uygulama. kullanıcının büyük olasılıkla "portakal suyu" demek istediğini dikkate almalı ve modeldeki hatayı uygulama düzeyinde düzeltmeli veya son kullanıcıdan onay istemelidir.
Sonuç olarak, geliştiricilerin veri kümesini artırmak ve gerçek hayat senaryolarını gerçekten taklit eden ses örneklerini toplamak için uygulamayı yeniden tasarlamaları gerekecek; bu noktada çok çeşitli ortamlarda boğuk konuşma seslerini içermesi gerekecek.
AI yüz tanıma nasıl yeniden tasarlanıyor?
Şu anda, yalnızca yüz tanımaya güvenmekten kaçınmak için belirli geçici çözümler benimseniyor - örneğin, Apple iPhone'lar artık bir yüz maskesi algılandığında Yüz Kimliği seçeneğini devre dışı bırakıyor.
Yüz tanıma teknolojisini yaratan Trueface'in CEO'su Shaun Moore, "[Yüz tanıma] şirketleri buna bakmıyorsa, ciddiye almıyorsa, onların daha uzun süre ortalıkta kalacağını tahmin etmiyorum" dedi. ABD Hava Kuvvetleri.
Sonuçlar şimdiden kendini gösteriyor, Computer Vision teknolojisi artık halka açık yerlerde veya bir mağazaya girmeden önce maske takan insanları tanımak için kullanılıyor ve bu, teknolojinin kendi güvenliği için de kullanılabileceğini gösteriyor.
Sonuçlar
Pandeminin getirdiği zorluğun üstesinden gelmek için veri bilimcileri, modellerini son müşterilerine doğru şekilde hizmet edecek şekilde başarılı bir şekilde uyarlamak için yeni ve ilgili verileri topluyor ve analiz ediyor.
Geçmişte, boğuk konuşmanın ses verilerinin toplanması nadir ve özel durumlarda düzenlenirken, şimdi bir öncelik haline geliyor. Aynısı, temelde göz çevresiyle çalışan yüz maskeli insanların görüntülerini tanımak için genişleyen yüz tanıma veri kümeleri için de geçerlidir.
Zaman alacak, ancak şirketler bu yeni gerçeğe uyum sağlamak için daha hızlı hareket ediyor. Toplanan veri miktarı arttıkça, yapay zeka modelleri daha akıllı hale gelecek ve son müşterilere hizmet vermekte daha az zorluk çekecek ve teknolojiyi yeniden kolayca erişilebilir hale getirecek.
Sergio Bruccoleri, Pactera EDGE'de Baş Teknoloji Mimarıdır.