In che modo il COVID-19 sta influenzando la tecnologia basata sull'intelligenza artificiale

Pubblicato: 2020-10-13

Riepilogo di 30 secondi:

  • L'avvento di COVID-19 ha compromesso l'utilità dei set di dati che sono stati compilati prima della pandemia, con conseguenti tassi di errore significativi sulle piattaforme di intelligenza artificiale che abilitano.
  • Un'area interessata da questo fenomeno è la vocalizzazione. Sebbene i set di dati siano stati sviluppati per adattarsi a variabili della vita reale come accenti e rumore di fondo, non sono abbastanza diversi da distinguere i comandi vocali emessi da una maschera facciale.
  • Ad esempio, i modelli vocali hanno registrato in media una perdita di qualità del 50 percento da parte degli utenti che indossavano maschere per il viso. Anche il motore più performante ha subito una perdita di qualità del 25%. L'impatto è stato sentito più alto tra le persone con voci acute, poiché le maschere hanno attutito l'intelligibilità dei suoni acuti
  • Un rapido trucco per mitigare le parole chiave e le parole problematiche in un'applicazione vocale consiste nell'utilizzare i dati raccolti dall'applicazione stessa per identificare le parole che vengono trascritte in modo errato; e per consentire all'applicazione di formulare ipotesi che correggano la trascrizione al fine di fornire il significato previsto all'utente.
  • La soluzione a lungo termine consiste nell'aumentare il set di dati e nel raccogliere campioni vocali che imitano effettivamente lo scenario della vita reale; che a questo punto dovrà includere voci ovattate in un'ampia varietà di ambienti
  • I set di dati di riconoscimento facciale stanno vivendo la stessa sfida da chi indossa la maschera facciale.

I modi in cui interagiamo con la tecnologia sono in continua evoluzione. Ricordiamo tutti come la digitazione di comandi DOS su una tastiera abbia lasciato il posto alla semplicità WYSIWYG di Windows con navigazione tramite mouse e oggi c'è un crescente utilizzo dei touch screen. Il prossimo grande passo evolutivo nelle interfacce utente – ed è grande – include comandi vocali, tecnologie di riconoscimento facciale e intelligenza artificiale (AI).

Le macchine abilitate per l'intelligenza artificiale utilizzeranno queste interfacce per anticipare, prevedere ed eseguire una moltitudine di attività, accelerando i processi e riducendo al minimo il tempo che gli utenti dedicano al processo di interfacciamento.

Anche se questo indica un futuro molto promettente, recentemente sono stati applicati dei freni a molti progetti basati sull'intelligenza artificiale. Come mai? Perché i dati raccolti non sono più necessariamente puliti, accurati o affidabili.

È stato accumulato in un mondo pre-COVID-19 e si basava su ipotesi tratte da un mercato pre-pandemia.

Quindi, come un architetto che scopre che tutte le misurazioni sul progetto del suo progetto non sono corrette, è tornato al tavolo da disegno per una serie di iniziative di intelligenza artificiale.

Diamo un'occhiata più da vicino alla sfida.

L'accessibilità è prima di tutto

L'obiettivo è rendere più facile per tutti l'accesso alle informazioni e ai servizi.

A tal fine, la tecnologia di riconoscimento facciale è cresciuta in modo esponenziale, ora ampiamente utilizzata per i check-in aeroportuali, come funzione di sicurezza per sbloccare i nostri telefoni e tablet e per garantire l'accesso alle aree riservate.

Anche le esperienze abilitate alla voce stanno diventando più comuni. Stiamo vedendo chioschi intelligenti ad attivazione vocale nei nostri ristoranti fast food, ad esempio, dove le tue patatine vengono ordinate usando solo la tua voce e sono chatbot abilitati alla voce, non lavoratori impegnati a soddisfare gli ordini, che ora offrono assistenza clienti e tutti quegli upsell a superdimensionato.

Questi sono tutti ottimi modi per accedere alle informazioni e proprio quando abbiamo iniziato ad assimilarli nelle nostre vite normali, risulta che queste tecnologie potrebbero aver bisogno di essere cambiate, drasticamente, poiché sono state sviluppate e addestrate per un mondo pre-pandemia.

In che modo la pandemia influenza l'IA?

Le tecnologie vocali sono state sviluppate partendo dal presupposto che l'annuncio ragionevolmente chiaro sarebbe stato fornito dal cliente.

I modelli di intelligenza artificiale che interpretano i dati vocali non sono stati addestrati per gestire i comandi attutiti da una maschera facciale, poiché funzionano principalmente confrontando i suoni ricevuti con i corpi vocali con trascrizioni legate a campioni vocali chiari.

Ciò significa che in un mondo di pandemia, un'esperienza cliente basata sulla voce di successo è diventata molto più difficile da fornire.

Allo stesso modo, poiché una maschera facciale copre la maggior parte del viso di una persona, i modelli di Visione artificiale ora ricevono informazioni solo dalla metà superiore del viso del cliente... uno scenario di dati che non avrebbero dovuto gestire

In effetti, uno studio del National Institute of Standards and Technology (NIST) degli Stati Uniti ha scoperto che gli algoritmi di riconoscimento facciale sviluppati prima dell'emergere della pandemia di COVID-19 hanno "grandi difficoltà" nell'identificare con precisione le persone.

Lo studio del NIST rivela: "Anche il migliore degli 89 algoritmi commerciali di riconoscimento facciale testati aveva tassi di errore tra il 5% e il 50% nell'abbinamento di maschere per il viso applicate digitalmente con foto della stessa persona senza maschera".

Di conseguenza, il cliente viene lasciato con un'esperienza utente sgradevole che richiede di tornare alle interfacce "manuali", ostacolando in modo significativo il processo di identificazione.

In che modo l'intelligenza artificiale rimane rilevante in un mondo pandemico moderno?

I modelli di intelligenza artificiale utilizzano i dati per addestrare, formulare ipotesi e quindi fornire una risposta all'utente. Questi dati costituiscono quindi il set di dati che è l'intero batch di dati con cui viene confrontata l'operazione corrente.

Fino a poco tempo fa, i modelli di intelligenza artificiale erano stati addestrati con dati che appartenevano a un mondo non pandemico, in cui i volti erano completamente visibili e le vocalizzazioni non erano ostruite dalle maschere.

La pandemia di COVID-19 ha colto alla sprovvista le nostre piattaforme di intelligenza artificiale e l'intelligenza artificiale avrà bisogno di tempo per adattarsi al nuovo ambiente. Affinché le esperienze vocali e il riconoscimento facciale rimangano pertinenti, i set di dati devono adattarsi al nuovo oggi.

Come viene riprogettata la tecnologia vocale AI?

Un rapido trucco per mitigare le parole chiave e le parole problematiche in un'applicazione vocale consiste nell'utilizzare i dati raccolti dall'applicazione stessa per identificare le parole che vengono trascritte in modo errato; e per consentire all'applicazione di formulare ipotesi che correggano la trascrizione al fine di fornire il significato previsto all'utente.

Ad esempio, un'applicazione vocale in un ambiente di fast food che trascrive "Posso avere delle scarpe arancioni?" dovrebbe tenere in considerazione che ciò che l'utente molto probabilmente intendeva è "succo d'arancia" e riparare l'errore dal modello a livello di applicazione, o chiedere conferma all'utente finale.

In definitiva, gli sviluppatori dovranno riprogettare l'applicazione per aumentare il set di dati e raccogliere campioni vocali che imitano effettivamente gli scenari della vita reale; che a questo punto dovrà includere voci ovattate in un'ampia varietà di ambienti.

Come viene riprogettato il riconoscimento facciale tramite intelligenza artificiale?

In questo momento, vengono adottate alcune soluzioni alternative per evitare di fare affidamento esclusivamente sul riconoscimento facciale: ad esempio, gli iPhone Apple ora disabilitano l'opzione Face ID quando viene rilevata una maschera facciale.

"Se le aziende [di riconoscimento facciale] non stanno guardando questo, non lo stanno prendendo sul serio, non prevedo che resteranno in giro ancora per molto", ha affermato Shaun Moore, CEO di Trueface, che crea una tecnologia di riconoscimento facciale utilizzata da l'aeronautica americana.

I risultati stanno già mostrando, la tecnologia Computer Vision viene ora utilizzata per riconoscere le persone che indossano maschere nei luoghi pubblici o prima di entrare in un negozio e quindi sta dimostrando che la tecnologia può essere utilizzata anche per la propria sicurezza.

Conclusioni

Per superare la sfida posta dalla pandemia, i data scientist stanno raccogliendo e analizzando dati nuovi e pertinenti per adattare con successo i loro modelli per servire adeguatamente i loro clienti finali.

Mentre in passato la raccolta dei dati vocali del parlato ovattato era regolamentata in casi rari e specifici, ora sta diventando una priorità. Lo stesso vale per i set di dati di riconoscimento facciale che si stanno espandendo per riconoscere immagini di persone con maschere facciali, fondamentalmente lavorando con l'area intorno agli occhi.

Ci vorrà tempo, ma le aziende si stanno muovendo più velocemente per adattarsi a questa nuova realtà. Man mano che la quantità di dati raccolti cresce, i modelli di intelligenza artificiale diventeranno più intelligenti e avranno meno difficoltà a servire i clienti finali e renderanno la tecnologia facilmente accessibile di nuovo.

Sergio Bruccoleri è Lead Technology Architect di Pactera EDGE.