Clonazione vocale AI: tutto ciò che devi sapere per ora
Pubblicato: 2023-06-12L'intelligenza artificiale (AI) è diventata molto più credibile, con un esempio recente che è l'immagine virale del Papa in giacca a sbuffo che inganna molti.
Ma le immagini non sono gli unici contenuti che l'intelligenza artificiale può produrre in modo convincente: sta emergendo anche la clonazione della voce dell'IA, che essenzialmente imita la propria voce per diversi casi d'uso. Un esempio è l'imitazione della voce del presidente Joe Biden durante il suo discorso sullo stato dell'Unione.
Si sta rivelando un altro strumento significativo con un elevato potenziale commerciale, ma può sollevare preoccupazioni etiche e legali.
Questo articolo ti darà un'idea di come funziona l'IA della clonazione vocale, delle preoccupazioni di cui devi essere consapevole e di cosa puoi aspettarti dal futuro di questa tecnologia. Come bonus, ti mostreremo alcune app che puoi utilizzare per clonare la tua voce, ovviamente in modo etico.
Che cos'è la clonazione vocale AI?
La clonazione vocale AI utilizza un software di intelligenza artificiale per creare una voce quasi identica di un oratore, imitando qualsiasi cosa, dalle pronunce delle sillabe ai modelli di intonazione.
Si differenzia dalla sintesi vocale, in cui l'IA utilizza voci diverse e predefinite per sostituire il parlato. Entrambi sono spesso usati insieme poiché una volta che hai un clone vocale AI, puoi usarlo per dire quello che vuoi in qualsiasi lingua o emozione.
La clip audio da cui il software di clonazione vocale deve imparare non deve essere lunga. McAfee riferisce che una clip vocale di tre secondi è abbastanza lunga da consentire all'intelligenza artificiale di apprendere e copiare l'oratore.
Il potenziale di questa tecnologia è sbalorditivo, poiché i governi di tutto il mondo stanno ancora determinando le migliori leggi e normative da applicare per il suo utilizzo sicuro. Nel frattempo, molte persone hanno già iniziato a sperimentare strumenti di intelligenza artificiale del clone vocale per vari scopi.
Lo stato attuale della clonazione vocale AI
Proprio come con l'intelligenza artificiale basata su chat e che genera foto, le persone in tutto il mondo stanno ancora cercando di capire come utilizzare al meglio gli strumenti di intelligenza artificiale clonati. Di seguito è riportata una panoramica generale di come le persone e le aziende utilizzano la clonazione vocale AI.
Aumento del software di clonazione vocale AI gratuito
La capacità di clonare la voce non è esclusiva degli esperti di tecnologia o dei super ricchi. Poiché numerose aziende ora offrono software di clonazione vocale a prezzi variabili, non sorprende che il mercato cresca a un tasso di crescita annuale composto (CAGR) del 17,2% entro il 2028.
Naturalmente, la qualità dell'output potrebbe non essere convincente quanto i servizi a pagamento, ma il numero di aziende che offrono il tipo di software sottolinea la domanda.
Replicare le voci delle celebrità
Imitare le voci delle celebrità è diventato il caso d'uso più popolare della clonazione vocale dell'intelligenza artificiale, spingendo i confini creativi e disegnando potenziali problemi legali. Molte persone famose, tra cui Taylor Swift, Joe Rogan ed ex presidenti degli Stati Uniti, sono state vittime della clonazione vocale AI.
Un recente esempio significativo si è verificato nell'aprile 2023, quando l'utente di TikTok ghostwriter977 ha pubblicato la canzone "Heart on my Sleeve", utilizzando le voci degli artisti internazionali Drake e The Weeknd, nonostante nessuno cantasse o fosse collegato al progetto a qualsiasi titolo.
Molti sostengono che sia la prima canzone virale generata dall'intelligenza artificiale, che ha ricevuto oltre 230.000 visualizzazioni su YouTube e 625.000 stream su Spotify prima che i colpi di copyright di Universal Music Group, l'etichetta degli artisti, la eliminassero.
Le celebrità dei giorni nostri non sono le uniche a far replicare le loro voci.
I realizzatori del documentario The Andy Warhol Diaries hanno utilizzato un software per creare una voce sintetica del famoso artista pop, Andy Warhol, per narrare parti del suo diario, riportando in vita la sua voce ed evidenziando come la tecnologia abbia il potenziale per preservare a lungo l'identità di qualcuno dopo che sono passati.
Fornisce maggiore accessibilità per le persone con disabilità
Uno dei casi d'uso più pratici dell'intelligenza artificiale della clonazione vocale è quello di aiutare coloro che rischiano di perdere la voce o la capacità di parlare a causa di complicazioni di salute, come quelli a cui è stata recentemente diagnosticata la SLA (sclerosi laterale amiotrofica), a preservare la propria voce.
Un esempio è la funzione Personal Voice di Apple, che il marchio ha presentato in anteprima nel maggio 2023. Il software consente agli utenti di creare una voce sintetica che la loro famiglia e i loro amici possano riconoscere. Tutto quello che devono fare è leggere ad alta voce parti di testi randomizzati per 15 minuti affinché il software impari e replichi accuratamente il loro profilo vocale.

Un servizio simile, CoeFont, è in fase di sviluppo in Giappone che offre anche l'uso gratuito per le persone che hanno difficoltà a parlare, come quelli che balbettano oa cui viene diagnosticata la disfonia. Hanno riferito che più di 400 utenti hanno utilizzato il loro servizio dal lancio nel maggio 2023.
Duplicazione e localizzazione dei contenuti
Più aziende comprendono la necessità di contenuti localizzati nel mondo globalizzato, soprattutto perché circa sette consumatori su dieci (68%) affermano che passerebbero a un marchio che offre contenuti nella loro lingua madre.
Il metodo tradizionale per localizzare il contenuto sarebbe assumere un traduttore o doppiatori stranieri per doppiare il contenuto. Tuttavia, grazie alle innovazioni tecnologiche, potrebbe essere facoltativo.
Il doppiaggio AI sta diventando una tendenza emergente per consentire ai creatori di contenuti e alle società di produzione di doppiare i propri contenuti per vari mercati internazionali senza assumere artisti di doppiaggio stranieri. Le società di intrattenimento possono ora pubblicare serie, film e canzoni in diverse lingue per attirare il pubblico locale.
Un esempio è l'artista K-pop Midnatt che pubblica la sua canzone, "Masquerade", in inglese e utilizza la voce AI per rilasciare versioni in sei lingue. Gli spettatori che guardano il video musicale su YouTube possono fare clic su Impostazioni per cambiare la traccia audio nella loro lingua e sentire la differenza.
La sua etichetta discografica è stata persino in grado di sintetizzare la sua voce di donna in modo che potesse essere presente nella sua canzone, presentando vaste opportunità creative per i musicisti solisti.
Contribuire alle truffe
La creazione di una voce sintetica ha permesso ai criminali informatici di truffare vittime senza pretese, come ha sperimentato Jennifer DeStefano, una madre in Arizona, all'inizio di aprile 2023. Ha ricevuto una telefonata preoccupante da quella che credeva essere sua figlia, che piangeva e diceva di essere stata rapita e i criminali hanno chiesto un riscatto. Tuttavia, sua figlia è sempre stata al sicuro.
La Federal Trade Commission (FTC) degli Stati Uniti ha affermato che l'intelligenza artificiale ha consentito ai truffatori di migliorare i loro schemi di emergenza familiare, rendendo molto più convincente per te sentire una persona cara dire che è nei guai. In questi momenti, alcuni esperti consigliano di concordare una "safeword AI" con i propri cari per assicurarsi che la voce provenga effettivamente da loro.

Indipendentemente da ciò, le implicazioni negative del software di clonazione vocale AI pubblicamente accessibile sono chiare. Molte persone hanno sollevato dubbi etici e legali su questa tecnologia di cui dovresti essere a conoscenza se intendi clonare la tua voce.
Preoccupazioni etiche e legali della clonazione vocale AI
Gli organi di governo, le aziende e gli utenti stanno ancora lavorando per comprendere tutte le preoccupazioni etiche e legali che un clone vocale AI può portare. Sebbene sia ancora una tecnologia nascente, di seguito sono riportati alcuni problemi prevalenti di cui è necessario essere consapevoli.

Consenso e implicazioni sulla privacy
La facilità con cui i truffatori possono addestrare il software di clonazione vocale per apprendere voci specifiche mette i creatori di contenuti e i musicisti a rischio di frode e impersonificazione. Questi casi mettono in dubbio se gli artisti e i creatori di contenuti debbano proteggere o meno le loro voci.
Inoltre, i mezzi di sussistenza delle persone sono minacciati poiché il potenziale di furto di identità è molto più elevato.
Minaccia la privacy e la sicurezza informatica consentendo ai criminali di aggirare i sistemi di autenticazione basati sulla voce. Ciò è accaduto al Centrelink e all'Australian Taxation Office (ATO), dove i criminali hanno utilizzato una voce sintetica per ingannare i sistemi di sicurezza dell'impronta vocale destinati a verificare le identità attraverso il riconoscimento vocale.
Disinformazione e manipolazione
I deepfake di intelligenza artificiale continuano a essere un argomento caldo di discussione, minacciando di dividere e manipolare le comunità. La preoccupazione è che l'intelligenza artificiale della clonazione vocale si stia evolvendo per diventare altamente convincente più velocemente di quanto i governi possano regolarla.
Può manipolare e influenzare la reputazione di una celebrità se i troll online rilasciano l'audio di una celebrità che pronuncia commenti offensivi o battute; un esempio recente è la voce dell'attrice britannica Emma Watson che legge il Mein Kampf di Hitler.
Impatto sui doppiatori umani e spostamento del lavoro
Molte persone si preoccupano della sicurezza del proprio lavoro poiché l'IA diventa sempre più in grado di svolgere compiti tradizionalmente umani. La clonazione vocale dell'intelligenza artificiale minaccia i doppiatori, in particolare.
Ci sono già stati incidenti in cui i doppiatori sono rimasti scioccati nello scoprire che l'IA copiava la loro voce affinché le persone la usassero per i loro progetti. Nel febbraio 2023, alcuni doppiatori di videogiochi hanno pubblicamente condannato i contratti che hanno ricevuto, chiedendo loro di cedere le loro voci ad AI.
Cosa ne sarà dei doppiatori se sarà diventato molto più facile usare l'intelligenza artificiale per narrare o doppiare i contenuti per te? È una domanda che vale la pena esaminare poiché può potenzialmente causare il lavoro di migliaia di doppiatori.
Lo stato della clonazione vocale AI è complicato. Molti stanno ancora sperimentando la tecnologia. Detto questo, vale la pena considerare cosa riserva il futuro per la clonazione vocale AI.
Cosa puoi aspettarti con la clonazione vocale AI
Non è impostato nulla sull'intelligenza artificiale della clonazione vocale. Mentre il mondo continua a comprendere e scoprire le possibilità di questa tecnologia, è meglio considerare cosa potrebbe riservarle il futuro.
1. Regolamentazione governativa più severa e discussioni etiche più ampie
I governi probabilmente imporranno regolamenti più severi sull'utilizzo dell'intelligenza artificiale per la clonazione vocale. Il senatore Richard Blumenthal ha evidenziato quanto sia diventato convincente il software di clonazione vocale facendo recitare alla tecnologia la sua dichiarazione di apertura in una recente udienza al Senato degli Stati Uniti.
Cosa potrebbero includere queste normative e politiche? Possono affrontare le cui voci possono essere clonate tramite l'IA e definire gli scopi esatti della tecnologia. Potrebbe stabilire che le aziende debbano rivelare se utilizzano o meno l'intelligenza artificiale vocale per uno qualsiasi dei loro processi. Inoltre, i tribunali devono ancora determinare chi detiene i diritti su una voce generata dall'intelligenza artificiale.
Questi parametri legali potrebbero aiutare le persone a proteggersi dai rischi e dai pericoli dell'IA vocale clonata.
2. Maggiore utilizzo per la creazione di contenuti
Esistono usi etici per le app di clonazione vocale. Ad esempio, il software di clonazione vocale può essere uno strumento di produttività se sei un creatore di contenuti video che produce contenuti YouTube senza volto. Addestrare l'intelligenza artificiale per imitare la tua voce può ridurre significativamente i tempi di produzione poiché non dovrai più passare ore a registrare e ri-registrare l'audio davanti a un microfono.
Un altro è il marketing basato sull'intelligenza artificiale, che consente di sfruttare l'intelligenza artificiale per produrre materiali a un ritmo molto più rapido e a un costo inferiore rispetto a prima.
3. Più rivelatori AI
Con quanto è diventata convincente l'intelligenza artificiale, la capacità di discernere se un contenuto è autenticamente umano è fondamentale per evitare di cadere nella disinformazione. Puoi aspettarti di vedere più persone creare rilevatori più affidabili per garantire che, non importa quanto sia convincente un contenuto, tutto ciò che consumi sia creato da un essere umano.
4. Maggiore popolarità della voce AI nel settore dell'intrattenimento
L'industria cinematografica sta diventando sempre più a suo agio con il doppiaggio AI, con la Motion Picture Association (MPA) che ha recentemente assegnato la certificazione alla startup di doppiaggio AI Deepdub. Questo titolo garantisce che l'intelligenza artificiale della startup possa soddisfare gli elevati standard dell'industria dell'intrattenimento.
Deepdub non è il solo a offrire servizi di intelligenza artificiale all'industria dell'intrattenimento. Molti venture capitalist hanno iniziato a investire in numerose startup di intelligenza artificiale per portare l'intelligenza artificiale nelle società di produzione cinematografica come Netflix, Marvel e Lucasfilm.
In uno sviluppo simile, la società di intelligenza artificiale Flawless ha annunciato nel maggio 2023 che sta collaborando con distributori statunitensi e britannici per rilasciare versioni in inglese di film non inglesi in diverse regioni, doppiate e sincronizzate con le labbra dall'IA.
Con gli esperti che si aspettano che il settore valga 416,8 miliardi di dollari entro il 2030, l'intelligenza artificiale è pronta a diventare più integrata per produrre più contenuti di alta qualità per i servizi di streaming.
App di clonazione vocale popolari
Se vuoi clonare la tua voce tramite software, ecco alcuni strumenti popolari che puoi provare.
Assomiglia.AI

Resemble.AI offre vari prodotti e servizi per aiutarti a creare una voce sintetica di cui sei soddisfatto. Ad esempio, se desideri sostituire alcune parole nell'audio registrato senza ri-registrare, la loro funzione Resemble Fill ti aiuterà a modificare la clip senza problemi.
Hanno anche un'API personalizzata AI Voices che gli sviluppatori possono integrare in vari strumenti che già utilizzano. La loro intelligenza artificiale per la clonazione della voce avrà bisogno solo di almeno tre minuti di audio o di pronunciare 25 frasi predeterminate per apprendere le voci.
Tra le righe

BeyondWords ha una libreria di oltre 550 voci AI in più di 140 lingue create eticamente; l'azienda collabora con doppiatori attraverso il suo contratto di clonazione vocale. Usano anche l'elaborazione del linguaggio naturale (NLP) per analizzare il testo dell'utente e convertirlo in un discorso dal suono autentico.
Risponditore

Respeecher è orgoglioso di consentire a creatori di contenuti, registi e sviluppatori di giochi di creare voci sintetiche. In particolare, hanno lavorato con aziende come Lucasfilms per generare una voce generata dall'intelligenza artificiale per un attore più anziano che riprende il suo ruolo più giovane e Mondelez International per produrre marketing altamente mirato e localizzato.
L'azienda utilizza sia algoritmi di elaborazione del segnale digitale che un modello generativo profondo per consentire alla sua intelligenza artificiale di apprendere e imitare non solo la voce ma anche le emozioni e la consegna dei passaggi.
Undici laboratori

Molti conoscono Eleven Labs per la loro libreria di voci di celebrità, che puoi utilizzare prontamente per i tuoi contenuti con il loro prodotto VoiceLab. Hanno mostrato la loro esperienza doppiando il discorso di Leonardo DiCaprio alle Nazioni Unite con altre celebrità, come Joe Rogan e Steve Jobs.
L'azienda mira a generare voci dal suono realistico con il suo modello di intelligenza artificiale incentrato sulla cattura della logica e delle emozioni nei testi con la sua piattaforma di sintesi vocale. Raccoglie il contesto di ogni frase e paragrafo per capire come intonare e parlare in modo convincente.
GiocaHT

PlatHT ha una libreria di voci che puoi clonare per i tuoi progetti, da Elon Musk e Neil DeGrasse Tyson a John F. Kennedy e Barack Obama. Il loro software di clonazione vocale in tempo reale ti consente di creare una voce sintetica che cattura lo stile del parlato e preserva l'accento e le sfumature del parlato del soggetto.
La loro intelligenza artificiale per la clonazione della voce richiederà almeno un'ora di audio parlato chiaro per avviare l'analisi vocale e il processo di apprendimento.
È importante notare che tutte queste aziende hanno delineato l'etica dietro i loro prodotti, che puoi visualizzare sul loro sito web.
Tenere l'orecchio a terra
La clonazione della voce AI può avere notevoli effetti sulla società, sia positivi che negativi. Mentre da un lato, le aziende possono utilizzare la tecnologia per aiutare le persone a continuare a "parlare" molto tempo dopo aver perso la voce a causa di condizioni mediche o i creatori per ridurre i tempi di produzione.
Detto questo, l'intelligenza artificiale della clonazione vocale non è completamente esente da preoccupazioni etiche o legali. I truffatori possono ancora usarlo per impersonare persone in schemi di emergenza familiare o per aggirare gli autenticatori vocali per accedere a dati altamente sensibili e riservati.
Mentre i governi continuano a discutere possibili leggi e politiche sull'uso appropriato dell'IA, spetta alle aziende private utilizzarla in modo più responsabile. Ciò include seguire le migliori pratiche di sicurezza informatica, come chiedere il consenso per l'accesso ai dati dei consumatori e praticare la trasparenza con il modo in cui si utilizza la tecnologia.
L'AI per la clonazione vocale continua a evolversi. Rimanere aggiornato sui suoi ultimi sviluppi può aiutarti a capire come utilizzare al meglio la tecnologia per fornire valore ai tuoi clienti che l'IA non può replicare.
Pronto a saperne di più? Parliamo .