Clonarea vocii AI: tot ce trebuie să știți pentru moment

Publicat: 2023-06-12

Inteligența artificială (IA) a devenit mult mai credibilă, un exemplu recent fiind imaginea virală a Papei într-o jachetă umflată care păcălește pe mulți.

Dar imaginile nu sunt singurele piese de conținut pe care AI le poate produce în mod convingător – apare și clonarea vocii AI, care în esență imită vocea cuiva pentru diferite cazuri de utilizare. Un exemplu este imitarea vocii președintelui Joe Biden în timpul discursului său privind starea Uniunii.

Se dovedește a fi un alt instrument semnificativ cu potențial de afaceri ridicat, dar poate ridica preocupări etice și juridice.

Acest articol vă va oferi o privire asupra modului în care funcționează AI clonarea vocii, preocupările de care trebuie să fiți conștienți și la ce vă puteți aștepta de la viitorul acestei tehnologii. Ca bonus, îți vom arăta câteva aplicații pe care le poți folosi pentru a-ți clona vocea — din punct de vedere etic, desigur.

Ce este AI Voice Cloning?

Clonarea vocii AI folosește software de inteligență artificială pentru a crea o voce aproape identică a unui vorbitor, imitând totul, de la pronunția silabelor până la modelele de intonație.

Diferă de sinteza vorbirii, unde AI folosește voci diferite, predefinite, pentru a înlocui vorbirea. Ambele sunt adesea folosite împreună, deoarece odată ce aveți o clonă de voce AI, o puteți folosi pentru a spune orice doriți în orice limbă sau emoție.

Clipul audio din care software-ul de clonare a vocii trebuie să învețe nu trebuie să fie lung. McAfee raportează că un clip vocal de trei secunde este suficient de lung pentru ca AI să învețe și să copieze difuzorul.

Potențialul acestei tehnologii este uluitor, deoarece guvernele din întreaga lume încă determină cele mai bune legi și reglementări pentru utilizarea în siguranță a acesteia. Între timp, mulți oameni au început deja să experimenteze cu instrumente AI pentru clonarea vocii în diverse scopuri.

Starea actuală a clonării vocii AI

La fel ca și în cazul AI bazată pe chat și generatoare de fotografii, oamenii din întreaga lume încă își dau seama cum să folosească cel mai bine instrumentele AI pentru clonarea vocii. Mai jos este o prezentare generală a modului în care oamenii și companiile folosesc clonarea vocii AI.

Apariția software-ului gratuit de clonare a vocii AI

Abilitatea de a clona vocea nu este exclusivă pentru cei cunoscători de tehnologie sau super-bogați. Deoarece numeroase companii oferă acum software de clonare a vocii la prețuri diferite, nu este surprinzător că piața va crește la o rată de creștere anuală compusă (CAGR) de 17,2% până în 2028.

Desigur, calitatea rezultatelor poate să nu fie la fel de convingătoare precum serviciile plătite, dar numărul de companii care oferă acest tip de software subliniază cererea.

Replicarea vocilor celebrităților

Imitarea vocilor celebrităților a devenit cel mai popular caz de utilizare al AI al clonării vocii, depășind limitele creative și atragând potențiale probleme legale. Mulți oameni celebri, inclusiv Taylor Swift, Joe Rogan și foști președinți ai SUA, au fost victime ale clonării vocii AI.

Un exemplu recent semnificativ a avut loc în aprilie 2023, când utilizatorul TikTok ghostwriter977 a lansat melodia „Heart on my Sleeve”, folosind vocile artiștilor internaționali Drake și The Weeknd – în ciuda faptului că niciunul nu cânta sau nu era conectat la proiect în vreun fel.

Mulți susțin că este prima melodie virală generată de inteligență artificială, care a primit peste 230.000 de vizionări pe YouTube și 625.000 de streamuri pe Spotify, înainte ca atacurile privind drepturile de autor de la Universal Music Group - label-ul artiștilor - să-l renunțe.

Celebritățile din zilele noastre nu sunt singurele care își au vocea replicată.

Realizatorii documentarului The Andy Warhol Diaries au folosit un software pentru a crea o voce sintetică a faimosului artist pop, Andy Warhol, pentru a povesti porțiuni din jurnalul său, readucându-i vocea la viață și evidențiind modul în care tehnologia are potențialul de a păstra identitatea cuiva mult timp. după ce au trecut.

Oferă mai multă accesibilitate persoanelor cu dizabilități

Unul dintre cele mai practice cazuri de utilizare a clonării vocii AI este acela de a-i ajuta pe cei care riscă să-și piardă vocea sau capacitatea de a vorbi din cauza complicațiilor de sănătate, cum ar fi cei recent diagnosticați cu ALS (scleroza laterală amiotrofică), să-și păstreze vocea.

Un exemplu este funcția Personal Voice de la Apple, pe care marca a prezentat-o ​​în mai 2023. Software-ul le permite utilizatorilor să creeze o voce sintetică pe care familia și prietenii o pot recunoaște. Tot ce trebuie să facă este să citească cu voce tare părți ale textelor randomizate timp de 15 minute pentru ca software-ul să învețe și să reproducă profilul vocal cu acuratețe.

Un serviciu similar, CoeFont, este dezvoltat în Japonia, care oferă chiar utilizarea gratuită pentru persoanele care au dificultăți de vorbire, cum ar fi cei care se bâlbâie sau sunt diagnosticați cu Disfonie. Ei au raportat că peste 400 de utilizatori și-au folosit serviciul de la lansare în mai 2023.

Dublarea și localizarea conținutului

Mai multe companii înțeleg nevoia de conținut localizat în lumea globalizată, mai ales că aproximativ șapte din zece consumatori (68%) spun că ar trece la o marcă care oferă conținut în limba lor maternă.

Metoda tradițională de localizare a conținutului ar fi să angajați un traducător sau actori vocali străini pentru a dubla conținutul. Cu toate acestea, datorită inovațiilor în tehnologie, acest lucru poate fi opțional.

Dublarea AI devine o tendință emergentă pentru a permite creatorilor de conținut și companiilor de producție să-și dubleze conținutul pentru diverse piețe internaționale, fără a angaja artiști străini. Companiile de divertisment pot lansa acum seriale, filme și melodii în diferite limbi pentru a atrage publicul local.

Un exemplu este artistul K-pop Midnatt care își lansează melodia, „Masquerade”, în engleză și folosește AI vocal pentru a lansa versiuni în șase limbi. Spectatorii care urmăresc videoclipul muzical pe YouTube pot face clic pe Setări pentru a schimba melodia audio în limba lor pentru a auzi diferența.

Casa sa de discuri a reușit chiar să-și sintetizeze vocea ca femeie, astfel încât să poată apărea pe propria sa melodie, prezentând vaste oportunități creative pentru muzicienii solo.

Contribuie la escrocherii

Crearea unei voci sintetice a permis infractorilor cibernetici să înșele victime modeste, așa cum a experimentat Jennifer DeStefano, o mamă din Arizona, la începutul lunii aprilie 2023. A primit un telefon îngrijorător de la cine credea a fi fiica ei, plângând și spunând că a fost răpită și criminalii au cerut o răscumpărare. Cu toate acestea, fiica ei a fost în siguranță tot timpul.

Comisia Federală pentru Comerț (FTC) din SUA a spus că AI le-a permis escrocilor să-și îmbunătățească schemele de urgență familiale, ceea ce face să sune mult mai convingător pentru tine să auzi pe cineva drag spunând că are probleme. În aceste momente, unii experți recomandă să conveniți asupra unui „cuvânt sigur AI” cu cei dragi pentru a vă asigura că vocea este de fapt de la ei.

Indiferent, implicațiile negative ale software-ului de clonare a vocii AI accesibil public sunt clare. Mulți oameni și-au exprimat preocupări etice și legale cu privire la această tehnologie de care ar trebui să fiți conștienți dacă intenționați să vă clonați vocea.

Preocupări etice și juridice ale clonării vocii AI

Organismele de conducere, companiile și utilizatorii încă lucrează pentru a înțelege toate preocupările etice și legale pe care le poate aduce o clonă de voce AI. Deși este încă o tehnologie în curs de dezvoltare, mai jos sunt câteva probleme predominante de care ar trebui să știți.

Consimțământul și implicațiile privind confidențialitatea

Ușurința cu care escrocii pot antrena software-ul de clonare a vocii pentru a învăța anumite voci expune creatorii de conținut și muzicienii în pericol de fraudă și uzurpare a identității. Aceste cazuri pun sub semnul întrebării dacă artiștii și creatorii de conținut ar trebui sau nu să-și facă drepturi de autor pentru vocile.

În plus, mijloacele de trai ale oamenilor sunt amenințate, deoarece potențialul de furt de identitate este mult mai mare.

Amenință confidențialitatea și securitatea cibernetică, permițând criminalilor să ocolească sistemele de autentificare bazate pe voce. Acest lucru sa întâmplat la Centrelink și la Australian Taxation Office (ATO), unde criminalii au folosit o voce sintetică pentru a păcăli sistemele de securitate a amprentei vocale menite să verifice identitățile prin recunoașterea vocii.

Dezinformare și manipulare

Deepfake-urile AI continuă să fie un subiect fierbinte de discuție, amenințând să divizeze și să manipuleze comunitățile. Îngrijorarea este că AI clonării vocii evoluează pentru a deveni extrem de convingătoare mai repede decât o pot reglementa guvernele.

Poate manipula și afecta reputația unei celebrități dacă trolii online lansează sunetul unei celebrități care aruncă comentarii sau glume jignitoare; un exemplu recent este vocea actriței britanice Emma Watson citind Mein Kampf al lui Hitler.

Impactul asupra actorilor vocali umani și înlocuirea locurilor de muncă

Mulți oameni își fac griji cu privire la securitatea locului de muncă, deoarece IA devine din ce în ce mai capabilă să îndeplinească sarcini tradiționale umane. Clonarea vocii AI amenință actorii vocali, în special.

Au existat deja incidente în care actorii vocali au fost șocați să găsească AI care le copiază vocea pentru ca oamenii să le folosească pentru proiectele lor. În februarie 2023, câțiva actori vocali de jocuri video au condamnat public contractele pe care le-au primit, cerându-le să-și renunțe la AI.

Ce se va întâmpla cu actorii vocali dacă va deveni mult mai ușor să folosești AI pentru a povesti sau a dubla conținut pentru tine? Este o întrebare care merită analizată, deoarece poate cauza mii de actori vocali să-și facă locul de muncă.

Starea clonării vocii AI este complicată. Mulți încă experimentează cu tehnologia. Având în vedere asta, merită să ne gândim la ce ne rezervă viitorul pentru clonarea vocii AI.

La ce vă puteți aștepta cu clonarea vocii AI

Nu este setat nimic despre clonarea vocii AI. Pe măsură ce lumea continuă să înțeleagă și să descopere posibilitățile acestei tehnologii, cel mai bine este să ne gândim la ce i-ar putea rezerva viitorul.

1. Reglementări guvernamentale mai stricte și discuții etice mai ample

Guvernele vor impune probabil reglementări mai stricte cu privire la utilizarea clonării vocii AI. Senatorul Richard Blumenthal a subliniat cât de convingător a devenit software-ul de clonare a vocii, făcând ca tehnologia să recite declarația sa de deschidere la o audiere recentă a Senatului SUA.

Ce ar putea include aceste reglementări și politici? Ei se pot adresa ale căror voci pot fi clonate prin AI și pot defini scopurile exacte ale tehnologiei. Ar putea prevedea că companiile trebuie să dezvăluie dacă folosesc sau nu IA vocală pentru oricare dintre procesele lor. În plus, instanțele trebuie să stabilească în continuare cine deține drepturile la o voce generată de AI.

Acești parametri legali ar putea ajuta oamenii să se protejeze împotriva riscurilor și pericolelor clonelor AI vocale.

2. Utilizare sporită pentru crearea de conținut

Există utilizări etice pentru aplicațiile de clonare a vocii. De exemplu, software-ul de clonare a vocii poate fi un instrument de productivitate dacă sunteți un creator de conținut video care produce conținut YouTube fără chip. Antrenarea AI pentru a-ți imita vocea poate reduce semnificativ timpul de producție, deoarece nu va mai trebui să petreci ore întregi înregistrând și reînregistrând sunetul în fața unui microfon.

Un altul este marketingul AI, care vă permite să utilizați AI pentru a produce materiale la un ritm mult mai rapid și la un cost mai mic decât înainte.

3. Mai multe detectoare AI

Cu cât de convingătoare a devenit AI, capacitatea de a discerne dacă un conținut este autentic uman este crucială pentru a evita căderea în dezinformare. Vă puteți aștepta să vedeți mai mulți oameni creând detectoare mai fiabile pentru a vă asigura că, oricât de convingător este un conținut, tot ceea ce consumați este făcut de un om.

4. Popularitate mai mare a vocii AI în industria divertismentului

Industria cinematografică devine din ce în ce mai confortabilă cu dublarea AI, Motion Picture Association (MPA) care a acordat recent certificarea startup-ului de dublare AI Deepdub. Acest titlu asigură că AI-ul startup-ului poate îndeplini standardele înalte ale industriei divertismentului.

Deepdub nu este singurul care oferă servicii AI industriei divertismentului. Mulți capitaliști de risc au început să investească în numeroase startup-uri AI pentru a aduce AI companiilor de producție de filme precum Netflix, Marvel și Lucasfilm.

Într-o dezvoltare similară, compania de inteligență artificială Flawless a anunțat în mai 2023 că colaborează cu distribuitori din SUA și Marea Britanie pentru a lansa versiuni în limba engleză ale filmelor non-engleze în diferite regiuni, dublate și sincronizate pe buze de AI.

Cu experții care se așteaptă ca industria să aibă o valoare de 416,8 miliarde de dolari până în 2030, AI este gata să devină mai integrată pentru a produce mai mult conținut de înaltă calitate pentru serviciile de streaming.

Aplicații populare de clonare a vocii

Dacă doriți să vă clonați vocea prin software, iată câteva instrumente populare pe care le puteți consulta.

Semăna.AI

Resemble.AI oferă diverse produse și servicii pentru a vă ajuta să creați o voce sintetică de care sunteți mulțumit. De exemplu, dacă doriți să înlocuiți câteva cuvinte din conținutul audio înregistrat fără a reînregistra, funcția de umplere asemănătoare vă va ajuta să editați clipul fără probleme.

De asemenea, au un API personalizat AI Voices, pe care dezvoltatorii îl pot integra în diverse instrumente pe care le folosesc deja. AI pentru clonarea vocii lor va avea nevoie doar de cel puțin trei minute de audio sau rostirea a 25 de propoziții predeterminate pentru a învăța vocile.

Dincolo de cuvinte

BeyondWords are o bibliotecă de peste 550 de voci AI în peste 140 de limbi care sunt create etic; compania colaborează cu actori vocali prin Contractul său de clonare a vocii. De asemenea, folosesc procesarea limbajului natural (NLP) pentru a analiza textul utilizatorului și pentru a-l converti în vorbire cu sunet autentic.

Vorbitor

Respeecher se mândrește că permite creatorilor de conținut, realizatorilor de film și dezvoltatorilor de jocuri să creeze voci sintetice. În special, au lucrat cu companii precum Lucasfilms pentru a genera o voce generată de inteligență artificială pentru un actor mai în vârstă care își reluează rolul mai tânăr și Mondelez International pentru a produce marketing foarte direcționat și localizat.

Compania folosește atât algoritmi de procesare a semnalului digital, cât și un model generativ profund pentru a permite inteligenței sale artificiale să învețe și să mimeze nu numai vocea, ci și emoțiile și transmiterea pasajelor.

Unsprezece laboratoare

Mulți cunosc Eleven Labs pentru biblioteca lor de voci celebrități, pe care o puteți utiliza cu ușurință pentru conținutul dvs. cu produsul lor VoiceLab. Ei și-au arătat expertiza dublând discursul lui Leonardo DiCaprio la Națiunile Unite cu alte celebrități, precum Joe Rogan și Steve Jobs.

Compania își propune să genereze voci cu sunet realist cu modelul său AI axat pe captarea logicii și emoțiilor în texte cu platforma sa de sinteză a vorbirii. Adună context despre fiecare propoziție și paragraf pentru a înțelege cum să intonați și să vorbiți în mod convingător.

PlayHT

PlatHT are o bibliotecă de voci pe care le poți clona pentru proiectele tale, de la Elon Musk și Neil DeGrasse Tyson până la John F. Kennedy și Barack Obama. Software-ul lor Voice Cloning în timp real vă permite să creați o voce sintetică care surprinde stilul de vorbire și păstrează accentul și nuanțele de vorbire ale subiectului.

AI pentru clonarea vocii lor va necesita cel puțin o oră de sunet clar pentru a-și porni analiza vocală și procesul de învățare.

Este important să rețineți că toate aceste companii au subliniat etica din spatele produselor lor, pe care le puteți vedea pe site-ul lor.

Ține-ți urechea la pământ

Clonarea vocii AI poate avea efecte considerabile asupra societății, atât pozitive, cât și negative. Pe de o parte, companiile pot folosi tehnologia pentru a ajuta oamenii să continue să „vorbească” mult timp după ce și-au pierdut vocea din cauza afecțiunilor medicale sau creatorilor pentru a-și reduce timpul de producție.

Acestea fiind spuse, clonarea vocii AI nu este complet lipsită de preocupări etice sau legale. Escrocii îl pot folosi în continuare pentru a uzurpa identitatea unor persoane în scheme de urgență familială sau pentru a ocoli autentificatoarele vocale pentru a accesa date extrem de sensibile și confidențiale.

În timp ce guvernele continuă să discute despre posibile legi și politici privind utilizarea adecvată a AI, depinde de companiile private să o utilizeze mai responsabil. Aceasta include respectarea celor mai bune practici de securitate cibernetică, cum ar fi solicitarea consimțământului pentru accesul la datele consumatorilor și practicarea transparenței cu privire la modul în care utilizați tehnologia.

Clonarea vocii AI continuă să evolueze. Fiind la curent cu cele mai recente evoluții, vă poate ajuta să înțelegeți cum să utilizați cel mai bine tehnologia pentru a oferi clienților o valoare pe care AI nu o poate replica.

Sunteți gata să aflați mai multe? Să vorbim .