Clonage de voix par IA : tout ce que vous devez savoir pour l'instant

Publié: 2023-06-12

L'intelligence artificielle (IA) est devenue beaucoup plus crédible, avec un exemple récent étant l'image virale du Pape dans une veste bouffante qui trompe beaucoup.

Mais les images ne sont pas les seuls éléments de contenu que l'IA peut produire de manière convaincante. Le clonage de la voix de l'IA, qui imite essentiellement la voix d'une personne pour différents cas d'utilisation, est également en train d'émerger. Un exemple est l'imitation de la voix du président Joe Biden lors de son discours sur l'état de l'Union.

Il s'avère être un autre outil important à fort potentiel commercial, mais peut soulever des problèmes éthiques et juridiques.

Cet article vous donnera un aperçu du fonctionnement de l'IA de clonage de voix, des préoccupations dont vous devez être conscient et de ce que vous pouvez attendre de l'avenir de cette technologie. En prime, nous vous montrerons quelques applications que vous pouvez utiliser pour cloner votre voix, de manière éthique, bien sûr.

Qu'est-ce que le clonage de voix IA ?

L'IA de clonage de la voix utilise un logiciel d'intelligence artificielle pour créer une voix presque identique à celle d'un locuteur, imitant tout, des prononciations de syllabes aux schémas d'intonation.

Cela diffère de la synthèse vocale, où l'IA utilise différentes voix prédéfinies pour remplacer la parole. Les deux sont souvent utilisés ensemble car une fois que vous avez un clone de voix IA, vous pouvez l'utiliser pour dire ce que vous voulez dans n'importe quelle langue ou émotion.

Le clip audio dont le logiciel de clonage vocal a besoin pour apprendre n'a pas besoin d'être long. McAfee rapporte qu'un clip vocal de trois secondes est suffisamment long pour que l'IA apprenne et copie le locuteur.

Le potentiel de cette technologie est stupéfiant, car les gouvernements du monde entier sont encore en train de déterminer les meilleures lois et réglementations à mettre en place pour son utilisation en toute sécurité. Entre-temps, de nombreuses personnes ont déjà commencé à expérimenter des outils d'IA de clonage de voix à diverses fins.

L'état actuel du clonage de voix par IA

Tout comme avec l'IA basée sur le chat et la génération de photos, les gens du monde entier cherchent encore à utiliser au mieux les outils d'IA vocale clonée. Vous trouverez ci-dessous un aperçu général de la façon dont les particuliers et les entreprises utilisent le clonage de voix par IA.

Montée en puissance des logiciels de clonage de voix IA gratuits

La possibilité de cloner la voix n'est pas exclusive aux technophiles ou aux super-riches. Étant donné que de nombreuses entreprises proposent désormais des logiciels de clonage de voix à des prix variables, il n'est pas surprenant que le marché devrait croître à un taux de croissance annuel composé (TCAC) de 17,2 % d'ici 2028.

Bien sûr, la qualité de la sortie n'est peut-être pas aussi convaincante que celle des services payants, mais le nombre d'entreprises proposant le type de logiciel souligne la demande.

Reproduire les voix des célébrités

L'imitation des voix de célébrités est devenue le cas d'utilisation le plus populaire de l'IA pour le clonage de voix, repoussant les limites de la créativité et créant des problèmes juridiques potentiels. De nombreuses personnes célèbres, dont Taylor Swift, Joe Rogan et d'anciens présidents américains, ont été victimes du clonage de voix par IA.

Un exemple récent significatif s'est produit en avril 2023, lorsque l'utilisateur de TikTok ghostwriter977 a sorti la chanson "Heart on my Sleeve", en utilisant les voix des artistes internationaux Drake et The Weeknd, bien qu'aucun ne chante réellement ou ne soit connecté au projet à quelque titre que ce soit.

Beaucoup affirment qu'il s'agit de la première chanson virale générée par l'IA, recevant plus de 230 000 vues sur YouTube et 625 000 flux sur Spotify avant que les grèves des droits d'auteur d'Universal Music Group, le label des artistes, ne la retirent.

Les célébrités modernes ne sont pas les seules à voir leur voix reproduite.

Les cinéastes du documentaire The Andy Warhol Diaries ont utilisé un logiciel pour créer une voix synthétique du célèbre artiste pop, Andy Warhol, pour raconter des parties de son journal, redonnant vie à sa voix et soulignant comment la technologie a le potentiel de préserver l'identité de quelqu'un longtemps après leur passage.

Fournit plus d'accessibilité pour les personnes handicapées

L'un des cas d'utilisation les plus pratiques de l'IA de clonage de la voix est d'aider les personnes risquant de perdre la voix ou la capacité de parler en raison de complications de santé, telles que celles récemment diagnostiquées avec la SLA (sclérose latérale amyotrophique), à ​​préserver leur voix.

Un exemple est la fonction Personal Voice d'Apple, que la marque a prévisualisée en mai 2023. Le logiciel permet aux utilisateurs de créer une voix synthétique que leur famille et leurs amis peuvent reconnaître. Tout ce qu'ils ont à faire est de lire à haute voix des parties de textes aléatoires pendant 15 minutes pour que le logiciel apprenne et reproduise avec précision leur profil vocal.

Un service similaire, CoeFont, est en cours de développement au Japon et offre même une utilisation gratuite aux personnes qui ont des difficultés à parler, comme celles qui bégaient ou qui reçoivent un diagnostic de dysphonie. Ils ont signalé que plus de 400 utilisateurs ont utilisé leur service depuis son lancement en mai 2023.

Doublage et localisation de contenu

De plus en plus d'entreprises comprennent le besoin de contenu localisé dans le monde globalisé, d'autant plus qu'environ sept consommateurs sur dix (68 %) déclarent qu'ils opteraient pour une marque qui propose du contenu dans leur langue maternelle.

La méthode traditionnelle pour localiser le contenu consisterait à embaucher un traducteur ou des doubleurs étrangers pour doubler le contenu. Cependant, grâce aux innovations technologiques, cela peut être facultatif.

Le doublage par IA devient une tendance émergente pour permettre aux créateurs de contenu et aux sociétés de production de doubler leur contenu pour divers marchés internationaux sans embaucher de voix off étrangères. Les sociétés de divertissement peuvent désormais diffuser des séries, des films et des chansons dans différentes langues pour attirer le public local.

Un exemple est l'artiste K-pop Midnatt qui publie sa chanson "Masquerade" en anglais et utilise l'IA vocale pour sortir des versions en six langues. Les téléspectateurs qui regardent la vidéo musicale sur YouTube peuvent cliquer sur Paramètres pour changer la piste audio dans leur langue pour entendre la différence.

Son label a même été capable de synthétiser sa voix de femme afin qu'il puisse figurer sur sa propre chanson, offrant de vastes opportunités créatives aux musiciens solistes.

Contribuer aux escroqueries

La création d'une voix synthétique a permis aux cybercriminels d'escroquer des victimes sans prétention, comme Jennifer DeStefano, une mère en Arizona, l'a vécu au début d'avril 2023. Elle a reçu un appel téléphonique inquiétant de qui elle croyait être sa fille, pleurant et disant qu'elle avait été kidnappée et les criminels ont exigé une rançon. Cependant, sa fille était en sécurité depuis le début.

La Federal Trade Commission (FTC) des États-Unis a déclaré que l'IA a permis aux escrocs d'améliorer leurs plans d'urgence familiaux, ce qui rend beaucoup plus convaincant pour vous d'entendre un être cher dire qu'il a des problèmes. Dans ces moments, certains experts recommandent de convenir d'un "mot de sécurité IA" avec vos proches pour vous assurer que la voix vient bien d'eux.

Quoi qu'il en soit, les implications négatives du logiciel de clonage de voix AI accessible au public sont claires. De nombreuses personnes ont soulevé des préoccupations éthiques et juridiques concernant cette technologie dont vous devez être conscient si vous avez l'intention de cloner votre voix.

Préoccupations éthiques et juridiques de l'IA de clonage de voix

Les organes directeurs, les entreprises et les utilisateurs s'efforcent toujours de comprendre toutes les préoccupations éthiques et juridiques qu'un clone de voix d'IA peut apporter. Bien qu'il s'agisse encore d'une technologie naissante, vous trouverez ci-dessous quelques problèmes courants dont vous devez être conscient.

Incidences sur le consentement et la vie privée

La facilité avec laquelle les escrocs peuvent former un logiciel de clonage de voix pour apprendre des voix spécifiques expose les créateurs de contenu et les musiciens à un risque de fraude et d'usurpation d'identité. Ces cas remettent en question le fait que les artistes et les créateurs de contenu doivent ou non protéger leurs voix.

De plus, les moyens de subsistance des gens sont menacés car le potentiel de vol d'identité est beaucoup plus élevé.

Il menace la vie privée et la cybersécurité en permettant aux criminels de contourner les systèmes d'authentification vocale. Cela s'est produit à Centrelink et à l'Australian Taxation Office (ATO), où les criminels ont utilisé une voix synthétique pour tromper les systèmes de sécurité d'empreinte vocale destinés à vérifier les identités grâce à la reconnaissance vocale.

Désinformation et manipulation

Les deepfakes d'IA continuent d'être un sujet de discussion brûlant, menaçant de diviser et de manipuler les communautés. Le problème est que l'IA de clonage de la voix évolue pour devenir très convaincante plus rapidement que les gouvernements ne peuvent la réglementer.

Cela peut manipuler et affecter la réputation d'une célébrité si des trolls en ligne publient l'audio d'une célébrité crachant des commentaires ou des blagues offensants ; un exemple récent est la voix de l'actrice britannique Emma Watson lisant Mein Kampf d'Hitler.

Impact sur les acteurs de la voix humaine et le déplacement de l'emploi

De nombreuses personnes s'inquiètent pour leur sécurité d'emploi alors que l'IA devient de plus en plus capable d'effectuer des tâches traditionnellement humaines. L'IA de clonage de la voix menace en particulier les acteurs de la voix.

Il y a déjà eu des incidents où les acteurs de la voix ont été choqués de trouver l'IA copiant leur voix pour que les gens l'utilisent pour leurs projets. En février 2023, quelques acteurs de la voix de jeux vidéo ont publiquement condamné les contrats qu'ils ont reçus, les obligeant à céder leur voix à l'IA.

Qu'adviendra-t-il des acteurs de la voix s'il devient beaucoup plus facile d'utiliser l'IA pour raconter ou doubler du contenu pour vous ? C'est une question qui vaut la peine d'être examinée car elle peut potentiellement causer le travail de milliers d'acteurs vocaux.

L'état du clonage de voix par IA est compliqué. Beaucoup expérimentent encore la technologie. Compte tenu de cela, il vaut la peine de réfléchir à ce que l'avenir réserve à l'IA de clonage de voix.

Ce à quoi vous pouvez vous attendre avec le clonage de voix AI

Rien sur le clonage de voix AI n'est défini. Alors que le monde continue de comprendre et de découvrir les possibilités de cette technologie, il est préférable de réfléchir à ce que l'avenir pourrait lui réserver.

1. Une réglementation gouvernementale plus stricte et des discussions éthiques plus larges

Les gouvernements imposeront probablement des réglementations plus strictes sur l'utilisation de l'IA de clonage de la voix. Le sénateur Richard Blumenthal a souligné à quel point le logiciel de clonage de voix est devenu convaincant en obligeant la technologie à réciter sa déclaration d'ouverture lors d'une récente audience du Sénat américain.

Que pourraient inclure ces réglementations et politiques ? Ils peuvent déterminer quelles voix peuvent être clonées via l'IA et définir les objectifs exacts de la technologie. Il pourrait stipuler que les entreprises doivent divulguer si elles utilisent ou non l'IA vocale pour l'un de leurs processus. De plus, les tribunaux doivent encore déterminer qui détient les droits sur une voix générée par l'IA.

Ces paramètres juridiques pourraient aider les gens à se protéger contre les risques et les dangers de l'IA vocale clonée.

2. Utilisation accrue pour la création de contenu

Il existe des utilisations éthiques pour les applications de clonage de voix. Par exemple, un logiciel de clonage de voix peut être un outil de productivité si vous êtes un créateur de contenu vidéo produisant du contenu YouTube sans visage. Entraîner l'IA à imiter votre voix peut réduire considérablement le temps de production, car vous n'aurez plus à passer des heures à enregistrer et à réenregistrer de l'audio devant un microphone.

Un autre est le marketing de l'IA, qui vous permet de tirer parti de l'IA pour produire des matériaux à un rythme beaucoup plus rapide et à moindre coût qu'auparavant.

3. Plus de détecteurs d'IA

Avec la façon dont l'IA est devenue convaincante, la capacité de discerner si un élément de contenu est authentiquement humain est cruciale pour éviter de tomber dans la désinformation. Vous pouvez vous attendre à voir plus de personnes créer des détecteurs plus fiables pour garantir que, aussi convaincant qu'un élément de contenu soit, tout ce que vous consommez est fabriqué par un humain.

4. Plus grande popularité de la voix de l'IA dans l'industrie du divertissement

L'industrie cinématographique est de plus en plus à l'aise avec le doublage IA, la Motion Picture Association (MPA) ayant récemment décerné une certification à la startup de doublage IA Deepdub. Ce titre garantit que l'IA de la startup peut répondre aux normes élevées de l'industrie du divertissement.

Deepdub n'est pas le seul à proposer des services d'intelligence artificielle à l'industrie du divertissement. De nombreux investisseurs en capital-risque ont commencé à investir dans de nombreuses startups d'IA pour apporter l'IA aux sociétés de production de films comme Netflix, Marvel et Lucasfilm.

Dans un développement similaire, la société AI Flawless a annoncé en mai 2023 qu'elle s'associait à des distributeurs américains et britanniques pour publier des versions anglaises de films non anglais dans différentes régions, doublées et synchronisées sur les lèvres par AI.

Alors que les experts s'attendent à ce que l'industrie pèse 416,8 milliards de dollars d'ici 2030, l'IA est sur le point de devenir plus intégrée pour produire davantage de contenu de haute qualité pour les services de streaming.

Applications populaires de clonage de voix

Si vous souhaitez cloner votre voix via un logiciel, voici quelques outils populaires que vous pouvez consulter.

Ressemble.AI

Resemble.AI propose divers produits et services pour vous aider à créer une voix synthétique dont vous êtes satisfait. Par exemple, si vous souhaitez remplacer quelques mots dans votre audio enregistré sans réenregistrer, leur fonction Resemble Fill vous aidera à éditer le clip de manière transparente.

Ils disposent également d'une API Custom AI Voices que les développeurs peuvent intégrer dans divers outils qu'ils utilisent déjà. Leur IA de clonage de voix n'aura besoin que d'au moins trois minutes d'audio ou de prononcer 25 phrases prédéterminées pour apprendre les voix.

Au delà des mots

BeyondWords possède une bibliothèque de plus de 550 voix d'IA dans plus de 140 langues créées de manière éthique ; la société collabore avec des acteurs de la voix par le biais de son contrat de clonage de voix. Ils utilisent également le traitement du langage naturel (NLP) pour analyser le texte de l'utilisateur et le convertir en un discours authentique.

Discours

Respeecher est fier de permettre aux créateurs de contenu, aux cinéastes et aux développeurs de jeux de créer des voix synthétiques. Ils ont notamment travaillé avec des sociétés telles que Lucasfilms pour générer une voix générée par l'IA pour un acteur plus âgé reprenant son rôle plus jeune et Mondelez International pour produire un marketing hautement ciblé et localisé.

La société utilise à la fois des algorithmes de traitement numérique du signal et un modèle génératif profond pour permettre à son intelligence artificielle d'apprendre et d'imiter non seulement la voix, mais aussi les émotions et la livraison des passages.

Onze laboratoires

Beaucoup connaissent Eleven Labs pour leur bibliothèque de voix de célébrités, que vous pouvez facilement utiliser pour votre contenu avec leur produit VoiceLab. Ils ont montré leur expertise en doublant le discours de Leonardo DiCaprio aux Nations Unies avec d'autres célébrités, telles que Joe Rogan et Steve Jobs.

L'entreprise vise à générer des voix réalistes avec son modèle d'IA axé sur la capture de la logique et des émotions dans les textes avec sa plateforme de synthèse vocale. Il rassemble le contexte de chaque phrase et paragraphe pour comprendre comment articuler et parler de manière convaincante.

PlayHT

PlatHT possède une bibliothèque de voix que vous pouvez cloner pour vos projets, d'Elon Musk et Neil DeGrasse Tyson à John F. Kennedy et Barack Obama. Leur logiciel de clonage de voix en temps réel vous permet de créer une voix synthétique qui capture le style de parole et préserve l'accent et les nuances de parole du sujet.

Leur IA de clonage de voix nécessitera au moins une heure d'audio parlant clair pour lancer son analyse vocale et son processus d'apprentissage.

Il est important de noter que toutes ces entreprises ont décrit l'éthique derrière leurs produits, que vous pouvez consulter sur leur site Web.

Gardez votre oreille au sol

Le clonage de voix par IA peut avoir des effets considérables sur la société, à la fois positifs et négatifs. Alors que d'une part, les entreprises peuvent utiliser la technologie pour aider les gens à continuer à "parler" longtemps après avoir perdu leur voix à cause de conditions médicales ou les créateurs pour réduire leur temps de production.

Cela dit, l'IA de clonage de voix n'est pas complètement exempte de problèmes éthiques ou juridiques. Les fraudeurs peuvent toujours l'utiliser pour se faire passer pour des personnes dans le cadre de plans d'urgence familiaux ou pour contourner les authentificateurs vocaux afin d'accéder à des données hautement sensibles et confidentielles.

Alors que les gouvernements continuent de discuter d'éventuelles lois et politiques concernant l'utilisation appropriée de l'IA, il appartient aux entreprises privées de l'utiliser de manière plus responsable. Cela inclut le respect des meilleures pratiques en matière de cybersécurité, telles que la demande de consentement pour l'accès aux données des consommateurs et la pratique de la transparence quant à la manière dont vous utilisez la technologie.

L'IA de clonage de la voix continue d'évoluer. Rester informé de ses derniers développements peut vous aider à comprendre comment utiliser au mieux la technologie pour offrir à vos clients une valeur que l'IA ne peut pas reproduire.

Prêt à en savoir plus ? Parlons .