Clonagem de voz AI: tudo o que você precisa saber por enquanto

Publicados: 2023-06-12

A inteligência artificial (IA) tornou-se muito mais crível, com um exemplo recente sendo a imagem viral do Papa em uma jaqueta fofa enganando muitos.

Mas as imagens não são as únicas peças de conteúdo que a IA pode produzir de forma convincente – a clonagem de voz da IA, que essencialmente imita a voz de alguém para diferentes casos de uso, também está surgindo. Um exemplo é a imitação da voz do presidente Joe Biden durante seu discurso sobre o Estado da União.

Está provando ser outra ferramenta significativa com alto potencial de negócios, mas pode levantar questões éticas e legais.

Este artigo lhe dará um vislumbre de como a IA de clonagem de voz funciona, as preocupações das quais você precisa estar ciente e o que pode esperar do futuro dessa tecnologia. Como bônus, mostraremos alguns aplicativos que você pode usar para clonar sua voz, de forma ética, é claro.

O que é clonagem de voz AI?

A IA de clonagem de voz usa software de inteligência artificial para criar uma voz quase idêntica de um falante, imitando tudo, desde pronúncias de sílabas até padrões de entonação.

É diferente da síntese de fala, em que a IA usa vozes diferentes e predefinidas para substituir a fala. Ambos são frequentemente usados ​​juntos, pois uma vez que você tenha um clone de voz AI, você pode usá-lo para dizer o que quiser em qualquer idioma ou emoção.

O clipe de áudio do qual o software de clonagem de voz precisa aprender não precisa ser longo. A McAfee relata que um clipe de voz de três segundos é longo o suficiente para a IA aprender e copiar o locutor.

O potencial dessa tecnologia é impressionante, pois os governos em todo o mundo ainda estão determinando as melhores leis e regulamentações para seu uso seguro. Nesse ínterim, muitas pessoas já começaram a experimentar ferramentas de IA de clone de voz para vários fins.

O estado atual da clonagem de voz AI

Assim como com IA baseada em bate-papo e geração de fotos, as pessoas em todo o mundo ainda estão descobrindo como usar melhor as ferramentas de IA de voz clonada. Abaixo está uma visão geral de como as pessoas e as empresas usam a clonagem de voz AI.

Aumento do software gratuito de clonagem de voz AI

A capacidade de clonar a voz não é exclusiva dos conhecedores de tecnologia ou super-ricos. Como várias empresas agora oferecem software de clonagem de voz a preços variados, não é de surpreender que o mercado deva crescer a uma taxa composta de crescimento anual (CAGR) de 17,2% até 2028.

Claro, a qualidade da saída pode não ser tão convincente quanto os serviços pagos, mas o número de empresas que oferecem o tipo de software reforça a demanda.

Replicando vozes de celebridades

A imitação de vozes de celebridades tornou-se o caso de uso mais popular da IA ​​de clonagem de voz, ultrapassando os limites criativos e gerando possíveis problemas legais. Muitas pessoas famosas, incluindo Taylor Swift, Joe Rogan e ex-presidentes dos EUA, foram vítimas de clonagem de voz por IA.

Um exemplo recente significativo ocorreu em abril de 2023, quando o usuário do TikTok ghostwriter977 lançou a música “Heart on my Sleeve”, usando as vozes dos artistas internacionais Drake e The Weeknd – apesar de nenhum deles realmente cantar ou estar conectado ao projeto em qualquer capacidade.

Muitos argumentam que é a primeira música viral gerada por IA, recebendo mais de 230.000 visualizações no YouTube e 625.000 streams no Spotify antes que greves de direitos autorais do Universal Music Group - a gravadora dos artistas - a derrubassem.

As celebridades modernas não são as únicas que têm suas vozes replicadas.

Os realizadores do documentário The Andy Warhol Diaries usaram um software para criar uma voz sintética do famoso artista pop, Andy Warhol, para narrar partes de seu diário, trazendo sua voz de volta à vida e destacando como a tecnologia tem o potencial de preservar a identidade de alguém por muito tempo depois que eles passaram.

Oferece mais acessibilidade para pessoas com deficiência

Um dos casos de uso mais prático da IA ​​de clonagem de voz é ajudar aqueles que correm o risco de perder a voz ou a capacidade de falar devido a complicações de saúde, como os recém-diagnosticados com ELA (esclerose lateral amiotrófica), a preservar a voz.

Um exemplo é o recurso Personal Voice da Apple, que a marca apresentou em maio de 2023. O software permite que os usuários criem uma voz sintética que sua família e amigos possam reconhecer. Tudo o que eles precisam fazer é ler partes de textos aleatórios em voz alta por 15 minutos para que o software aprenda e replique seu perfil vocal com precisão.

Um serviço semelhante, o CoeFont, está sendo desenvolvido no Japão e oferece até mesmo uso gratuito para pessoas com dificuldade de fala, como gagueira ou com diagnóstico de disfonia. Eles relataram que mais de 400 usuários usaram o serviço desde o lançamento em maio de 2023.

Dublagem e localização de conteúdo

Mais empresas entendem a necessidade de conteúdo localizado no mundo globalizado, especialmente porque cerca de sete em cada dez consumidores (68%) dizem que mudariam para uma marca que oferecesse conteúdo em seu idioma nativo.

O método tradicional de localização de conteúdo seria contratar um tradutor ou dubladores estrangeiros para dublar o conteúdo. No entanto, graças às inovações tecnológicas, isso pode ser opcional.

A dublagem de IA está se tornando uma tendência emergente para permitir que criadores de conteúdo e empresas de produção dublassem seu conteúdo para vários mercados internacionais sem contratar dubladores estrangeiros. As empresas de entretenimento agora podem lançar séries, filmes e músicas em diferentes idiomas para atrair o público local.

Um exemplo é o artista de K-pop Midnatt lançando sua música, “Masquerade”, em inglês e usando IA de voz para lançar versões em seis idiomas. Os espectadores que assistem ao videoclipe no YouTube podem clicar em Configurações para alterar a faixa de áudio para o idioma deles e ouvir a diferença.

Sua gravadora conseguiu até sintetizar sua voz como mulher para que ele pudesse participar de sua própria música, apresentando vastas oportunidades criativas para músicos solo.

Contribuindo para golpes

A criação de uma voz sintética permitiu que os cibercriminosos enganassem vítimas despretensiosas, como Jennifer DeStefano, uma mãe no Arizona, experimentou no início de abril de 2023. Ela recebeu um telefonema preocupante de quem ela acreditava ser sua filha, chorando e dizendo que havia sido sequestrada e os criminosos exigiram um resgate. No entanto, sua filha estava segura o tempo todo.

A Federal Trade Commission (FTC) dos EUA disse que a IA permitiu que golpistas aprimorassem seus esquemas de emergência familiar, tornando muito mais convincente para você ouvir um ente querido dizer que está com problemas. Nesses momentos, alguns especialistas recomendam concordar com uma “palavra de segurança de IA” com seus entes queridos para garantir que a voz seja realmente deles.

Independentemente disso, as implicações negativas do software de clonagem de voz AI acessível ao público são claras. Muitas pessoas levantaram questões éticas e legais sobre essa tecnologia, das quais você deve estar ciente se pretender clonar sua voz.

Preocupações éticas e legais da IA ​​de clonagem de voz

Órgãos governamentais, empresas e usuários ainda estão trabalhando para entender todas as preocupações éticas e legais que um clone de voz AI pode trazer. Embora ainda seja uma tecnologia nascente, abaixo estão alguns problemas prevalentes dos quais você deve estar ciente.

Implicações de consentimento e privacidade

A facilidade com que os golpistas podem treinar o software de clonagem de voz para aprender vozes específicas coloca os criadores de conteúdo e músicos em risco de fraude e falsificação de identidade. Essas instâncias questionam se os artistas e criadores de conteúdo devem ou não proteger suas vozes.

Além disso, os meios de subsistência das pessoas estão ameaçados, pois o potencial de roubo de identidade é muito maior.

Ele ameaça a privacidade e a segurança cibernética ao permitir que os criminosos contornem os sistemas de autenticação baseados em voz. Isso ocorreu no Centrelink e no Australian Taxation Office (ATO), onde os criminosos usaram uma voz sintética para enganar os sistemas de segurança de impressão de voz destinados a verificar as identidades por meio do reconhecimento de voz.

Desinformação e manipulação

Os deepfakes de IA continuam sendo um tema quente de discussão, ameaçando dividir e manipular as comunidades. A preocupação é que a IA de clonagem de voz esteja evoluindo para se tornar altamente convincente mais rapidamente do que os governos podem regulá-la.

Ele pode manipular e afetar a reputação de uma celebridade se os trolls online liberarem o áudio de uma celebridade fazendo comentários ou piadas ofensivas; um exemplo recente é a voz da atriz britânica Emma Watson lendo Mein Kampf , de Hitler.

Impacto em dubladores humanos e deslocamento de trabalho

Muitas pessoas se preocupam com a segurança de seus empregos à medida que a IA se torna cada vez mais capaz de realizar tarefas tradicionalmente humanas. A IA de clonagem de voz ameaça especialmente os dubladores.

Já houve incidentes em que os dubladores ficaram chocados ao descobrir que a IA copiava seus vocais para as pessoas usarem em seus projetos. Em fevereiro de 2023, alguns dubladores de videogame condenaram publicamente os contratos que receberam, exigindo que assinassem suas vozes para a IA.

O que será dos dubladores se ficar muito mais fácil usar IA para narrar ou dublar conteúdo para você? É uma questão que vale a pena investigar, pois pode causar o trabalho de milhares de dubladores.

O estado da clonagem de voz AI é complicado. Muitos ainda estão experimentando a tecnologia. Diante disso, vale a pena considerar o que o futuro reserva para a IA de clonagem de voz.

O que você pode esperar com a clonagem de voz AI

Nada sobre clonagem de voz AI está definido. À medida que o mundo continua a entender e descobrir as possibilidades dessa tecnologia, é melhor considerar o que o futuro reserva para ela.

1. Regulamentação governamental mais rígida e discussões éticas mais amplas

Os governos provavelmente imporão regulamentos mais rígidos sobre o uso de IA de clonagem de voz. O senador Richard Blumenthal destacou como o software de clonagem de voz se tornou convincente ao fazer a tecnologia recitar sua declaração de abertura em uma recente audiência no Senado dos EUA.

O que esses regulamentos e políticas podem incluir? Eles podem abordar cujas vozes podem ser clonadas por meio de IA e definir os propósitos exatos da tecnologia. Poderia estipular que as empresas devem divulgar se usam ou não IA de voz para qualquer um de seus processos. Além disso, os tribunais ainda devem determinar quem possui os direitos de uma voz gerada por IA.

Esses parâmetros legais podem ajudar as pessoas a se protegerem contra os riscos e perigos da IA ​​de voz clonada.

2. Maior uso para criação de conteúdo

Existem usos éticos para aplicativos de clonagem de voz. Por exemplo, o software de clonagem de voz pode ser uma ferramenta de produtividade se você for um criador de conteúdo de vídeo que produz conteúdo do YouTube sem rosto. Treinar a IA para imitar sua voz pode reduzir significativamente o tempo de produção, pois você não precisará mais passar horas gravando e regravando áudio na frente de um microfone.

Outro é o marketing de IA, que permite alavancar a IA para produzir materiais em um ritmo muito mais rápido e com custo menor do que antes.

3. Mais detectores de IA

Com o quão convincente a IA se tornou, a capacidade de discernir se um conteúdo é autenticamente humano é crucial para evitar cair em desinformação. Você pode esperar que mais pessoas criem detectores mais confiáveis ​​para garantir que, não importa o quão convincente seja um conteúdo, tudo o que você consome é feito por um ser humano.

4. Maior popularidade da voz AI na indústria do entretenimento

A indústria cinematográfica está se tornando cada vez mais confortável com a dublagem AI, com a Motion Picture Association (MPA) concedendo recentemente a certificação para a startup de dublagem AI Deepdub. Este título garante que a IA da startup possa atender aos altos padrões da indústria do entretenimento.

A Deepdub não está sozinha na oferta de serviços de IA para a indústria do entretenimento. Muitos capitalistas de risco começaram a investir em várias startups de IA para levar a IA às produtoras de filmes como Netflix, Marvel e Lucasfilm.

Em um desenvolvimento semelhante, a empresa de IA Flawless anunciou em maio de 2023 que está fazendo parceria com distribuidores dos EUA e do Reino Unido para lançar versões em inglês de filmes não ingleses em diferentes regiões, dublados e sincronizados por IA.

Com especialistas esperando que o setor valha US$ 416,8 bilhões até 2030, a IA está prestes a se tornar mais integrada para produzir mais conteúdo de alta qualidade para serviços de streaming.

Aplicativos populares de clonagem de voz

Se você deseja clonar sua voz por meio de software, aqui estão algumas ferramentas populares que você pode conferir.

Resemble.AI

O Resemble.AI oferece vários produtos e serviços para ajudá-lo a criar uma voz sintética com a qual esteja satisfeito. Por exemplo, se você quiser substituir algumas palavras em seu áudio gravado sem regravar, o recurso Resemble Fill ajudará a editar o clipe perfeitamente.

Eles também têm uma API de vozes de IA personalizada que os desenvolvedores podem integrar a várias ferramentas que já usam. Sua IA de clonagem de voz precisará apenas de pelo menos três minutos de áudio ou fala 25 frases predeterminadas para aprender vozes.

Além de palavras

O BeyondWords possui uma biblioteca com mais de 550 vozes de IA em mais de 140 idiomas criados de forma ética; a empresa colabora com dubladores por meio de seu contrato de clonagem de voz. Eles também usam processamento de linguagem natural (NLP) para analisar o texto do usuário e convertê-lo em fala com som autêntico.

Relocutor

A Respeecher se orgulha de permitir que criadores de conteúdo, cineastas e desenvolvedores de jogos criem vozes sintéticas. Notavelmente, eles trabalharam com empresas como a Lucasfilms para gerar uma voz gerada por IA para um ator mais velho reprisando seu papel mais jovem e a Mondelez International para produzir marketing altamente direcionado e localizado.

A empresa usa algoritmos de processamento de sinal digital e um modelo generativo profundo para permitir que sua inteligência artificial aprenda e imite não apenas a voz, mas também as emoções e a entrega de passagens.

Onze laboratórios

Muitos conhecem o Eleven Labs por sua biblioteca de vozes de celebridades, que você pode usar prontamente para o seu conteúdo com o produto VoiceLab. Eles mostraram sua expertise dublando o discurso de Leonardo DiCaprio nas Nações Unidas com outras celebridades, como Joe Rogan e Steve Jobs.

A empresa visa gerar vozes com som realista com seu modelo de IA focado na captura de lógica e emoções em textos com sua plataforma Speech Synthesis. Ele reúne contexto sobre cada frase e parágrafo para entender como entoar e falar de forma convincente.

PlayHT

PlatHT tem uma biblioteca de vozes que você pode clonar para seus projetos, de Elon Musk e Neil DeGrasse Tyson a John F. Kennedy e Barack Obama. Seu software de clonagem de voz em tempo real permite criar uma voz sintética que captura o estilo de fala e preserva o sotaque e as nuances da fala do sujeito.

Sua IA de clonagem de voz exigirá pelo menos uma hora de áudio claro para iniciar sua análise vocal e processo de aprendizado.

É importante observar que todas essas empresas delinearam a ética por trás de seus produtos, que você pode ver em seu site.

Mantendo seu ouvido no chão

A clonagem de voz AI pode ter efeitos consideráveis ​​na sociedade, tanto positivos quanto negativos. Enquanto, por um lado, as empresas podem usar a tecnologia para ajudar as pessoas a continuarem “falando” muito depois de perderem a voz por problemas médicos ou criadores para reduzir o tempo de produção.

Dito isto, a IA de clonagem de voz não está completamente livre de preocupações éticas ou legais. Os fraudadores ainda podem usá-lo para se passar por pessoas em esquemas de emergência familiar ou para contornar autenticadores de voz para acessar dados altamente sensíveis e confidenciais.

Enquanto os governos continuam discutindo possíveis leis e políticas sobre o uso apropriado da IA, cabe às empresas privadas usá-la com mais responsabilidade. Isso inclui seguir as melhores práticas de segurança cibernética, como pedir consentimento para acessar os dados do consumidor e praticar a transparência na forma como você usa a tecnologia.

A IA de clonagem de voz continua a evoluir. Manter-se atualizado sobre seus desenvolvimentos mais recentes pode ajudá-lo a entender a melhor forma de usar a tecnologia para agregar valor a seus clientes que a IA não pode replicar.

Pronto para aprender mais? Vamos conversar .