AI 음성 복제: 지금 알아야 할 모든 것
게시 됨: 2023-06-12인공 지능(AI)은 훨씬 더 믿을 수 있게 되었습니다. 최근의 예는 많은 사람들을 속이는 푹신한 재킷을 입은 교황의 바이러스 이미지입니다.
그러나 AI가 설득력 있게 생산할 수 있는 콘텐츠는 이미지만이 아닙니다. 다양한 사용 사례에서 본질적으로 사람의 목소리를 모방하는 AI 음성 복제도 등장하고 있습니다. 예를 들어 조 바이든 대통령의 국정연설 중 목소리를 모방한 것이 그 예입니다.
높은 비즈니스 잠재력을 가진 또 다른 중요한 도구임이 입증되었지만 윤리적 및 법적 문제를 제기할 수 있습니다.
이 기사에서는 음성 복제 AI의 작동 방식, 알아야 할 우려 사항, 이 기술의 미래에서 기대할 수 있는 사항을 엿볼 수 있습니다. 보너스로 윤리적으로 음성을 복제하는 데 사용할 수 있는 몇 가지 앱을 보여드리겠습니다.
AI 음성 복제란?
음성 복제 AI는 인공 지능 소프트웨어를 사용하여 음절 발음에서 억양 패턴에 이르기까지 모든 것을 모방하여 화자의 거의 동일한 음성을 생성합니다.
AI가 미리 정의된 다른 음성을 사용하여 음성을 대체하는 음성 합성과는 다릅니다. AI 음성 복제본이 있으면 어떤 언어나 감정으로든 원하는 대로 말할 수 있기 때문에 둘 다 자주 함께 사용됩니다.
음성 복제 소프트웨어가 학습해야 하는 오디오 클립은 길지 않아도 됩니다. McAfee는 AI가 화자를 학습하고 복사하기에 3초 길이의 음성 클립이면 충분하다고 보고합니다.
전 세계 정부가 여전히 안전한 사용을 위한 최상의 법률과 규정을 결정하고 있기 때문에 이 기술의 잠재력은 엄청납니다. 그동안 많은 사람들이 이미 다양한 목적으로 음성 복제 AI 도구를 실험하기 시작했습니다.
AI 음성 복제 현황
채팅 기반 및 사진 생성 AI와 마찬가지로 전 세계 사람들은 여전히 복제 음성 AI 도구를 가장 잘 사용하는 방법을 파악하고 있습니다. 다음은 사람과 기업이 AI 음성 복제를 사용하는 방법에 대한 일반적인 개요입니다.
무료 AI 음성 복제 소프트웨어의 부상
음성을 복제할 수 있는 능력은 기술에 정통하거나 매우 부유한 사람들에게만 국한된 것이 아닙니다. 현재 수많은 기업이 다양한 가격으로 음성 복제 소프트웨어를 제공하고 있기 때문에 시장이 2028년까지 연평균 성장률(CAGR) 17.2%로 성장할 것이라는 것은 놀라운 일이 아닙니다.
물론 출력 품질은 유료 서비스만큼 설득력이 없을 수 있지만 소프트웨어 유형을 제공하는 비즈니스의 수는 수요를 강조합니다.
유명인 목소리 복제
유명인의 목소리를 모방하는 것은 음성 복제 AI의 가장 인기 있는 사용 사례가 되어 창의적인 경계를 넓히고 잠재적인 법적 문제를 야기합니다. Taylor Swift, Joe Rogan 및 전 미국 대통령을 포함한 많은 유명인들이 AI 음성 복제의 피해자였습니다.
중요한 최근 사례는 2023년 4월 TikTok 사용자 ghostwriter977이 국제 아티스트 Drake와 The Weeknd의 목소리를 사용하여 "Heart on my Sleeve"라는 노래를 발표했을 때 발생했습니다.
많은 사람들은 아티스트의 레이블인 유니버설 뮤직 그룹(Universal Music Group)의 저작권 위반 경고가 내려지기 전에 YouTube에서 230,000회 이상의 조회수와 Spotify에서 625,000회 이상의 스트림을 받은 최초의 바이럴 AI 생성 노래라고 주장합니다.
현대의 유명인사들만이 자신의 목소리를 복제하는 것은 아닙니다.
다큐멘터리 The Andy Warhol Diaries 의 영화 제작자는 소프트웨어를 사용하여 유명한 팝 아티스트 Andy Warhol의 합성 음성을 생성하여 일기의 일부를 설명하고 그의 목소리를 되살리고 기술이 누군가의 정체성을 오랫동안 보존할 수 있는 잠재력을 강조했습니다. 그들이 지나간 후에.
장애인에게 더 많은 접근성 제공
음성 복제 AI의 보다 실용적인 사용 사례 중 하나는 최근 ALS(근위축성 측삭 경화증) 진단을 받은 사람들과 같이 건강상의 합병증으로 인해 음성 또는 말하기 능력을 잃을 위험이 있는 사람들이 자신의 목소리를 보존하도록 돕는 것입니다.
한 가지 예는 브랜드가 2023년 5월에 미리 본 Apple의 개인 음성 기능입니다. 이 소프트웨어를 통해 사용자는 가족과 친구가 인식할 수 있는 합성 음성을 만들 수 있습니다. 그들이 해야 할 일은 소프트웨어가 그들의 음성 프로필을 정확하게 학습하고 복제할 수 있도록 15분 동안 무작위 텍스트의 일부를 큰 소리로 읽는 것입니다.
유사한 서비스인 CoeFont가 일본에서 개발되고 있으며 말을 더듬거나 발성 장애 진단을 받은 사람과 같이 말하기에 어려움이 있는 사람들에게도 무료로 사용할 수 있습니다. 2023년 5월 출시 이후 400명 이상의 사용자가 서비스를 사용했다고 보고했습니다.
콘텐츠 더빙 및 현지화
특히 약 10명 중 7명의 소비자(68%)가 자신의 모국어로 콘텐츠를 제공하는 브랜드로 전환할 것이라고 말했기 때문에 더 많은 기업이 세계화된 세계에서 현지화된 콘텐츠의 필요성을 이해하고 있습니다.
콘텐츠를 현지화하는 전통적인 방법은 콘텐츠를 더빙하기 위해 번역가 또는 외국 성우를 고용하는 것입니다. 그러나 기술 혁신 덕분에 선택 사항일 수 있습니다.
AI 더빙은 콘텐츠 제작자와 제작사가 외국 성우를 고용하지 않고도 다양한 국제 시장을 위해 콘텐츠를 더빙할 수 있도록 하는 새로운 트렌드가 되고 있습니다. 엔터테인먼트 회사는 이제 시리즈, 영화 및 노래를 다른 언어로 출시하여 현지 관객에게 어필할 수 있습니다.
예를 들어 K-pop 아티스트 Midnatt는 자신의 노래 "Masquerade"를 영어로 발표하고 음성 AI를 사용하여 6개 언어 버전을 발표합니다. YouTube에서 뮤직 비디오를 시청하는 시청자는 설정을 클릭하여 오디오 트랙을 자신의 언어로 변경하여 차이점을 들을 수 있습니다.
그의 음반사는 심지어 여성으로서의 그의 목소리를 합성하여 그가 자신의 노래에 피처링할 수 있도록 하여 솔로 뮤지션들에게 방대한 창작 기회를 제공했습니다.
사기에 기여
2023년 4월 초 애리조나 주에 거주하는 제니퍼 드스테파노(Jennifer DeStefano)가 경험한 것처럼 합성 음성을 만들어 사이버 범죄자들이 순진한 피해자에게 사기를 칠 수 있게 되었습니다. 범죄자들은 몸값을 요구했습니다. 그러나 그녀의 딸은 계속해서 안전했습니다.
미연방통상위원회(FTC)는 AI가 사기꾼들이 가족 비상 계획을 강화할 수 있게 하여 사랑하는 사람이 곤경에 처했다는 말을 듣는 것이 훨씬 더 설득력 있게 들린다고 말했습니다. 이러한 순간에 일부 전문가는 사랑하는 사람과 "AI safeword"에 동의하여 목소리가 실제로 그들에게서 나온 것인지 확인하도록 권장합니다.
그럼에도 불구하고 공개적으로 액세스할 수 있는 AI 음성 복제 소프트웨어의 부정적인 영향은 분명합니다. 많은 사람들이 이 기술에 대해 음성을 복제하려는 경우 알아야 할 윤리적 및 법적 문제를 제기했습니다.
음성 복제 AI의 윤리적, 법적 문제
치리회, 기업 및 사용자는 AI 음성 복제가 가져올 수 있는 모든 윤리적 및 법적 문제를 이해하기 위해 여전히 노력하고 있습니다. 아직 초기 기술이지만 다음은 알아야 할 몇 가지 널리 퍼진 문제입니다.
동의 및 개인 정보 보호 영향
사기꾼이 특정 음성을 학습하도록 음성 복제 소프트웨어를 쉽게 훈련할 수 있기 때문에 콘텐츠 제작자와 음악가는 사기 및 사칭의 위험에 노출됩니다. 이러한 사례는 아티스트와 콘텐츠 제작자가 자신의 목소리에 저작권을 부여해야 하는지 여부에 의문을 제기합니다.
또한 신원 도용 가능성이 훨씬 높기 때문에 사람들의 생계가 위협받고 있습니다.
범죄자가 음성 기반 인증 시스템을 우회하도록 허용하여 개인 정보 보호 및 사이버 보안을 위협합니다. 이것은 범죄자들이 음성 인식을 통해 신원을 확인하기 위한 성문 보안 시스템을 속이기 위해 합성 음성을 사용한 Centrelink와 호주 국세청(ATO)에 발생했습니다.
잘못된 정보 및 조작
AI 딥페이크는 커뮤니티를 분열시키고 조작하겠다고 위협하면서 계속해서 뜨거운 토론 주제가 되고 있습니다. 문제는 음성 복제 AI가 정부가 규제할 수 있는 것보다 더 빠르게 매우 설득력 있게 진화하고 있다는 것입니다.
온라인 트롤이 유명인이 불쾌감을 주는 댓글이나 농담을 하는 오디오를 공개하면 유명인의 평판을 조작하고 영향을 미칠 수 있습니다. 최근의 예는 히틀러의 Mein Kampf를 읽는 영국 여배우 엠마 왓슨의 목소리입니다.
인간 성우와 직업 이동에 미치는 영향
AI가 점점 더 전통적으로 인간의 작업을 수행할 수 있게 됨에 따라 많은 사람들이 직업 안정성에 대해 걱정합니다. 음성 복제 AI는 특히 성우를 위협합니다.
이미 AI가 사람들이 자신의 프로젝트에 사용하기 위해 자신의 목소리를 복사하는 것을 발견하고 성우들이 충격을 받은 사건이 있었습니다. 2023년 2월, 몇몇 비디오 게임 성우들은 자신이 받은 계약을 공개적으로 비난하면서 목소리를 AI에 양도하도록 요구했습니다.
AI를 사용하여 내레이션을 하거나 콘텐츠를 더빙하는 것이 훨씬 쉬워지면 성우는 어떻게 될까요? 잠재적으로 수천 명의 성우를 직업으로 만들 수 있기 때문에 조사할 가치가 있는 질문입니다.
AI 음성 복제 상태는 복잡합니다. 많은 사람들이 여전히 이 기술을 실험하고 있습니다. 이를 감안할 때 음성 복제 AI의 미래를 고려해 볼 가치가 있습니다.
AI 음성 복제로 기대할 수 있는 것
음성 복제 AI에 대한 설정은 없습니다. 세계가 이 기술의 가능성을 계속해서 이해하고 발견함에 따라 미래에 어떤 일이 일어날지 고려하는 것이 가장 좋습니다.
1. 정부 규제 강화 및 윤리적 논의 확대
정부는 음성 복제 AI 사용에 대해 더 엄격한 규제를 부과할 가능성이 높습니다. Richard Blumenthal 상원의원은 최근 미국 상원 청문회에서 이 기술이 자신의 개회사를 낭독하도록 함으로써 음성 복제 소프트웨어가 얼마나 설득력이 있는지 강조했습니다.
이러한 규정 및 정책에는 무엇이 포함될 수 있습니까? 그들은 AI를 통해 누구의 목소리를 복제할 수 있는지 다루고 기술의 정확한 목적을 정의할 수 있습니다. 기업이 프로세스에 음성 AI를 사용하는지 여부를 공개해야 한다고 규정할 수 있습니다. 또한 법원은 여전히 AI 생성 음성에 대한 권리를 누가 소유하는지 결정해야 합니다.
이러한 법적 매개 변수는 사람들이 복제 음성 AI의 위험과 위험으로부터 보호하는 데 도움이 될 수 있습니다.
2. 콘텐츠 제작 활용도 증가
음성 복제 앱에는 윤리적인 용도가 있습니다. 예를 들어 얼굴 없는 YouTube 콘텐츠를 제작하는 비디오 콘텐츠 제작자라면 음성 복제 소프트웨어가 생산성 도구가 될 수 있습니다. 음성을 모방하도록 AI를 훈련하면 더 이상 마이크 앞에서 오디오를 녹음하고 다시 녹음하는 데 몇 시간을 소비할 필요가 없으므로 제작 시간을 크게 줄일 수 있습니다.
또 다른 하나는 AI 마케팅으로, AI를 활용하여 이전보다 훨씬 빠른 속도와 저렴한 비용으로 재료를 생산할 수 있습니다.
3. 더 많은 AI 탐지기
AI가 얼마나 설득력 있게 되었는지에 따라 잘못된 정보에 속지 않으려면 콘텐츠의 일부가 진정으로 인간인지 식별하는 능력이 중요합니다. 더 많은 사람들이 더 신뢰할 수 있는 탐지기를 만들어 콘텐츠가 아무리 설득력이 있더라도 사용자가 소비하는 모든 것이 사람이 만든 것임을 확인할 수 있습니다.
4. 엔터테인먼트 산업에서 AI 보이스의 대중화
최근 영화 협회(MPA)가 AI 더빙 스타트업 Deepdub에 인증을 수여하면서 영화 제작 업계는 AI 더빙에 점점 더 익숙해지고 있습니다. 이 타이틀은 스타트업의 AI가 엔터테인먼트 산업의 높은 기준을 충족할 수 있음을 보장합니다.
Deepdub만이 엔터테인먼트 산업에 AI 서비스를 제공하는 것은 아닙니다. 많은 벤처 자본가들이 Netflix, Marvel, Lucasfilm과 같은 영화 제작사에 AI를 제공하기 위해 수많은 AI 스타트업에 투자하기 시작했습니다.
유사한 개발에서 AI 회사인 Flawless는 2023년 5월 미국 및 영국 배급사와 협력하여 영어가 아닌 영어 버전의 영화를 다른 지역에 출시하고 AI가 더빙하고 립싱크한다고 발표했습니다.
전문가들은 업계가 2030년까지 4,168억 달러의 가치가 있을 것으로 예상하면서 AI는 스트리밍 서비스를 위한 더 많은 고품질 콘텐츠를 생산하기 위해 더욱 통합될 준비가 되어 있습니다.
인기 있는 음성 복제 앱
소프트웨어를 통해 음성을 복제하려는 경우 확인할 수 있는 몇 가지 인기 있는 도구는 다음과 같습니다.
닮다.AI
Resemble.AI는 사용자가 만족하는 합성 음성을 만들 수 있도록 다양한 제품과 서비스를 제공합니다. 예를 들어, 다시 녹음하지 않고 녹음된 오디오에서 몇 단어를 바꾸려는 경우 Resemble Fill 기능을 사용하면 클립을 매끄럽게 편집할 수 있습니다.
또한 개발자가 이미 사용하고 있는 다양한 도구에 통합할 수 있는 Custom AI Voices API도 있습니다. 그들의 음성 복제 AI는 음성을 학습하기 위해 최소 3분의 오디오 또는 25개의 미리 결정된 문장을 말하기만 하면 됩니다.
더 말할 나위없이
BeyondWords에는 윤리적으로 생성된 140개 이상의 언어로 된 550개 이상의 AI 음성 라이브러리가 있습니다. 회사는 음성 복제 계약을 통해 성우들과 협력합니다. 또한 자연어 처리(NLP)를 사용하여 사용자 텍스트를 분석하고 실제 음성으로 변환합니다.
Respeecher
Respeecher는 콘텐츠 제작자, 영화 제작자 및 게임 개발자가 합성 음성을 만들 수 있다는 점에 자부심을 느낍니다. 특히 그들은 루카스필름(Lucasfilms)과 같은 회사와 협력하여 나이든 배우가 젊은 역할을 대신할 수 있도록 AI 생성 음성을 생성하고 Mondelez International은 고도로 타겟팅되고 현지화된 마케팅을 생성했습니다.
이 회사는 디지털 신호 처리 알고리즘과 심층 생성 모델을 모두 사용하여 인공 지능이 음성뿐만 아니라 구절의 감정과 전달을 학습하고 모방할 수 있도록 합니다.
일레븐랩스
많은 사람들이 유명인 목소리 라이브러리로 Eleven Labs를 알고 있으며, VoiceLab 제품과 함께 콘텐츠에 쉽게 사용할 수 있습니다. 이들은 레오나르도 디카프리오의 유엔 연설을 조 로건, 스티브 잡스 등 다른 유명인들과 더빙해 전문성을 과시했다.
이 회사는 음성 합성 플랫폼을 통해 텍스트의 논리와 감정을 캡처하는 데 중점을 둔 AI 모델로 사실적으로 들리는 음성을 생성하는 것을 목표로 합니다. 억양과 설득력있게 말하는 방법을 이해하기 위해 각 문장과 단락에 대한 맥락을 수집합니다.
플레이HT
PlatHT에는 Elon Musk와 Neil DeGrasse Tyson에서 John F. Kennedy와 Barack Obama에 이르기까지 프로젝트를 위해 복제할 수 있는 음성 라이브러리가 있습니다. 실시간 음성 복제 소프트웨어를 사용하면 말하는 스타일을 캡처하고 대상의 억양과 말하는 뉘앙스를 보존하는 합성 음성을 만들 수 있습니다.
그들의 음성 복제 AI는 음성 분석 및 학습 프로세스를 시작하기 위해 최소 1시간의 명확한 말하기 오디오가 필요합니다.
이러한 모든 회사는 웹사이트에서 볼 수 있는 제품 뒤의 윤리를 설명했습니다.
귀를 땅에 대고
AI 음성 복제는 긍정적인 측면과 부정적인 측면 모두에서 사회에 상당한 영향을 미칠 수 있습니다. 한편으로 기업은 기술을 사용하여 사람들이 질병이나 제작자로 인해 목소리를 잃은 후에도 오랫동안 "말"을 계속하여 제작 시간을 단축할 수 있도록 도울 수 있습니다.
즉, 음성 복제 AI는 윤리적 또는 법적 문제에서 완전히 자유롭지 않습니다. 사기꾼은 가족 비상 계획에 있는 사람을 사칭하거나 매우 민감한 기밀 데이터에 액세스하기 위해 음성 인증기를 우회하는 데 여전히 이를 사용할 수 있습니다.
정부는 적절한 AI 사용에 관한 가능한 법률과 정책을 계속 논의하고 있지만 이를 보다 책임감 있게 사용하는 것은 민간 기업의 몫입니다. 여기에는 소비자 데이터 액세스에 대한 동의 요청 및 기술 사용 방식에 대한 투명성 실천과 같은 사이버 보안 모범 사례를 따르는 것이 포함됩니다.
음성 복제 AI는 계속 진화하고 있습니다. 최신 개발에 대한 업데이트를 유지하면 AI가 복제할 수 없는 고객에게 가치를 제공하기 위해 기술을 가장 잘 사용하는 방법을 이해하는 데 도움이 될 수 있습니다.
자세히 알아볼 준비가 되셨습니까? 이야기하자 .