Kloning Suara AI: Semua yang Perlu Anda Ketahui Untuk Saat Ini

Diterbitkan: 2023-06-12

Kecerdasan buatan (AI) telah menjadi jauh lebih dapat dipercaya, dengan contoh baru-baru ini adalah gambar viral Paus dengan jaket bengkak yang membodohi banyak orang.

Tetapi gambar bukan satu-satunya konten yang dapat diproduksi oleh AI secara meyakinkan—kloning suara AI, yang pada dasarnya meniru suara seseorang untuk kasus penggunaan yang berbeda, juga muncul. Contohnya adalah peniruan suara Presiden Joe Biden dalam pidato kenegaraannya.

Ini terbukti menjadi alat penting lainnya dengan potensi bisnis yang tinggi tetapi dapat meningkatkan masalah etika dan hukum.

Artikel ini akan memberi Anda gambaran sekilas tentang cara kerja AI kloning suara, kekhawatiran yang perlu Anda waspadai, dan apa yang dapat Anda harapkan dari masa depan teknologi ini. Sebagai bonus, kami akan menunjukkan kepada Anda beberapa aplikasi yang dapat Anda gunakan untuk mengkloning suara Anda—tentu saja secara etis.

Apa itu Kloning Suara AI?

Kloning suara AI menggunakan perangkat lunak kecerdasan buatan untuk membuat suara pembicara yang hampir identik, meniru semuanya mulai dari pengucapan suku kata hingga pola intonasi.

Ini berbeda dari sintesis ucapan, di mana AI menggunakan suara berbeda yang telah ditentukan sebelumnya untuk menggantikan ucapan. Keduanya sering digunakan bersamaan karena setelah Anda memiliki tiruan suara AI, Anda dapat menggunakannya untuk mengatakan apa pun yang Anda inginkan dalam bahasa atau emosi apa pun.

Klip audio yang perlu dipelajari oleh perangkat lunak kloning suara tidak harus panjang. McAfee melaporkan bahwa klip suara tiga detik cukup lama bagi AI untuk mempelajari dan menyalin pembicara.

Potensi teknologi ini sangat mencengangkan, karena pemerintah di seluruh dunia masih menentukan undang-undang dan peraturan terbaik untuk penggunaan yang aman. Sementara itu, banyak orang sudah mulai bereksperimen dengan alat AI tiruan suara untuk berbagai keperluan.

Kondisi Kloning Suara AI Saat Ini

Sama seperti AI berbasis obrolan dan penghasil foto, orang-orang di seluruh dunia masih memikirkan cara terbaik untuk menggunakan alat AI suara tiruan. Di bawah ini adalah gambaran umum tentang bagaimana orang dan bisnis menggunakan kloning suara AI.

Bangkitnya perangkat lunak kloning suara AI gratis

Kemampuan untuk mengkloning suara tidak eksklusif untuk orang yang paham teknologi atau super kaya. Karena banyak bisnis sekarang menawarkan perangkat lunak kloning suara dengan harga bervariasi, tidak mengherankan bahwa pasar akan tumbuh pada tingkat pertumbuhan tahunan gabungan (CAGR) sebesar 17,2% pada tahun 2028.

Tentu saja, kualitas keluaran mungkin tidak meyakinkan seperti layanan berbayar, tetapi jumlah bisnis yang menawarkan jenis perangkat lunak menggarisbawahi permintaan tersebut.

Mereplikasi suara selebriti

Meniru suara selebritas telah menjadi kasus penggunaan AI yang paling populer untuk mengkloning suara, mendorong batasan kreatif dan menarik potensi masalah hukum. Banyak orang terkenal, termasuk Taylor Swift, Joe Rogan, dan mantan presiden AS, telah menjadi korban kloning suara AI.

Contoh signifikan baru-baru ini terjadi pada April 2023, ketika pengguna TikTok pengarang untuk orang lain977 merilis lagu "Heart on my Sleeve", menggunakan suara artis internasional Drake dan The Weeknd — meskipun tidak ada yang benar-benar bernyanyi atau terhubung ke proyek dalam kapasitas apa pun.

Banyak yang berpendapat bahwa itu adalah lagu viral pertama yang dibuat oleh AI, menerima lebih dari 230.000 penayangan di YouTube dan 625.000 streaming di Spotify sebelum hak cipta dicabut dari Universal Music Group — label artis — menghapusnya.

Selebriti zaman modern bukan satu-satunya yang suaranya direplikasi.

Pembuat film dokumenter The Andy Warhol Diaries menggunakan perangkat lunak untuk membuat suara sintetik dari artis pop terkenal, Andy Warhol, untuk menceritakan sebagian dari buku hariannya, menghidupkan kembali suaranya dan menyoroti bagaimana teknologi memiliki potensi untuk melestarikan identitas seseorang untuk waktu yang lama. setelah mereka lewat.

Memberikan lebih banyak aksesibilitas bagi penyandang disabilitas

Salah satu kasus penggunaan AI kloning suara yang lebih praktis adalah untuk membantu mereka yang berisiko kehilangan suara atau kemampuan berbicara karena komplikasi kesehatan, seperti yang baru saja didiagnosis menderita ALS (amyotrophic lateral sclerosis), untuk mempertahankan suaranya.

Salah satu contohnya adalah fitur Suara Pribadi Apple, yang dipratinjau oleh merek tersebut pada Mei 2023. Perangkat lunak tersebut memungkinkan pengguna membuat suara sintetis yang dapat dikenali oleh keluarga dan teman mereka. Yang perlu mereka lakukan hanyalah membaca bagian dari teks acak dengan keras selama 15 menit agar perangkat lunak dapat mempelajari dan mereplikasi profil vokal mereka secara akurat.

Layanan serupa, CoeFont, sedang dikembangkan di Jepang yang bahkan menawarkan penggunaan gratis bagi orang-orang yang mengalami kesulitan berbicara, seperti mereka yang gagap atau didiagnosis dengan Disfonia. Mereka telah melaporkan bahwa lebih dari 400 pengguna telah menggunakan layanan mereka sejak diluncurkan pada Mei 2023.

Dubbing dan melokalkan konten

Semakin banyak bisnis yang memahami kebutuhan akan konten lokal di dunia global, terutama karena sekitar tujuh dari sepuluh konsumen (68%) mengatakan bahwa mereka akan beralih ke merek yang menawarkan konten dalam bahasa asli mereka.

Metode tradisional untuk melokalkan konten adalah dengan menyewa penerjemah atau pengisi suara asing untuk mengisi suara konten. Namun, berkat inovasi teknologi, itu mungkin opsional.

Sulih suara AI menjadi tren yang sedang berkembang untuk memungkinkan pembuat konten dan perusahaan produksi menjuluki konten mereka untuk berbagai pasar internasional tanpa mempekerjakan artis sulih suara asing. Perusahaan hiburan sekarang dapat merilis serial, film, dan lagu dalam berbagai bahasa untuk menarik penonton lokal.

Contohnya adalah artis K-pop Midnatt yang merilis lagunya, “Masquerade,” dalam bahasa Inggris dan menggunakan AI suara untuk merilis versi dalam enam bahasa. Pemirsa yang menonton video musik di YouTube dapat mengeklik Setelan untuk mengubah trek audio ke bahasa mereka untuk mendengar perbedaannya.

Label rekamannya bahkan mampu mensintesis suaranya sebagai seorang wanita sehingga dia dapat tampil di lagunya sendiri, menghadirkan peluang kreatif yang luas bagi musisi solo.

Berkontribusi pada penipuan

Menciptakan suara sintetik telah memungkinkan penjahat dunia maya untuk menipu korban yang sederhana, seperti yang dialami Jennifer DeStefano, seorang ibu di Arizona, pada awal April 2023. Dia menerima panggilan telepon yang mengkhawatirkan dari siapa yang dia yakini sebagai putrinya, menangis dan mengatakan bahwa dia telah diculik dan para penjahat menuntut uang tebusan. Namun, putrinya aman selama ini.

Komisi Perdagangan Federal AS (FTC) mengatakan bahwa AI telah memungkinkan scammer untuk meningkatkan skema darurat keluarga mereka, membuatnya terdengar jauh lebih meyakinkan bagi Anda untuk mendengar orang yang dicintai mengatakan bahwa mereka dalam masalah. Pada saat-saat ini, beberapa ahli merekomendasikan untuk menyetujui "kata kunci AI" dengan orang yang Anda cintai untuk memastikan bahwa suara tersebut benar-benar berasal dari mereka.

Terlepas dari itu, implikasi negatif dari perangkat lunak kloning suara AI yang dapat diakses publik sudah jelas. Banyak orang telah mengemukakan masalah etika dan hukum tentang teknologi ini yang harus Anda waspadai jika ingin mengkloning suara Anda.

Kekhawatiran Etis dan Hukum AI Kloning Suara

Badan pengatur, bisnis, dan pengguna masih bekerja untuk memahami semua masalah etika dan hukum yang dapat ditimbulkan oleh tiruan suara AI. Meski masih merupakan teknologi yang baru lahir, berikut adalah beberapa masalah umum yang harus diperhatikan.

Persetujuan dan implikasi privasi

Kemudahan scammers dapat melatih perangkat lunak kloning suara untuk mempelajari suara tertentu membuat pembuat konten dan musisi berisiko mengalami penipuan dan peniruan identitas. Contoh-contoh ini mempertanyakan apakah artis dan pembuat konten harus memiliki hak cipta atas suara mereka atau tidak.

Selain itu, mata pencaharian masyarakat terancam karena potensi pencurian identitas jauh lebih tinggi.

Itu mengancam privasi dan keamanan dunia maya dengan memungkinkan penjahat melewati sistem otentikasi berbasis suara. Hal ini terjadi pada Centrelink dan Kantor Perpajakan Australia (ATO), di mana penjahat menggunakan suara sintetis untuk mengelabui sistem keamanan cetak suara yang dimaksudkan untuk memverifikasi identitas melalui pengenalan suara.

Misinformasi dan manipulasi

Deepfake AI terus menjadi topik diskusi hangat, mengancam untuk memecah belah dan memanipulasi komunitas. Kekhawatirannya adalah kloning suara AI berkembang menjadi sangat meyakinkan lebih cepat daripada yang dapat diatur oleh pemerintah.

Itu dapat memanipulasi dan memengaruhi reputasi selebritas jika troll online merilis audio selebritas yang melontarkan komentar atau lelucon yang menyinggung; contoh baru-baru ini adalah suara aktris Inggris Emma Watson membaca Mein Kampf karya Hitler.

Dampak pada aktor suara manusia dan perpindahan pekerjaan

Banyak orang khawatir tentang keamanan pekerjaan mereka karena AI menjadi semakin mampu melakukan tugas-tugas tradisional manusia. Kloning suara AI mengancam aktor suara, khususnya.

Sudah ada insiden di mana pengisi suara terkejut menemukan AI menyalin vokal mereka untuk digunakan orang untuk proyek mereka. Pada Februari 2023, beberapa pengisi suara video game secara terbuka mengutuk kontrak yang mereka terima, mengharuskan mereka untuk menyerahkan suara mereka ke AI.

Apa yang akan terjadi pada pengisi suara jika semakin mudah menggunakan AI untuk menceritakan atau menjuluki konten untuk Anda? Ini adalah pertanyaan yang patut diperhatikan karena berpotensi menyebabkan ribuan pengisi suara pekerjaan mereka.

Keadaan kloning suara AI itu rumit. Banyak yang masih bereksperimen dengan teknologi. Mengingat hal itu, ada baiknya untuk mempertimbangkan apa yang akan terjadi di masa depan untuk AI kloning suara.

Yang Dapat Anda Harapkan dengan Kloning Suara AI

Tidak ada yang diatur tentang AI kloning suara. Saat dunia terus memahami dan menemukan kemungkinan teknologi ini, yang terbaik adalah mempertimbangkan apa yang mungkin terjadi di masa depan.

1. Regulasi pemerintah yang lebih ketat dan diskusi etika yang lebih luas

Pemerintah kemungkinan akan memberlakukan peraturan yang lebih ketat tentang penggunaan AI kloning suara. Senator Richard Blumenthal menyoroti betapa meyakinkannya perangkat lunak kloning suara dengan membuat teknologi tersebut membacakan pernyataan pembukaannya pada sidang Senat AS baru-baru ini.

Apa yang mungkin termasuk dalam peraturan dan kebijakan ini? Mereka mungkin membahas suara siapa yang dapat dikloning melalui AI dan menentukan tujuan pasti dari teknologi tersebut. Itu dapat menetapkan bahwa perusahaan harus mengungkapkan apakah mereka menggunakan AI suara atau tidak untuk setiap proses mereka. Selain itu, pengadilan masih harus menentukan siapa yang memiliki hak atas suara yang dihasilkan AI.

Parameter hukum ini dapat membantu orang melindungi dari risiko dan bahaya AI suara tiruan.

2. Peningkatan penggunaan untuk pembuatan konten

Ada penggunaan etis untuk aplikasi kloning suara. Misalnya, perangkat lunak kloning suara dapat menjadi alat produktivitas jika Anda adalah pembuat konten video yang memproduksi konten YouTube tanpa wajah. Melatih AI untuk meniru suara Anda dapat secara signifikan mengurangi waktu produksi karena Anda tidak perlu lagi menghabiskan waktu berjam-jam untuk merekam dan merekam ulang audio di depan mikrofon.

Lainnya adalah pemasaran AI, yang memungkinkan Anda memanfaatkan AI untuk menghasilkan bahan dengan kecepatan yang jauh lebih cepat dan biaya lebih rendah dari sebelumnya.

3. Lebih banyak detektor AI

Dengan betapa meyakinkannya AI, kemampuan untuk membedakan apakah suatu konten benar-benar manusia sangat penting untuk menghindari kesalahan informasi. Anda dapat berharap untuk melihat lebih banyak orang membuat pendeteksi yang lebih andal untuk memastikan bahwa, tidak peduli seberapa meyakinkan sebuah konten, semua yang Anda konsumsi dibuat oleh manusia.

4. Popularitas suara AI yang lebih besar di industri hiburan

Industri pembuatan film menjadi semakin nyaman dengan dubbing AI, dengan Motion Picture Association (MPA) baru-baru ini memberikan sertifikasi kepada startup dubbing AI Deepdub. Judul ini memastikan bahwa AI startup dapat memenuhi standar tinggi industri hiburan.

Deepdub tidak sendirian dalam menawarkan layanan AI ke industri hiburan. Banyak pemodal ventura telah mulai berinvestasi di banyak startup AI untuk membawa AI ke perusahaan produksi film seperti Netflix, Marvel, dan Lucasfilm.

Dalam perkembangan serupa, perusahaan AI Flawless mengumumkan pada Mei 2023 bahwa mereka bermitra dengan distributor AS dan Inggris Raya untuk merilis film non-Inggris versi bahasa Inggris ke berbagai wilayah, yang di-dubbing dan disinkronkan bibir oleh AI.

Dengan para ahli mengharapkan industri ini bernilai $416,8 miliar pada tahun 2030, AI siap untuk menjadi lebih terintegrasi untuk menghasilkan lebih banyak konten berkualitas tinggi untuk layanan streaming.

Aplikasi Kloning Suara Populer

Jika Anda ingin mengkloning suara Anda melalui perangkat lunak, berikut adalah beberapa alat populer yang dapat Anda lihat.

Mirip.AI

Resemble.AI menawarkan berbagai produk dan layanan untuk membantu Anda menciptakan suara sintetik yang Anda sukai. Misalnya, jika Anda ingin mengganti beberapa kata dalam rekaman audio tanpa merekam ulang, fitur Resemble Fill mereka akan membantu mengedit klip dengan mulus.

Mereka juga memiliki pengembang API Suara AI Kustom yang dapat diintegrasikan ke dalam berbagai alat yang sudah mereka gunakan. AI kloning suara mereka hanya membutuhkan setidaknya tiga menit audio atau berbicara 25 kalimat yang telah ditentukan sebelumnya untuk mempelajari suara.

Diluar kata-kata

BeyondWords memiliki perpustakaan lebih dari 550 suara AI dalam lebih dari 140 bahasa yang dibuat secara etis; perusahaan berkolaborasi dengan pengisi suara melalui Kontrak Kloning Suara. Mereka juga menggunakan Natural Language Processing (NLP) untuk menganalisis teks pengguna dan mengubahnya menjadi ucapan yang terdengar otentik.

Penjawab

Respeecher bangga karena mengizinkan pembuat konten, pembuat film, dan pengembang game untuk membuat suara sintetik. Khususnya, mereka telah bekerja dengan perusahaan seperti Lucasfilms untuk menghasilkan suara yang dihasilkan AI untuk aktor yang lebih tua yang mengulangi perannya yang lebih muda dan Mondelez International untuk menghasilkan pemasaran yang sangat tertarget dan terlokalisasi.

Perusahaan menggunakan algoritme pemrosesan sinyal digital dan model generatif yang mendalam untuk memungkinkan kecerdasan buatannya mempelajari dan meniru tidak hanya suara tetapi juga emosi dan pengiriman bagian.

Sebelas Lab

Banyak yang tahu Eleven Labs untuk perpustakaan suara selebritas mereka, yang dapat Anda gunakan dengan mudah untuk konten Anda dengan produk VoiceLab mereka. Mereka memamerkan keahliannya dengan mengisi suara pidato Leonardo DiCaprio di PBB bersama selebriti lain, seperti Joe Rogan dan Steve Jobs.

Perusahaan bertujuan untuk menghasilkan suara yang terdengar realistis dengan model AI-nya yang berfokus pada menangkap logika dan emosi dalam teks dengan platform Speech Synthesis. Itu mengumpulkan konteks tentang setiap kalimat dan paragraf untuk memahami bagaimana intonasi dan berbicara dengan meyakinkan.

Mainkan HT

PlatHT memiliki perpustakaan suara yang dapat Anda tiru untuk proyek Anda, dari Elon Musk dan Neil DeGrasse Tyson hingga John F. Kennedy dan Barack Obama. Perangkat lunak Kloning Suara real-time mereka memungkinkan Anda membuat suara sintetis yang menangkap gaya bicara dan mempertahankan aksen dan nuansa bicara subjek.

AI kloning suara mereka akan membutuhkan setidaknya satu jam audio bicara yang jelas untuk memulai analisis vokal dan proses pembelajarannya.

Penting untuk dicatat bahwa semua perusahaan ini telah menguraikan etika di balik produk mereka, yang dapat Anda lihat di situs web mereka.

Menjaga Telinga Anda ke Tanah

Kloning suara AI dapat memiliki efek yang cukup besar pada masyarakat, baik positif maupun negatif. Sementara di satu sisi, bisnis dapat menggunakan teknologi untuk membantu orang terus “berbicara” lama setelah kehilangan suara karena kondisi medis atau pembuat konten untuk mengurangi waktu produksi.

Meskipun demikian, AI kloning suara tidak sepenuhnya bebas dari masalah etika atau hukum. Penipu mungkin masih menggunakannya untuk menyamar sebagai orang dalam skema darurat keluarga atau melewati autentikator suara untuk mengakses data yang sangat sensitif dan rahasia.

Sementara pemerintah terus membahas kemungkinan undang-undang dan kebijakan seputar penggunaan AI yang tepat, tergantung pada perusahaan swasta untuk menggunakannya secara lebih bertanggung jawab. Itu termasuk mengikuti praktik terbaik keamanan siber, seperti meminta persetujuan untuk akses ke data konsumen dan mempraktikkan transparansi dengan cara Anda menggunakan teknologi.

Kloning suara AI terus berkembang. Tetap mengikuti perkembangan terbarunya dapat membantu Anda memahami cara terbaik menggunakan teknologi untuk memberikan nilai kepada pelanggan Anda yang tidak dapat ditiru oleh AI.

Siap untuk belajar lebih banyak? Mari kita bicara .