AI Voice Cloning: ทุกสิ่งที่คุณต้องรู้ในตอนนี้

เผยแพร่แล้ว: 2023-06-12

ปัญญาประดิษฐ์ (AI) กลายเป็นสิ่งที่น่าเชื่อถือมากขึ้น โดยตัวอย่างล่าสุดเป็นภาพไวรัสของสมเด็จพระสันตะปาปาในเสื้อแจ๊กเก็ตตัวพองที่หลอกคนจำนวนมาก

แต่รูปภาพไม่ใช่เนื้อหาเพียงชิ้นเดียวที่ AI สามารถสร้างได้อย่างน่าเชื่อถือ—การโคลนเสียงของ AI ซึ่งโดยพื้นฐานแล้วเป็นการเลียนแบบเสียงของคนๆ หนึ่งสำหรับกรณีการใช้งานต่างๆ ก็กำลังเกิดขึ้นเช่นกัน ตัวอย่างคือการเลียนแบบเสียงของประธานาธิบดีโจ ไบเดน ระหว่างที่อยู่ในสถานะของสหภาพ

เครื่องมือนี้ได้รับการพิสูจน์แล้วว่าเป็นเครื่องมือสำคัญอีกชิ้นหนึ่งที่มีศักยภาพทางธุรกิจสูง แต่สามารถก่อให้เกิดข้อกังวลด้านจริยธรรมและกฎหมายได้

บทความนี้จะให้ข้อมูลเบื้องต้นเกี่ยวกับวิธีการทำงานของ AI การโคลนเสียง ข้อกังวลที่คุณต้องทราบ และสิ่งที่คุณคาดหวังได้จากอนาคตของเทคโนโลยีนี้ เพื่อเป็นโบนัส เราจะแสดงแอปสองสามแอปที่คุณสามารถใช้เพื่อโคลนเสียงของคุณ ซึ่งแน่นอนว่าตามหลักจริยธรรมแล้ว

AI Voice Cloning คืออะไร?

AI การโคลนเสียงใช้ซอฟต์แวร์ปัญญาประดิษฐ์เพื่อสร้างเสียงที่ใกล้เคียงกันของผู้พูด โดยเลียนแบบทุกอย่างตั้งแต่การออกเสียงพยางค์ไปจนถึงรูปแบบการออกเสียงสูงต่ำ

ซึ่งแตกต่างจากการสังเคราะห์เสียงพูดตรงที่ AI ใช้เสียงที่แตกต่างกันและกำหนดไว้ล่วงหน้าเพื่อแทนที่เสียงพูด ทั้งสองอย่างมักจะใช้ร่วมกัน เนื่องจากเมื่อคุณมี AI Voice Clone แล้ว คุณสามารถใช้มันเพื่อพูดสิ่งที่คุณต้องการในภาษาหรืออารมณ์ใดก็ได้

คลิปเสียงที่ซอฟต์แวร์โคลนเสียงจำเป็นต้องเรียนรู้ไม่จำเป็นต้องยาว McAfee รายงานว่าคลิปเสียงความยาว 3 วินาทีนั้นยาวพอที่ AI จะเรียนรู้และคัดลอกผู้พูดได้

ศักยภาพของเทคโนโลยีนี้น่าทึ่งมาก เนื่องจากรัฐบาลทั่วโลกยังคงกำหนดกฎหมายและข้อบังคับที่ดีที่สุดเพื่อการใช้งานอย่างปลอดภัย ในขณะเดียวกัน หลายคนได้เริ่มทดลองใช้เครื่องมือ AI โคลนเสียงเพื่อวัตถุประสงค์ต่างๆ แล้ว

สถานะปัจจุบันของการโคลนเสียง AI

เช่นเดียวกับ AI ที่ใช้การแชทและการสร้างภาพถ่าย ผู้คนทั่วโลกยังคงหาวิธีใช้เครื่องมือ AI เสียงโคลนที่ดีที่สุด ด้านล่างนี้เป็นภาพรวมทั่วไปเกี่ยวกับวิธีที่ผู้คนและธุรกิจใช้การโคลนเสียงของ AI

การเพิ่มขึ้นของซอฟต์แวร์การโคลนเสียง AI ฟรี

ความสามารถในการโคลนเสียงไม่ได้จำกัดเฉพาะผู้ที่มีความชำนาญด้านเทคโนโลยีหรือผู้ที่ร่ำรวยมหาศาลเท่านั้น เนื่องจากปัจจุบันมีธุรกิจจำนวนมากนำเสนอซอฟต์แวร์การโคลนเสียงในราคาที่แตกต่างกัน จึงไม่น่าแปลกใจที่ตลาดจะเติบโตในอัตราการเติบโตแบบทบต้นต่อปี (CAGR) ที่ 17.2% ภายในปี 2571

แน่นอนว่าคุณภาพผลลัพธ์อาจไม่น่าเชื่อถือเท่าบริการแบบชำระเงิน แต่จำนวนธุรกิจที่นำเสนอซอฟต์แวร์ประเภทดังกล่าวตอกย้ำความต้องการดังกล่าว

เลียนแบบเสียงคนดัง

การเลียนแบบเสียงคนดังได้กลายเป็นกรณีการใช้งานยอดนิยมที่สุดของการโคลนเสียง AI ซึ่งผลักดันขอบเขตความคิดสร้างสรรค์และดึงปัญหาทางกฎหมายที่อาจเกิดขึ้น ผู้มีชื่อเสียงหลายคนรวมถึง Taylor Swift, Joe Rogan และอดีตประธานาธิบดีสหรัฐฯ ตกเป็นเหยื่อของการโคลนเสียงด้วย AI

ตัวอย่างล่าสุดที่สำคัญเกิดขึ้นในเดือนเมษายน 2023 เมื่อผู้ใช้ TikTok ghostwriter977 ปล่อยเพลง “Heart on my Sleeve” โดยใช้เสียงของศิลปินต่างประเทศ Drake และ The Weeknd แม้ว่าจะไม่มีใครร้องเพลงหรือเกี่ยวข้องกับโปรเจ็กต์เลยก็ตาม

หลายคนแย้งว่านี่เป็นเพลงที่สร้างไวรัลด้วย AI เพลงแรก โดยได้รับยอดวิวมากกว่า 230,000 ครั้งบน YouTube และ 625,000 สตรีมบน Spotify ก่อนที่ Universal Music Group ซึ่งเป็นค่ายเพลงของศิลปินจะยุติการประท้วงด้านลิขสิทธิ์

คนดังในยุคปัจจุบันไม่ใช่คนเดียวที่ได้รับเสียงเลียนแบบ

ทีมผู้สร้างสารคดี The Andy Warhol Diaries ใช้ซอฟต์แวร์เพื่อสร้างเสียงสังเคราะห์ของศิลปินเพลงป็อปชื่อดัง Andy Warhol เพื่อบรรยายส่วนต่างๆ ของไดอารี่ของเขา ทำให้เสียงของเขากลับมามีชีวิตอีกครั้ง และเน้นย้ำว่าเทคโนโลยีมีศักยภาพในการรักษาตัวตนของใครบางคนได้นานเพียงใด หลังจากที่พวกเขาผ่านไปแล้ว

ให้ผู้พิการสามารถเข้าถึงได้มากขึ้น

หนึ่งในกรณีการใช้งานจริงของ AI การโคลนเสียงคือการช่วยผู้ที่เสี่ยงต่อการสูญเสียเสียงหรือความสามารถในการพูดเนื่องจากภาวะแทรกซ้อนทางสุขภาพ เช่น ผู้ที่เพิ่งได้รับการวินิจฉัยว่าเป็นโรค ALS (เส้นโลหิตตีบด้านข้างของกล้ามเนื้ออ่อนแรง) รักษาเสียงของพวกเขาไว้

ตัวอย่างหนึ่งคือฟีเจอร์ Personal Voice ของ Apple ซึ่งแบรนด์เปิดตัวในเดือนพฤษภาคม 2023 ซอฟต์แวร์นี้ช่วยให้ผู้ใช้สร้างเสียงสังเคราะห์ที่ครอบครัวและเพื่อนๆ สามารถจดจำได้ สิ่งที่พวกเขาต้องทำคืออ่านบางส่วนของข้อความแบบสุ่มดัง ๆ เป็นเวลา 15 นาที เพื่อให้ซอฟต์แวร์เรียนรู้และจำลองโปรไฟล์เสียงของพวกเขาได้อย่างถูกต้อง

บริการที่คล้ายกันคือ CoeFont กำลังได้รับการพัฒนาในญี่ปุ่น โดยเปิดให้ใช้งานฟรีสำหรับผู้ที่มีปัญหาในการพูด เช่น ผู้ที่พูดติดอ่างหรือได้รับการวินิจฉัยว่าเป็นโรค Dysphonia พวกเขารายงานว่ามีผู้ใช้มากกว่า 400 รายใช้บริการตั้งแต่เปิดตัวในเดือนพฤษภาคม 2566

การทำสำเนาและการแปลเนื้อหา

ธุรกิจจำนวนมากขึ้นเข้าใจถึงความต้องการเนื้อหาที่แปลเป็นภาษาท้องถิ่นในโลกยุคโลกาภิวัตน์ โดยเฉพาะอย่างยิ่งเมื่อผู้บริโภคประมาณ 7 ใน 10 (68%) กล่าวว่าจะเปลี่ยนไปใช้แบรนด์ที่นำเสนอเนื้อหาในภาษาของตน

วิธีดั้งเดิมในการแปลเนื้อหาคือการจ้างนักแปลหรือนักพากย์ต่างชาติเพื่อพากย์เสียงเนื้อหา อย่างไรก็ตาม ต้องขอบคุณนวัตกรรมทางเทคโนโลยีที่อาจเป็นทางเลือก

การพากย์เสียงด้วย AI กำลังกลายเป็นเทรนด์ใหม่ที่ช่วยให้ผู้สร้างเนื้อหาและบริษัทผู้ผลิตสามารถพากย์เสียงเนื้อหาของตนสำหรับตลาดต่างประเทศต่างๆ โดยไม่ต้องจ้างนักพากย์จากต่างประเทศ บริษัทบันเทิงสามารถเผยแพร่ซีรีส์ ภาพยนตร์ และเพลงในภาษาต่างๆ เพื่อดึงดูดผู้ชมในท้องถิ่นได้แล้ว

ตัวอย่างคือศิลปิน K-pop Midnatt ปล่อยเพลง "Masquerade" เป็นภาษาอังกฤษและใช้ AI เสียงเพื่อปล่อยเวอร์ชันในหกภาษา ผู้ดูมิวสิกวิดีโอบน YouTube สามารถคลิกการตั้งค่าเพื่อเปลี่ยนแทร็กเสียงเป็นภาษาของพวกเขาเพื่อฟังความแตกต่าง

ค่ายเพลงของเขายังสามารถสังเคราะห์เสียงของเขาให้เป็นผู้หญิง เพื่อให้เขาสามารถแสดงในเพลงของเขาเอง นำเสนอโอกาสที่สร้างสรรค์มากมายสำหรับนักดนตรีเดี่ยว

มีส่วนร่วมในการหลอกลวง

การสร้างเสียงสังเคราะห์ทำให้อาชญากรไซเบอร์สามารถหลอกลวงเหยื่อที่ไม่ประสีประสาได้ ดังเช่นที่เจนนิเฟอร์ เดสเตฟาโน แม่ในแอริโซนาประสบเมื่อต้นเดือนเมษายน 2566 เธอได้รับโทรศัพท์ที่น่าเป็นห่วงจากผู้ที่เชื่อว่าเป็นลูกสาว เธอร้องไห้และบอกว่าเธอถูกลักพาตัวและ อาชญากรเรียกค่าไถ่ อย่างไรก็ตาม ลูกสาวของเธอปลอดภัยตลอดมา

คณะกรรมาธิการการค้าแห่งสหพันธรัฐ (FTC) ของสหรัฐฯ กล่าวว่า AI ช่วยให้นักต้มตุ๋นสามารถปรับปรุงแผนการฉุกเฉินของครอบครัวได้ ทำให้คุณฟังดูน่าเชื่อถือมากขึ้นเมื่อได้ยินคนที่คุณรักพูดว่าพวกเขากำลังมีปัญหา ในช่วงเวลาเหล่านี้ ผู้เชี่ยวชาญบางคนแนะนำให้ตกลงเรื่อง “AI safeword” กับคนที่คุณรักเพื่อให้แน่ใจว่าเสียงนั้นมาจากพวกเขาจริงๆ

โดยไม่คำนึงว่าผลกระทบเชิงลบของซอฟต์แวร์การโคลนเสียง AI ที่เข้าถึงได้ทั่วไปนั้นชัดเจน มีหลายคนแจ้งข้อกังวลด้านจริยธรรมและกฎหมายเกี่ยวกับเทคโนโลยีนี้ ซึ่งคุณควรระวังหากคุณตั้งใจที่จะลอกเลียนเสียงของคุณ

ข้อกังวลด้านจริยธรรมและกฎหมายของ AI การโคลนเสียง

หน่วยงานกำกับดูแล ธุรกิจ และผู้ใช้ยังคงทำงานเพื่อทำความเข้าใจข้อกังวลด้านจริยธรรมและกฎหมายทั้งหมดที่การโคลนเสียง AI สามารถนำมาได้ แม้ว่าจะยังเป็นเทคโนโลยีใหม่ แต่ด้านล่างนี้คือปัญหาที่พบบ่อยบางประการที่ควรทราบ

ความยินยอมและผลกระทบต่อความเป็นส่วนตัว

ความสะดวกที่สแกมเมอร์สามารถฝึกซอฟต์แวร์การโคลนเสียงเพื่อเรียนรู้เสียงเฉพาะทำให้ผู้สร้างเนื้อหาและนักดนตรีเสี่ยงต่อการฉ้อโกงและการแอบอ้างบุคคลอื่น กรณีเหล่านี้ทำให้เกิดคำถามว่าศิลปินและผู้สร้างเนื้อหาควรสงวนลิขสิทธิ์เสียงของพวกเขาหรือไม่

นอกจากนี้ วิถีชีวิตของผู้คนยังถูกคุกคามเนื่องจากมีโอกาสถูกโจรกรรมข้อมูลส่วนตัวสูงกว่ามาก

มันคุกคามความเป็นส่วนตัวและความปลอดภัยในโลกไซเบอร์โดยอนุญาตให้อาชญากรข้ามระบบยืนยันตัวตนด้วยเสียง เหตุการณ์นี้เกิดขึ้นกับ Centrelink และ Australian Taxation Office (ATO) ซึ่งอาชญากรใช้เสียงสังเคราะห์เพื่อหลอกระบบรักษาความปลอดภัยด้วยการพิมพ์เสียงเพื่อยืนยันตัวตนผ่านการจดจำเสียง

ข้อมูลที่ผิดและการจัดการ

AI Deepfakes ยังคงเป็นหัวข้อสนทนาที่ร้อนแรง ขู่ว่าจะแบ่งแยกและชักใยชุมชน ข้อกังวลคือ AI การโคลนเสียงกำลังพัฒนาจนมีความน่าเชื่อถือสูงเร็วกว่าที่รัฐบาลจะควบคุมได้

มันสามารถบงการและส่งผลกระทบต่อชื่อเสียงของคนดังหากโทรลล์ออนไลน์ปล่อยเสียงของคนดังที่แสดงความคิดเห็นหรือเรื่องตลกที่ไม่เหมาะสม ตัวอย่างล่าสุดคือเสียงของนักแสดงหญิงชาวอังกฤษ Emma Watson กำลังอ่าน Mein Kampf ของฮิตเลอร์

ผลกระทบต่อนักพากย์และการย้ายงาน

หลายคนกังวลเกี่ยวกับความมั่นคงในหน้าที่การงาน เนื่องจาก AI มีความสามารถมากขึ้นเรื่อยๆ ในการปฏิบัติงานตามปกติของมนุษย์ AI โคลนเสียงคุกคามนักพากย์โดยเฉพาะ

เคยมีเหตุการณ์ที่นักพากย์ต้องตกใจเมื่อพบว่า AI คัดลอกเสียงของพวกเขาเพื่อให้ผู้คนใช้ในโครงการของพวกเขา ในเดือนกุมภาพันธ์ พ.ศ. 2566 นักพากย์วิดีโอเกมสองสามคนประณามสัญญาที่พวกเขาได้รับต่อสาธารณะ โดยกำหนดให้พวกเขาส่งเสียงของตนให้กับ AI

นักพากย์จะเป็นอย่างไรหากการใช้ AI เพื่อบรรยายหรือพากย์เนื้อหาให้คุณง่ายขึ้นมาก เป็นคำถามที่ควรพิจารณาเนื่องจากอาจทำให้นักพากย์หลายพันคนมีงานทำ

สถานะของการโคลนเสียง AI นั้นซับซ้อน หลายคนยังคงทดลองกับเทคโนโลยี ด้วยเหตุนี้ จึงคุ้มค่าที่จะพิจารณาว่าอนาคตของ AI ในการโคลนเสียงจะเป็นอย่างไร

สิ่งที่คุณคาดหวังได้จาก AI Voice Cloning

ไม่มีการตั้งค่าเกี่ยวกับการโคลนเสียง AI ในขณะที่โลกยังคงเข้าใจและค้นพบความเป็นไปได้ของเทคโนโลยีนี้ สิ่งที่ดีที่สุดคือการพิจารณาว่าอนาคตจะเป็นอย่างไรสำหรับเทคโนโลยีนี้

1. กฎระเบียบของรัฐบาลที่เข้มงวดมากขึ้นและการอภิปรายด้านจริยธรรมที่กว้างขึ้น

รัฐบาลมีแนวโน้มที่จะกำหนดกฎระเบียบที่เข้มงวดมากขึ้นเกี่ยวกับการใช้ AI การโคลนเสียง วุฒิสมาชิก Richard Blumenthal เน้นว่าซอฟต์แวร์การโคลนเสียงที่น่าเชื่อถือกลายเป็นอย่างไรโดยการทำให้เทคโนโลยีนี้อ่านคำกล่าวเปิดของเขาในการพิจารณาคดีของวุฒิสภาสหรัฐเมื่อเร็ว ๆ นี้

ข้อบังคับและนโยบายเหล่านี้อาจรวมถึงอะไรบ้าง พวกเขาอาจกล่าวถึงเสียงของผู้ที่สามารถโคลนผ่าน AI และกำหนดวัตถุประสงค์ที่แท้จริงของเทคโนโลยี อาจกำหนดว่าบริษัทต้องเปิดเผยว่าพวกเขาใช้ AI เสียงสำหรับกระบวนการใด ๆ หรือไม่ นอกจากนี้ ศาลยังคงต้องพิจารณาว่าใครเป็นเจ้าของสิทธิ์ในเสียงที่ AI สร้างขึ้น

พารามิเตอร์ทางกฎหมายเหล่านี้สามารถช่วยให้ผู้คนป้องกันความเสี่ยงและอันตรายของ AI เสียงโคลนได้

2. เพิ่มการใช้งานสำหรับการสร้างเนื้อหา

มีการใช้งานแอปการโคลนเสียงอย่างมีจริยธรรม ตัวอย่างเช่น ซอฟต์แวร์การโคลนเสียงสามารถเป็นเครื่องมือเพิ่มประสิทธิภาพหากคุณเป็นผู้สร้างเนื้อหาวิดีโอที่ผลิตเนื้อหา YouTube ที่ไม่มีใบหน้า การฝึก AI ให้เลียนแบบเสียงของคุณสามารถลดเวลาในการผลิตได้อย่างมาก เนื่องจากคุณไม่ต้องเสียเวลาหลายชั่วโมงในการบันทึกและบันทึกเสียงซ้ำหน้าไมโครโฟนอีกต่อไป

อีกประการหนึ่งคือการตลาดด้วย AI ซึ่งช่วยให้คุณใช้ประโยชน์จาก AI เพื่อผลิตวัสดุในอัตราที่เร็วขึ้นและต้นทุนต่ำกว่าที่เคยเป็นมา

3. เครื่องตรวจจับ AI เพิ่มเติม

ด้วยความสามารถของ AI ที่น่าเชื่อ ความสามารถในการแยกแยะว่าเนื้อหาชิ้นหนึ่งเป็นมนุษย์จริงหรือไม่จึงเป็นสิ่งสำคัญในการหลีกเลี่ยงการตกหล่นเพราะข้อมูลที่ผิด คุณสามารถคาดหวังได้ว่าจะเห็นผู้คนจำนวนมากขึ้นสร้างเครื่องมือตรวจจับที่น่าเชื่อถือมากขึ้น เพื่อให้แน่ใจว่าไม่ว่าเนื้อหาชิ้นหนึ่งจะน่าเชื่อถือเพียงใด ทุกสิ่งที่คุณบริโภคล้วนสร้างโดยมนุษย์

4. ความนิยมมากขึ้นของเสียง AI ในวงการบันเทิง

อุตสาหกรรมการสร้างภาพยนตร์เริ่มสะดวกสบายมากขึ้นกับการพากย์เสียงด้วย AI โดยสมาคมภาพยนตร์ (MPA) เพิ่งให้การรับรองแก่ Deepdub สตาร์ทอัพด้านการพากย์เสียงด้วย AI ชื่อนี้ช่วยให้แน่ใจว่า AI ของสตาร์ทอัพสามารถผ่านมาตรฐานระดับสูงของอุตสาหกรรมบันเทิงได้

Deepdub ไม่ใช่บริษัทเดียวที่ให้บริการ AI แก่อุตสาหกรรมบันเทิง ผู้ร่วมลงทุนหลายรายได้เริ่มลงทุนในบริษัทสตาร์ทอัพด้าน AI หลายแห่งเพื่อนำ AI มาสู่บริษัทผลิตภาพยนตร์ เช่น Netflix, Marvel และ Lucasfilm

ในการพัฒนาที่คล้ายกัน บริษัท AI Flawless ประกาศในเดือนพฤษภาคม 2023 ว่าพวกเขากำลังร่วมมือกับผู้จัดจำหน่ายในสหรัฐอเมริกาและสหราชอาณาจักรเพื่อเผยแพร่ภาพยนตร์ที่ไม่ใช่ภาษาอังกฤษในเวอร์ชันภาษาอังกฤษไปยังภูมิภาคต่างๆ โดย AI พากย์เสียงและลิปซิงค์

ด้วยผู้เชี่ยวชาญที่คาดว่าอุตสาหกรรมจะมีมูลค่า 416.8 พันล้านดอลลาร์ภายในปี 2573 AI พร้อมที่จะผสานรวมมากขึ้นเพื่อผลิตเนื้อหาคุณภาพสูงสำหรับบริการสตรีมมิ่ง

แอพโคลนเสียงยอดนิยม

หากคุณต้องการโคลนเสียงของคุณผ่านซอฟต์แวร์ ต่อไปนี้คือเครื่องมือยอดนิยมบางส่วนที่คุณสามารถลองใช้ได้

คล้าย.AI

Resemble.AI นำเสนอผลิตภัณฑ์และบริการต่างๆ เพื่อช่วยคุณสร้างเสียงสังเคราะห์ที่คุณพอใจ ตัวอย่างเช่น หากคุณต้องการแทนที่คำสองสามคำในเสียงที่บันทึกไว้โดยไม่บันทึกซ้ำ ฟีเจอร์ Resemble Fill จะช่วยแก้ไขคลิปได้อย่างราบรื่น

นอกจากนี้ยังมี Custom AI Voices API ที่นักพัฒนาสามารถรวมเข้ากับเครื่องมือต่างๆ ที่พวกเขาใช้อยู่แล้ว AI โคลนเสียงของพวกเขาต้องการเสียงอย่างน้อยสามนาทีหรือพูดประโยคที่กำหนดไว้ล่วงหน้า 25 ประโยคเพื่อเรียนรู้เสียง

เหนือกว่าคำ

BeyondWords มีคลังเสียง AI มากกว่า 550 เสียงในกว่า 140 ภาษาที่สร้างขึ้นอย่างมีจริยธรรม บริษัทร่วมมือกับนักพากย์ผ่านสัญญาการโคลนเสียง พวกเขายังใช้การประมวลผลภาษาธรรมชาติ (NLP) เพื่อวิเคราะห์ข้อความของผู้ใช้และแปลงเป็นคำพูดที่ฟังดูสมจริง

ผู้ตอบ

Respeecher ภูมิใจในการอนุญาตให้ผู้สร้างเนื้อหา ผู้สร้างภาพยนตร์ และนักพัฒนาเกมสร้างเสียงสังเคราะห์ โดยเฉพาะอย่างยิ่ง พวกเขาได้ทำงานร่วมกับบริษัทต่างๆ เช่น Lucasfilms เพื่อสร้างเสียงที่สร้างโดย AI สำหรับนักแสดงที่มีอายุมากซึ่งกลับมารับบทที่อายุน้อยกว่าของเขา และ Mondelez International

บริษัทใช้ทั้งอัลกอริทึมการประมวลผลสัญญาณดิจิทัลและแบบจำลองการกำเนิดเชิงลึกเพื่อให้ปัญญาประดิษฐ์เรียนรู้และเลียนแบบไม่เพียงแต่เสียงเท่านั้น แต่ยังรวมถึงอารมณ์และการส่งข้อความด้วย

สิบเอ็ดแล็บ

หลายคนรู้จัก Eleven Labs จากคลังเสียงของคนดัง ซึ่งคุณสามารถใช้กับเนื้อหาของคุณได้อย่างง่ายดายด้วยผลิตภัณฑ์ VoiceLab ของพวกเขา พวกเขาแสดงความเชี่ยวชาญด้วยการพากย์เสียงสุนทรพจน์ของลีโอนาร์โด ดิคาปริโอที่สหประชาชาติร่วมกับคนดังคนอื่นๆ เช่น โจ โรแกนและสตีฟ จ็อบส์

บริษัทตั้งเป้าที่จะสร้างเสียงที่สมจริงด้วยโมเดล AI ที่เน้นการจับตรรกะและอารมณ์ในข้อความด้วยแพลตฟอร์มการสังเคราะห์เสียงพูด โดยจะรวบรวมบริบทเกี่ยวกับแต่ละประโยคและย่อหน้าเพื่อทำความเข้าใจวิธีการออกเสียงและพูดให้น่าเชื่อถือ

เล่นHT

PlatHT มีคลังเสียงที่คุณสามารถโคลนสำหรับโครงการของคุณได้ ตั้งแต่ Elon Musk และ Neil DeGrasse Tyson ไปจนถึง John F. Kennedy และ Barack Obama ซอฟต์แวร์ Voice Cloning แบบเรียลไทม์ช่วยให้คุณสร้างเสียงสังเคราะห์ที่จับลักษณะการพูดและรักษาสำเนียงและความแตกต่างของเรื่อง

AI การโคลนเสียงของพวกเขาต้องการเสียงพูดที่ชัดเจนอย่างน้อยหนึ่งชั่วโมงเพื่อเริ่มต้นการวิเคราะห์เสียงและกระบวนการเรียนรู้

สิ่งสำคัญคือต้องทราบว่าบริษัทเหล่านี้ได้ระบุหลักจริยธรรมที่อยู่เบื้องหลังผลิตภัณฑ์ของตน ซึ่งคุณสามารถดูได้บนเว็บไซต์ของพวกเขา

รักษาหูของคุณไว้ที่พื้น

การโคลนเสียงของ AI สามารถมีผลกระทบอย่างมากต่อสังคม ทั้งในเชิงบวกและเชิงลบ ในแง่หนึ่ง ธุรกิจสามารถใช้เทคโนโลยีเพื่อช่วยให้ผู้คน "พูด" ต่อไปได้อีกนานหลังจากสูญเสียความเห็นเกี่ยวกับสภาวะทางการแพทย์หรือผู้สร้างเพื่อลดเวลาในการผลิต

ที่กล่าวว่า AI โคลนเสียงไม่ได้เป็นอิสระจากข้อกังวลด้านจริยธรรมหรือกฎหมายโดยสิ้นเชิง มิจฉาชีพอาจยังคงใช้มันเพื่อปลอมตัวเป็นบุคคลในแผนการฉุกเฉินของครอบครัวหรือเพื่อเลี่ยงผ่านตัวตรวจสอบสิทธิ์ด้วยเสียงเพื่อเข้าถึงข้อมูลที่ละเอียดอ่อนและเป็นความลับ

ในขณะที่รัฐบาลยังคงหารือเกี่ยวกับกฎหมายและนโยบายที่เป็นไปได้เกี่ยวกับการใช้ AI ที่เหมาะสม แต่ก็ขึ้นอยู่กับบริษัทเอกชนที่จะใช้มันอย่างมีความรับผิดชอบมากขึ้น ซึ่งรวมถึงการปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดในการรักษาความปลอดภัยทางไซเบอร์ เช่น การขอความยินยอมในการเข้าถึงข้อมูลของผู้บริโภค และการปฏิบัติที่โปร่งใสเกี่ยวกับวิธีการใช้เทคโนโลยีของคุณ

AI การโคลนเสียงยังคงพัฒนาต่อไป การติดตามข่าวสารล่าสุดเกี่ยวกับการพัฒนาล่าสุดสามารถช่วยให้คุณเข้าใจวิธีที่ดีที่สุดในการใช้เทคโนโลยีเพื่อส่งมอบคุณค่าให้กับลูกค้าของคุณที่ AI ไม่สามารถทำซ้ำได้

พร้อมที่จะเรียนรู้เพิ่มเติม? มาคุย กัน