استنساخ الصوت بالذكاء الاصطناعي: كل ما تحتاج لمعرفته الآن
نشرت: 2023-06-12أصبح الذكاء الاصطناعي (AI) أكثر تصديقًا ، مع مثال حديث هو الصورة الفيروسية للبابا في سترة منتفخة تخدع الكثيرين.
لكن الصور ليست هي المحتوى الوحيد الذي يمكن للذكاء الاصطناعي إنتاجه بشكل مقنع - فقد ظهر أيضًا استنساخ الصوت بالذكاء الاصطناعي ، والذي يحاكي بشكل أساسي صوت المرء في حالات الاستخدام المختلفة. ومن الأمثلة على ذلك تقليد صوت الرئيس جو بايدن خلال خطابه عن حالة الاتحاد.
لقد ثبت أنها أداة مهمة أخرى ذات إمكانات تجارية عالية ولكن يمكنها إثارة مخاوف أخلاقية وقانونية.
ستمنحك هذه المقالة لمحة عن كيفية عمل استنساخ الصوت ، والمخاوف التي يجب أن تكون على دراية بها ، وما يمكن أن تتوقعه من مستقبل هذه التكنولوجيا. كمكافأة ، سنعرض لك بعض التطبيقات التي يمكنك استخدامها لاستنساخ صوتك - أخلاقياً بالطبع.
ما هو استنساخ الصوت باستخدام الذكاء الاصطناعي؟
استنساخ الصوت يستخدم الذكاء الاصطناعي برنامج ذكاء اصطناعي لإنشاء صوت متطابق تقريبًا لمكبر الصوت ، ومحاكاة كل شيء بدءًا من النطق المقطعي إلى أنماط التنغيم.
وهو يختلف عن تركيب الكلام ، حيث يستخدم الذكاء الاصطناعي أصواتًا مختلفة ومحددة مسبقًا لاستبدال الكلام. غالبًا ما يتم استخدام كلاهما معًا نظرًا لأنه بمجرد حصولك على استنساخ صوت AI ، يمكنك استخدامه لقول ما تريد بأي لغة أو عاطفة.
مقطع الصوت الذي يحتاج برنامج استنساخ الصوت إلى التعلم منه لا يجب أن يكون طويلاً. ذكرت McAfee أن مقطعًا صوتيًا مدته ثلاث ثوانٍ طويل بما يكفي لتعلم الذكاء الاصطناعي ونسخه.
إن إمكانات هذه التكنولوجيا مذهلة ، حيث لا تزال الحكومات في جميع أنحاء العالم تحدد أفضل القوانين واللوائح التي يجب وضعها لاستخدامها الآمن. في غضون ذلك ، بدأ العديد من الأشخاص بالفعل في تجربة أدوات استنساخ الصوت للذكاء الاصطناعي لأغراض مختلفة.
الحالة الحالية لاستنساخ صوت AI
تمامًا كما هو الحال مع الذكاء الاصطناعي القائم على الدردشة والمولِّد للصور ، لا يزال الناس في جميع أنحاء العالم يكتشفون كيفية استخدام أدوات استنساخ الصوت AI بشكل أفضل. فيما يلي نظرة عامة عامة على كيفية استخدام الأفراد والشركات لاستنساخ الصوت بالذكاء الاصطناعي.
ظهور برامج مجانية لاستنساخ الصوت بالذكاء الاصطناعي
لا تقتصر القدرة على استنساخ الصوت على البارعين في التكنولوجيا أو الأثرياء. نظرًا لأن العديد من الشركات تقدم الآن برامج استنساخ الصوت بأسعار متفاوتة ، فليس من المستغرب أن ينمو السوق بمعدل نمو سنوي مركب (CAGR) يبلغ 17.2٪ بحلول عام 2028.
بالطبع ، قد لا تكون جودة المخرجات مقنعة مثل الخدمات المدفوعة ، لكن عدد الشركات التي تقدم نوع البرنامج يؤكد الطلب.
تكرار أصوات المشاهير
أصبح تقليد أصوات المشاهير بمثابة استنساخ صوتي لحالة الاستخدام الأكثر شيوعًا للذكاء الاصطناعي ، ودفع حدود الإبداع ورسم مشكلات قانونية محتملة. العديد من المشاهير ، بما في ذلك تايلور سويفت ، وجو روغان ، ورؤساء أمريكيون سابقون ، كانوا ضحايا لاستنساخ الصوت بالذكاء الاصطناعي.
حدث مثال حديث مهم في أبريل 2023 ، عندما أصدر ghostwriter977 مستخدم TikTok أغنية "Heart on my Sleeve" ، باستخدام أصوات الفنانين العالميين Drake و The Weeknd - على الرغم من عدم غناء أو الاتصال بالمشروع بأي صفة.
يجادل الكثيرون بأنها أول أغنية منتشرة بسرعة بواسطة الذكاء الاصطناعي ، حيث تلقت أكثر من 230 ألف مشاهدة على YouTube و 625 ألف بث على سبوتيفاي قبل أن تحذفها مجموعة يونيفرسال ميوزيك جروب - علامة الفنانين - حقوق الطبع والنشر.
مشاهير العصر الحديث ليسوا الوحيدين الذين تتكرر أصواتهم.
استخدم صانعو الفيلم الوثائقي The Andy Warhol Diaries برنامجًا لإنشاء صوت اصطناعي لفنان البوب الشهير ، آندي وارهول ، ليروي أجزاء من مذكراته ، ويعيد صوته إلى الحياة ويسلط الضوء على قدرة التكنولوجيا على الحفاظ على هوية شخص ما لفترة طويلة. بعد وفاتهم.
يوفر المزيد من إمكانية الوصول للأشخاص ذوي الإعاقة
تتمثل إحدى حالات الاستخدام الأكثر عملية لاستنساخ الصوت بالذكاء الاصطناعي في مساعدة الأشخاص المعرضين لخطر فقدان صوتهم أو قدرتهم على التحدث بسبب المضاعفات الصحية ، مثل تلك التي تم تشخيصها مؤخرًا بالتصلب الجانبي الضموري ، للحفاظ على صوتهم.
ومن الأمثلة على ذلك ميزة الصوت الشخصي من Apple ، والتي استعرضتها العلامة التجارية في مايو 2023. يتيح البرنامج للمستخدمين إنشاء صوت اصطناعي يمكن لعائلاتهم وأصدقائهم التعرف عليه. كل ما يحتاجون إليه هو قراءة أجزاء من النصوص العشوائية بصوت عالٍ لمدة 15 دقيقة حتى يتعلم البرنامج ويكرر ملفهم الصوتي بدقة.

يتم تطوير خدمة مماثلة ، CoeFont ، في اليابان حتى أنها تقدم استخدامًا مجانيًا للأشخاص الذين يجدون صعوبة في التحدث ، مثل أولئك الذين يتلعثمون أو تم تشخيصهم بخلل النطق. لقد أبلغوا أن أكثر من 400 مستخدم استخدموا خدمتهم منذ إطلاقها في مايو 2023.
الدبلجة وترجمة المحتوى
تدرك المزيد من الشركات الحاجة إلى محتوى محلي في العالم المعولم ، خاصة وأن ما يقرب من سبعة من كل عشرة مستهلكين (68٪) يقولون إنهم سيتحولون إلى علامة تجارية تقدم محتوى بلغتهم الأم.
تتمثل الطريقة التقليدية لترجمة المحتوى في توظيف مترجم أو ممثلين صوت أجانب لدبلجة المحتوى. ومع ذلك ، بفضل الابتكارات في التكنولوجيا ، قد يكون ذلك اختياريًا.
أصبحت دبلجة الذكاء الاصطناعي اتجاهاً ناشئاً للسماح لمنشئي المحتوى وشركات الإنتاج بدبلجة محتواها لمختلف الأسواق الدولية دون توظيف فنانين أجانب للتعليق الصوتي. يمكن لشركات الترفيه الآن إصدار المسلسلات والأفلام والأغاني بلغات مختلفة لجذب الجمهور المحلي.
ومن الأمثلة على ذلك ، أصدر فنان K-pop Midnatt أغنيته "Masquerade" باللغة الإنجليزية ويستخدم الذكاء الاصطناعي الصوتي لإصدار نسخ بست لغات. يمكن للمشاهدين الذين يشاهدون الفيديو الموسيقي على YouTube النقر فوق الإعدادات لتغيير المسار الصوتي إلى لغتهم لسماع الفرق.
تمكنت شركة التسجيلات الخاصة به من تجميع صوته كامرأة حتى يتمكن من الظهور في أغنيته الخاصة ، مما يوفر فرصًا إبداعية واسعة للموسيقيين المنفردين.
المساهمة في عمليات الاحتيال
سمح إنشاء صوت اصطناعي لمجرمي الإنترنت بالاحتيال على الضحايا المتواضعين ، كما حدث مع جينيفر ديستيفانو ، وهي أم في ولاية أريزونا ، في أوائل أبريل 2023. تلقت مكالمة هاتفية مقلقة ممن اعتقدت أنها ابنتها تبكي وتقول إنها تعرضت للاختطاف. طالب المجرمون بفدية. ومع ذلك ، كانت ابنتها آمنة طوال الوقت.
قالت لجنة التجارة الفيدرالية الأمريكية (FTC) إن الذكاء الاصطناعي سمح للمحتالين بتعزيز خطط الطوارئ العائلية ، مما يجعل الأمر يبدو أكثر إقناعًا لك أن تسمع أحد أفراد أسرته يقول إنه في ورطة. في هذه اللحظات ، يوصي بعض الخبراء بالاتفاق على "كلمة آمنة للذكاء الاصطناعي" مع أحبائك للتأكد من أن الصوت منهم في الواقع.

بغض النظر ، فإن الآثار السلبية لبرمجيات استنساخ الصوت بالذكاء الاصطناعي المتاحة للجمهور واضحة. أثار العديد من الأشخاص مخاوف أخلاقية وقانونية بشأن هذه التكنولوجيا يجب أن تكون على دراية بها إذا كنت تنوي استنساخ صوتك.
المخاوف الأخلاقية والقانونية لاستنساخ الصوت بالذكاء الاصطناعي
لا تزال الهيئات الإدارية والشركات والمستخدمون يعملون على فهم جميع المخاوف الأخلاقية والقانونية التي يمكن أن تحدثها استنساخ صوت الذكاء الاصطناعي. على الرغم من أنها لا تزال تقنية حديثة العهد ، فيما يلي بعض المشكلات السائدة التي يجب أن تكون على دراية بها.

الموافقة والآثار المترتبة على الخصوصية
السهولة التي يمكن للمحتالين من خلالها تدريب برامج استنساخ الصوت لتعلم أصوات معينة تعرض منشئي المحتوى والموسيقيين لخطر الاحتيال وانتحال الهوية. وضعت هذه الأمثلة موضع تساؤل حول ما إذا كان يجب على الفنانين ومنشئي المحتوى حقوق التأليف والنشر لأصواتهم أم لا.
بالإضافة إلى ذلك ، فإن سبل عيش الناس مهددة لأن احتمالية سرقة الهوية أعلى بكثير.
إنه يهدد الخصوصية والأمن السيبراني من خلال السماح للمجرمين بتجاوز أنظمة المصادقة القائمة على الصوت. حدث هذا في Centrelink ومكتب الضرائب الأسترالي (ATO) ، حيث استخدم المجرمون صوتًا اصطناعيًا لخداع أنظمة أمان البصمة الصوتية التي تهدف إلى التحقق من الهويات من خلال التعرف على الصوت.
التضليل والتلاعب
لا يزال التزييف العميق للذكاء الاصطناعي موضوعًا ساخنًا للنقاش ، مما يهدد بتقسيم المجتمعات والتلاعب بها. القلق هو أن استنساخ الصوت يتطور الذكاء الاصطناعي ليصبح مقنعًا بشكل أسرع من قدرة الحكومات على تنظيمه.
يمكن أن يتلاعب بسمعة أحد المشاهير ويؤثر عليها إذا أصدر المتصيدون عبر الإنترنت صوتًا لأحد المشاهير يلقي بتعليقات أو نكات مسيئة ؛ ومن الأمثلة الحديثة على ذلك صوت الممثلة البريطانية إيما واتسون وهي تقرأ كتاب هتلر "كفاحي" .
التأثير على الجهات الفاعلة في الصوت البشري والتشرد الوظيفي
يشعر الكثير من الناس بالقلق بشأن أمنهم الوظيفي لأن الذكاء الاصطناعي يصبح أكثر وأكثر قدرة على أداء المهام البشرية التقليدية. استنساخ الصوت يهدد الذكاء الاصطناعي الممثلين الصوتيين على وجه الخصوص.
كانت هناك بالفعل حوادث صُدم فيها ممثلو الصوت عندما وجدوا أن الذكاء الاصطناعي ينسخ أصواتهم ليستخدمها الأشخاص في مشاريعهم. في فبراير 2023 ، أدان عدد قليل من الممثلين الصوتيين لألعاب الفيديو العقود التي حصلوا عليها ، وطالبوهم بتوقيع أصواتهم على الذكاء الاصطناعي.
ماذا سيحدث لممثلي الصوت إذا أصبح استخدام الذكاء الاصطناعي أسهل بكثير لسرد المحتوى أو دبلجته نيابة عنك؟ إنه سؤال يستحق البحث لأنه يمكن أن يتسبب في عمل الآلاف من الممثلين الصوتيين.
حالة استنساخ الصوت بالذكاء الاصطناعي معقدة. لا يزال الكثيرون يجربون هذه التكنولوجيا. بالنظر إلى ذلك ، من المفيد التفكير في ما يخبئه المستقبل لاستنساخ الصوت بالذكاء الاصطناعي.
ما الذي يمكن أن تتوقعه مع استنساخ الصوت AI
لم يتم تعيين أي شيء بخصوص استنساخ الصوت. مع استمرار العالم في فهم واكتشاف إمكانيات هذه التكنولوجيا ، فمن الأفضل التفكير فيما قد يحمله المستقبل لها.
1. تنظيم حكومي أكثر صرامة ومناقشات أخلاقية أوسع
من المرجح أن تفرض الحكومات لوائح أكثر صرامة على استخدام استنساخ الصوت بالذكاء الاصطناعي. سلط السناتور ريتشارد بلومنتال الضوء على مدى إقناع برنامج استنساخ الصوت من خلال جعل التكنولوجيا تتلو بيانه الافتتاحي في جلسة استماع حديثة لمجلس الشيوخ الأمريكي.
ماذا يمكن أن تشمل هذه اللوائح والسياسات؟ قد يتعاملون مع من يمكن استنساخ أصواتهم من خلال الذكاء الاصطناعي وتحديد الأغراض الدقيقة للتكنولوجيا. يمكن أن ينص على أنه يجب على الشركات الإفصاح عما إذا كانت تستخدم الذكاء الاصطناعي الصوتي أم لا في أي من عملياتها. بالإضافة إلى ذلك ، لا يزال يتعين على المحاكم تحديد من يملك حقوق الصوت الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
يمكن أن تساعد هذه المعايير القانونية الأشخاص على الحماية من مخاطر ومخاطر استنساخ الصوت بالذكاء الاصطناعي.
2. زيادة الاستخدام لإنشاء المحتوى
هناك استخدامات أخلاقية لتطبيقات استنساخ الصوت. على سبيل المثال ، يمكن أن يكون برنامج استنساخ الصوت أداة إنتاجية إذا كنت منشئ محتوى فيديو تنتج محتوى YouTube مجهول الهوية. يمكن أن يؤدي تدريب الذكاء الاصطناعي لتقليد صوتك إلى تقليل وقت الإنتاج بشكل كبير حيث لن تضطر إلى قضاء ساعات في تسجيل وإعادة تسجيل الصوت أمام الميكروفون بعد الآن.
آخر هو التسويق بالذكاء الاصطناعي ، والذي يسمح لك بالاستفادة من الذكاء الاصطناعي لإنتاج المواد بمعدل أسرع بكثير وبتكلفة أقل من ذي قبل.
3. المزيد من أجهزة الكشف عن الذكاء الاصطناعي
مع مدى إقناع الذكاء الاصطناعي ، فإن القدرة على تمييز ما إذا كان جزء من المحتوى بشريًا أصليًا أمر بالغ الأهمية لتجنب الوقوع في المعلومات المضللة. يمكنك أن تتوقع رؤية المزيد من الأشخاص ينشئون أجهزة كشف أكثر موثوقية للتأكد من أنه بغض النظر عن مدى إقناع جزء من المحتوى ، فإن كل ما تستهلكه من صنع الإنسان.
4. زيادة شعبية صوت الذكاء الاصطناعي في صناعة الترفيه
أصبحت صناعة الأفلام مريحة بشكل متزايد مع دبلجة الذكاء الاصطناعي ، حيث منحت جمعية الأفلام السينمائية (MPA) مؤخرًا شهادة لشركة Deepdub الناشئة للذكاء الاصطناعي. يضمن هذا العنوان أن الذكاء الاصطناعي للشركة الناشئة يمكنه تلبية المعايير العالية لصناعة الترفيه.
Deepdub ليس الوحيد الذي يقدم خدمات الذكاء الاصطناعي لصناعة الترفيه. بدأ العديد من أصحاب رؤوس الأموال في الاستثمار في العديد من شركات الذكاء الاصطناعي الناشئة لجلب الذكاء الاصطناعي إلى شركات إنتاج الأفلام مثل Netflix و Marvel و Lucasfilm.
في تطور مماثل ، أعلنت شركة Flawless للذكاء الاصطناعي في مايو 2023 أنها تتعاون مع موزعين في الولايات المتحدة والمملكة المتحدة لإصدار نسخ إنجليزية من أفلام غير إنجليزية إلى مناطق مختلفة ، مدبلجة ومزامنة بالشفاه بواسطة منظمة العفو الدولية.
مع توقع الخبراء أن تبلغ قيمة الصناعة 416.8 مليار دولار بحلول عام 2030 ، يستعد الذكاء الاصطناعي لأن يصبح أكثر تكاملاً لإنتاج المزيد من المحتوى عالي الجودة لخدمات البث.
تطبيقات استنساخ الصوت الشعبية
إذا كنت ترغب في استنساخ صوتك من خلال البرنامج ، فإليك بعض الأدوات الشائعة التي يمكنك التحقق منها.
يشبه

تقدم شركة Resemble.AI العديد من المنتجات والخدمات لمساعدتك في إنشاء صوت اصطناعي يرضيك. على سبيل المثال ، إذا كنت ترغب في استبدال بضع كلمات في الصوت المسجل دون إعادة التسجيل ، فإن ميزة Resemble Fill الخاصة بهم ستساعد في تحرير المقطع بسلاسة.
لديهم أيضًا مطورو واجهة برمجة تطبيقات مخصصة لأصوات AI يمكن دمجها في الأدوات المختلفة التي يستخدمونها بالفعل. لن يحتاج استنساخ صوتهم إلا إلى ثلاث دقائق على الأقل من الصوت أو التحدث بـ 25 جملة محددة مسبقًا لتعلم الأصوات.
خلف الكلمات

تمتلك BeyondWords مكتبة تضم أكثر من 550 صوتًا للذكاء الاصطناعي بأكثر من 140 لغة تم إنشاؤها بطريقة أخلاقية ؛ تتعاون الشركة مع الممثلين الصوتيين من خلال عقد استنساخ الصوت. يستخدمون أيضًا معالجة اللغة الطبيعية (NLP) لتحليل نص المستخدم وتحويله إلى كلام يبدو أصيلًا.
رسبيشر

يفخر Respeecher بالسماح لمنشئي المحتوى وصانعي الأفلام ومطوري الألعاب بإنشاء أصوات اصطناعية. والجدير بالذكر أنهم عملوا مع شركات مثل Lucasfilms لتوليد صوت تم إنشاؤه بواسطة الذكاء الاصطناعي لممثل أكبر سنًا يعيد تمثيل دوره الأصغر ، وشركة Mondelez International لإنتاج تسويق محلي هادف للغاية.
تستخدم الشركة كلاً من خوارزميات معالجة الإشارات الرقمية ونموذجًا توليديًا عميقًا للسماح لذكائها الاصطناعي بالتعلم وتقليد ليس فقط الصوت ولكن أيضًا العواطف وإيصال المقاطع.
أحد عشر مختبرًا

يعرف الكثيرون Eleven Labs بمكتبة أصوات المشاهير الخاصة بهم ، والتي يمكنك استخدامها بسهولة لمحتواك مع منتج VoiceLab الخاص بهم. عرضوا خبراتهم من خلال دبلجة خطاب ليوناردو دي كابريو في الأمم المتحدة مع مشاهير آخرين ، مثل جو روغان وستيف جوبز.
تهدف الشركة إلى توليد أصوات تبدو واقعية من خلال نموذج الذكاء الاصطناعي الخاص بها الذي يركز على التقاط المنطق والعواطف في النصوص من خلال منصة تركيب الكلام الخاصة بها. يجمع السياق حول كل جملة وفقرة لفهم كيفية التجويد والتحدث بشكل مقنع.
اللعب

يحتوي PlatHT على مكتبة من الأصوات التي يمكنك استنساخها لمشاريعك ، من Elon Musk و Neil DeGrasse Tyson إلى John F. Kennedy و Barack Obama. يتيح لك برنامج استنساخ الصوت في الوقت الفعلي إنشاء صوت اصطناعي يلتقط أسلوب التحدث ويحافظ على لهجة الموضوع والفروق الدقيقة في التحدث.
سيتطلب استنساخ صوتهم بالذكاء الاصطناعي ما لا يقل عن ساعة من التحدث بصوت واضح لبدء التحليل الصوتي وعملية التعلم.
من المهم ملاحظة أن جميع هذه الشركات قد حددت الأخلاقيات الكامنة وراء منتجاتها ، والتي قد تشاهدها على موقعها على الويب.
إبقاء أذنك على الأرض
يمكن أن يكون لاستنساخ الصوت بالذكاء الاصطناعي تأثيرات كبيرة على المجتمع ، سواء كانت إيجابية أو سلبية. من ناحية أخرى ، يمكن للشركات استخدام التكنولوجيا لمساعدة الأشخاص على مواصلة "التحدث" لفترة طويلة بعد فقدان أصواتهم بسبب حالات طبية أو على المبدعين لتقليل وقت الإنتاج.
ومع ذلك ، فإن استنساخ الصوت بالذكاء الاصطناعي لا يخلو تمامًا من المخاوف الأخلاقية أو القانونية. قد يستمر المحتالون في استخدامه لانتحال شخصية الأشخاص في مخططات الطوارئ العائلية أو لتجاوز مصدقي الصوت للوصول إلى بيانات حساسة وسرية للغاية.
بينما تواصل الحكومات مناقشة القوانين والسياسات الممكنة حول الاستخدام المناسب للذكاء الاصطناعي ، فإن الأمر متروك للشركات الخاصة لاستخدامه بشكل أكثر مسؤولية. يتضمن ذلك اتباع أفضل ممارسات الأمن السيبراني ، مثل طلب الموافقة على الوصول إلى بيانات المستهلك وممارسة الشفافية في كيفية استخدامك للتكنولوجيا.
استنساخ الصوت يواصل الذكاء الاصطناعي التطور. يمكن أن يساعدك البقاء على اطلاع بآخر التطورات في فهم أفضل السبل لاستخدام التكنولوجيا لتقديم قيمة لعملائك لا يمكن للذكاء الاصطناعي تكرارها.
جاهز لمعرفة المزيد؟ لنتحدث .