كشفت شركة OpenAI مؤخرا عن تقنية جديدة لاستنساخ الأصوان تسمى “Voice Engine”، والتي حظيت باهتمام كبير نظرا لقدراتها الكبيرة والاعتبارات الأخلاقية المحيطة باستخدامها. يمكن لهذه التقنية توليد كلام طبيعي يشبه إلى حد كبير صوت فرد معين من عينة صوتية مدتها 15 ثانية فقط. على الرغم من إمكاناته للعديد من التطبيقات المفيدة.
كشفت شركة OpenAI الرائدة في تطوير تقنيات الذكاء الاصطناعي مؤخرا عن تقنية جديدة باسم Voice Engine لاستنساخ الصوت، وهي التقنية التي حظيت باهتمام كبير نظرا لقدرتها الفائقة والمخاوف الأخلاقية المرتبطة باستخدامها.
ويمكن لتقنية Voice Engine لاستنساخ الصوت بالذكاء الاصطناعي من شركة OpenAI توليد كلام بصوت طبيعي يشبه إلى حد كبير صوت شخص ما، وذلك من خلال عينة صوتية مدتها 15 ثانية فقط، مما يتيح على سبيل المثال إنشاء روبوت دردشة للرد على الاستفسارات بصوت أحد المشاهير أو الممثلين المفضلين أو حتى استنساخ صوت أحد الأقارب المتوفيين (أشبه بحلقة Be Right Back من حلقات مسلسل Black Mirror الذي يعتبر من أفضل مسلسلات الخيال العلمي).
لكن رغم الاستخدامات المفيدة إلا أن المخاوف من إساءة الاستخدام دفعت الشركة لإتخاذ قرارا بعدم بتوفير تقنية استنساخ أو محاكاة الأصوات على نطاق واسع حاليا، حيث يمكن توليد خطاب يحاكي أصوات الأشخاص الحقيقيين، مما قد يسبب العديد من المخاطر خصوصا في الأحداث السياسية مثل الانتخابات خصوصا مع اقتراب انتخابات الرئاسة الأمريكية في وقت لاحق من العام الحالي 2024.
مميزات تقنية استنساخ الصوت Voice Engine من OpenAI
ويمكن تلخيص مميزات أحدث تقنيات الذكاء الاصطناعي الجديدة من شركة OpenAI في:
كفاءة استنساخ الصوت:
يمكن لميزة Voice Engine استنساخ صوت أي شخص من خلال عينة صوتية مدتها 15 ثانية فقط، مما يجعلها أداة قوية لإنشاء أصوات اصطناعية.
تطبيقات متنوعة مفيدة:
قالت OpenAI أن تقنيتها الجديدة لاستنساخ الأصوات يمكنها المساعدة في تعلم القراءة لغير القراء والأطفال من خلال استخدام أصوات طبيعية عاطفية مقارنة بالأصوات الآلية المتوفرة الآن، ونوهت الشركة إلى أن شركة Age of Learning تستخدم التقنية الجديدة لإنشاء محتوى صوتي مكتوب مسبقا، بالإضافة لاستخدام التقنية إلى جانب GPT-4 لإنشاء ردودا طبيعية مخصصة للتواصل مع الطلاب.
كما يمكن الاعتماد على تقنية استنساخ الأصوات الجديدة Voice Engine حسب OpenAI في ترجمة المحتوى مع الحفاظ على اللهجة الأصلية للمتحدث، بالإضافة للاستخدام في التطبيقات العلاجية للأفراد الذين يعانون من حالات تؤثر على قدرتهم على الكلام.
مخاوف إساءة الاستخدام وتدابير السلامة من OpenAI
وفيما أكدت شركة OpenAI مراعاة العديد من تدابير السلامة للتأكد من عدم إساءة استخدام تقنية استنساخ الكلام Voice Engine، بما في ذلك وسم الصوت الذي تنتجه التقنية للتعرف دائما على إنه من إنتاج الذكاء الاصطناعي، مع عدم انتحال شخصية الأفراد دون موافقتهم وضرورة الكشف عن أن الأصوات من إنتاج الذكاء الاصطناعي، إلا أنه توجد مخاوف ومخاطر جسيمة من الاستغلال الخاطئ للتقنية الجديدة.
ويمكن إساءة استغلال تقنية OpenAI الجديدة لاستنساخ الأصوات في انتحال الشخصية وإنشاء محتوى مضلل أو ضار أو يسبب الأذى للأشخاص المنتحلة شخصيتهم، وهو ما اعترفته به الشركة خصوصا في سياقات مثل الانتخابات العامة.
واستجابة لهذه المخاوف، فقد اختارت OpenAI الحذر بشأن توفير التقنية الجديدة، حيث قالت أنها ستقصر الوصول إلى Voice Engine لاستنساخ الأصوات على مجموعة صغيرة مختارة من المطورين والشركاء.
وأثار الكشف عن Voice Engine مناقشات حول الاستخدام الأخلاقي لتقنية استنساخ الصوت والحاجة إلى قوانين لمنع إساءة الاستخدام، وفي حين يرى البعض أن هذه التكنولوجيا ستغير قواعد اللعبة فيما يتعلق بالكلام الاصطناعي والتطبيقات المختلفة المفيدة له، يؤكد البعض الآخر على أهمية الحذر والاستخدام المسؤول للتخفيف من الأضرار المحتملة.