لن يتعين على المستخدم سوى تقديم تسجيل صوتي مدته 15 ثانية وستتمكن أداة Voice Engine من "استنساخ" الصوت وسرد محتوى النص بطريقة "واقعية وعاطفية". تقول OpenAI أن هذه التقنية يمكن استخدامها لأغراض تعليمية، والمساعدة في القراءة وترجمة اللغات، ومساعدة الأشخاص الذين يعانون من مشاكل في النطق.
وبحسب منشور على المدونة الرسمية لشركة OpenAI، فإن أداة Voice Engine قيد الاختبار على نطاق ضيق منذ أواخر عام 2022. وهي تُستخدم حاليًا في ميزة القراءة بصوت عالٍ في تطبيق ChatGPT، والتي تقوم بقراءة الإجابات بصوت مشابه لصوت الإنسان.
وأوضحت OpenAI أن المخاوف من سوء استخدام الأداة هو السبب الرئيسي وراء جعلها محدودة في الوقت الحالي ولم تكشف الشركة ما إذا كانت تخطط لإطلاق هذه الأداة كخدمة في متناول الجميع.
وتريد OpenAI إجراء المزيد من الأبحاث حول كيفية حماية الأداة من الاستخدام في نشر المعلومات المضللة ونسخ الأصوات دون إذن وتحليل كافة المخاطر التي قد تترتب على سوء استخدام هذه التكنولوجيا ففي نهاية المطاف، لقد رأينا بالفعل عمليات احتيال تستخدم تقنيات استنساخ الصوت لخداع ضحاياها.
بالإضافة إلى ذلك، سيتعين على أي شخص يستخدم هذه التكنولوجيا أن يكشف لجمهوره أن الأصوات يتم إنشاؤها بواسطة الذكاء الاصطناعي، و نفذت OpenAI تدابير السلامة، مثل العلامة المائية لتتبع أصل أي صوت و"مراقبة استباقية" لكيفية استخدام التقنية.
الأداة التي ابتكرتها OpenAI، وإن كانت تتميز عن غيرها بالسهولة التقنية الكبيرة والاحتياج إلى محتوى قصير من الصوت الأصلي لإنشاء نسخة مقنعة، فإن ذلك لا يمنع أن لديها منافسين أتاحوا بالفعل إصداراتهم للجمهور فشركة ElevenLabs، على سبيل المثال، يمكنها باستخدام "بضع دقائق فقط من الصوت" أن تولِّد نسخة صوتية كاملة.