ابتكار نظام ذكاء اصطناعي ينشئ صوراً لأشخاص من خلال أصواتهم

بعد أكثر من عامين من العمل، كشف علماء أمريكيون في مختبر علوم الكمبيوتر والذكاء الاصطناعي بمعهد ماساتشوستس التقني، عن خوارزمية ذكاء اصطناعي تدعى Speech2Face، قادرة على إنشاء صور لوجه شخص متحدث بواسطة التسجيل الصوتي.

وصمم الباحثون شبكة عصبية عميقة باستخدام ملايين مقاطع الفيديو على موقع يوتيوب، وخلال المرحلة الأولى من التدريب تمكن الذكاء الاصطناعي من معرفة الارتباط بين صوت وملامح المتحدث.

ولمزيد من استكشاف هذه الدقة في إعادة بناء الوجه، ابتكر الباحثون وحدة فك ترميز للوجه قادرة على تشكيل وإعادة بناء موحدة لوجه الشخص من إطار ثابت مع تجاهل الاختلافات غير ذات الصلة، مثل: الوضع، والإضاءة.
وخلال المرحلة الثانية، اقتربت نتائج الذكاء الاصطناعي بشكل مدهش من شكل المتحدث الحقيقي.

وأوضح الباحثون، أنه تسببت عدة عوامل، مثل: اللغة، واللهجة، ونبرة الصوت، في اختلافات بين الكلام والوجه، حيث كان الجنس، والعمر، والعرق، غير صحيح تماماً.

وبحسب الفريق البحثي، يمكن أن تمنح هذه التقنية ميزة لقوات إنفاذ القانون والأمن لاستخدام هذا الذكاء الاصطناعي لإنشاء صورة لما يبدو عليه المشتبه به، إذا كان الدليل الوحيد الذي لديهم هو الصوت.

ويُشار إلى أن العلماء في المعهد الأمريكي عملوا على الخوارزمية منذ عام 2019.

قد يعجبك ايضا
ankara escort çankaya escort