أصوات الذكاء الاصطناعي تعزز الصور النمطية عن النساء

السبت 2024/06/29

سكارليت جوهانسن (غيتي)

مع انتشار التقنيات الصوتية التي تستخدمها تطبيقات الذكاء الاصطناعي، يحاول مطورو برمجيات الذكاء الاصطناعي تقليد أفلام هوليوود التي كانت تتخيل منذ عقود بأن أصوات الآلات يجب أن تكون لنساء لطيفات. وبناء على ذلك تم تصنيع الأصوات بناء على خيالات سينمائية قديمة حول الكيفية التي يجب أن تتحدث بها الآلات.

وكشفت شركة "أوبن إيه آي" الشهر الماضي عن ترقيات لبرنامج الدردشة الآلي الخاص بها الذي يعمل بالذكاء الاصطناعي. وقالت الشركة إن "تشات جي بي تي" كان يتعلم كيفية الاستماع والرؤية والتحدث بصوت طبيعي، لكن صوته يشبه إلى حد كبير نظام التشغيل "سامانثا" الذي جسدته الممثلة الأميركية سكارليت جوهانسون بصوتها في فيلم "هي" (Her) العام 2013.

وأوضحت صحيفة "نيويورك تايمز" أن صوت "شات جي بي تي"، المسمى "سكاي" كان يتمتع أيضاً بصوت أجش وتأثير مهدئ ومثير في الوقت نفسه، وكانت لطيفة ومنطوية على نفسها. وبعد ظهور "سكاي" لأول مرة، أعربت جوهانسون عن استيائها من الصوت "المشابه بشكل مخيف لصوتها"، وقالت أنها رفضت سابقاً طلب "أوبن إيه آي" بأن تقوم بصوت الروبوت.

وردت الشركة بأن سكاي قامت بأداء صوتها "ممثلة محترفة مختلفة"، لكنها وافقت على إيقاف صوتها مؤقتاً احتراماً لجوهانسون. لكن بدأ مستخدمو "Bereft OpenAI" بتقديم عريضة لإعادتها.

ويحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتهم الاصطناعية مبنية على طبقات من الحيلة والإسقاط. تمثل "سكاي" أحدث طموحات "أوبن إيه آي"، لكنها تعتمد على فكرة قديمة وهي أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة وخاضعة.

وكانت سامانثا في فيلم "هي" خليطاً من الأم والسكرتيرة والصديقة، وكانت بمثابة كائن مريح متعدد الأغراض يتحدث مباشرة في آذان مستخدميها. وحتى مع تقدم تكنولوجيا الذكاء الاصطناعي، تتم إعادة تشفير هذه الصور النمطية مراراً وتكراراً.

وأشارت الصحيفة إلى أن أصوات النساء غالباً ما غذت التقنيات المتخيلة قبل أن يتم دمجها في تقنيات حقيقية. وبمجرد أن بدأت شركات التكنولوجيا في تسويق المساعدين الافتراضيين، مثل "سيري" من شركة "أبل" و"أليكسا" من "أمازون" و"كورتانا" من مايكروسوفت، أصبحت أصواتها مؤنثة أيضاً.

والحال أن أولئك المساعدين الصوتيين من الموجة الأولى، الذين كانوا يتوسطون علاقات المستخدمين مع التكنولوجيا لأكثر من عقد من الزمن، لديهم نبرة صوتية نسائية، ويتم تمييز أصواتهم البشرية من خلال رتوش ميكانيكية، لأنهم غالباً ما كانوا يتحدثون بإيقاع محسوب ذي نغمة واحدة.

وحقيقة أن تلك الأصوات كانت تبدو وكأنها روبوتية زادت من جاذبيتها، لأنها تبدو قابلة للبرمجة والتلاعب بها كي تصبح خاضعة لمطالب المستخدمين، كما أنها لا تجعل البشر يشعرون كما لو أنهم أكثر ذكاء منها.

ومنذ أن طرحت "تيك توك" ميزة تحويل النص إلى كلام العام 2020، طورت مجموعة من الأصوات المحاكية للاختيار من بينها، وهي تقدم الآن أكثر من 50 صوتاً، بما في ذلك أصوات تسمى "هيرو" و"ستوري تيلير" و"بيستي"، لكن النظام الأساسي أصبح محدداً بخيار واحد هو "جيسي"، وهو صوت المرأة المفعم بالحيوية مع مسحة آلية غامضة قليلاً.

وأشارت الصحيفة إلى أن هذا الصوت الاصطناعي استمر في الهيمنة، حتى مع تقدم التكنولوجيا التي تقف وراءه بشكل يكشف كثيراً عن النظرة السائدة في المجتمع تجاه النساء فيما تعمل التكنولوجيا على تعزيز تلك الصور النمطية.

التعليقات

التعليقات المنشورة تعبر عن آراء أصحابها

أصوات الذكاء الاصطناعي تعزز الصور النمطية عن النساء

تابعنا عبر مواقع التواصل الإجتماعي

إشترك في النشرة الإخبارية ليصلك كل جديد