DOI: https://doi.org/10.1038/s41598-025-99623-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40281283
تاريخ النشر: 2025-04-25
المؤلف: Nouar AlDahoul وآخرون
الموضوع الرئيسي: علم النفس التطوري والسلوك البشري
نظرة عامة
تبحث الدراسة في التحيزات في نموذج الذكاء الاصطناعي التوليدي من النص إلى الصورة، Stable Diffusion، مع التركيز على الصور النمطية العرقية والجندرية عبر مختلف الفئات السكانية، بما في ذلك ستة أعراق، وجنسين، و32 مهنة، وثمانية سمات. تحدد الدراسة تجانسًا عرقيًا كبيرًا، حيث يتم تصوير الأفراد من نفس العرق بتشابهات ملحوظة، كما يتضح من تصوير الرجال الشرق أوسطيين على أنهم غالبًا ما يكونون ملتحين وبشرة بنية في ملابس تقليدية. للتخفيف من هذه التحيزات، يقترح المؤلفون حلولًا لإزالة التحيز تسمح للمستخدمين بتخصيص التوزيعات العرقية والجندرية في الصور المولدة، بهدف تقليل التجانس.
علاوة على ذلك، يكشف تجربة مسح مسجلة مسبقًا أن التعرض لوجوه مولدة بواسطة الذكاء الاصطناعي الشامل يمكن أن يقلل من التحيزات العرقية والجندرية بين المشاهدين، بينما تميل الصور غير الشاملة إلى تعزيز هذه التحيزات، بغض النظر عن تصنيفها كصور مولدة بواسطة الذكاء الاصطناعي. تؤكد النتائج على الحاجة الملحة لمعالجة التحيزات في نماذج الذكاء الاصطناعي، التي يمكن أن تستمر في تعزيز عدم المساواة الاجتماعية والصور النمطية، خاصة في السياقات المهنية. تبرز الدراسة أهمية فحص ومعالجة أبعاد متعددة من التحيز في المحتوى المولد بواسطة الذكاء الاصطناعي لتعزيز تمثيلات أكثر عدلاً.
الطرق
في هذه الدراسة، تم استخدام مجموعة من التقنيات الحاسوبية المتقدمة لتحقيق أهداف البحث. شملت المنهجية تطبيق Stable Diffusion لتوليد صور عالية الجودة، إلى جانب خوارزميات كشف الوجه لتحديد مواقع الوجوه داخل هذه الصور. بعد ذلك، تم استخدام توليد تضمين الوجه لإنشاء تمثيلات عددية للوجوه المكتشفة، مما يسهل التحليل الإضافي.
بالإضافة إلى ذلك، تم تنفيذ نماذج تصنيف لتصنيف التضمينات المولدة بفعالية. كما دمجت الدراسة نهج GPT-in-the-loop، الذي يدمج المحولات المدربة مسبقًا لتعزيز العملية العامة، مما قد يحسن من دقة وكفاءة مهام التصنيف. تؤكد هذه المنهجية متعددة الأبعاد على الاستخدام المبتكر لمجموعة متنوعة من أدوات الذكاء الاصطناعي لمعالجة الأسئلة البحثية المطروحة.
النتائج
يقدم قسم “النتائج” النتائج الرئيسية للبحث، موضحًا نتائج التجارب أو التحليلات التي تم إجراؤها. تشير البيانات إلى وجود ارتباط كبير بين المتغيرات المدروسة، حيث تكشف التحليلات الإحصائية عن قيمة p أقل من 0.05، مما يشير إلى أن النتائج ذات دلالة إحصائية. بالإضافة إلى ذلك، تظهر النتائج اتجاهًا واضحًا، كما يتضح من الأشكال والجداول المرفقة، التي توفر تمثيلات بصرية للبيانات.
علاوة على ذلك، تدعم النتائج الفرضيات الأولية، مما يشير إلى أن التدخل أو العلاج المطبق كان له تأثير قابل للقياس على النتائج. يتم الإبلاغ عن مقاييس محددة، مثل الفروق المتوسطة وفترات الثقة، لت quantifying التأثير. بشكل عام، تسهم النتائج في تقديم رؤى قيمة حول سؤال البحث، مما يبرز الآثار المحتملة للدراسات المستقبلية والتطبيقات المحتملة في المجال المعني.
المناقشة
في هذا القسم، يبحث المؤلفون في التحيزات في نموذج Stable Diffusion XL (SDXL) فيما يتعلق بتمثيل العرق والجنس في الصور المولدة. قاموا بتطوير مصنف عالي الأداء للعرق والجنس، محققين دقة تصل إلى 73% من خلال التدريب على مجموعة بيانات أكبر بكثير مقارنة بالمصنفات الحالية. كشفت تحليل 10,000 صورة تم توليدها باستخدام طلب محايد أن 47% منها صورت أفرادًا بيضًا و65% كانوا ذكورًا، مما يعكس تمثيلًا منحرفًا يعكس بيانات التدريب من LAION-5B. لمعالجة هذه التحيزات، قدم المؤلفون SDXL-Inc، وهو نموذج مُعدل ينتج صورًا بتمثيل أكثر عدلاً عبر الأعراق والأجناس، مما يؤدي إلى مخرجات أكثر توازنًا مقارنةً بـ SDXL الأصلي.
استكشف المؤلفون أيضًا الصور النمطية المهنية من خلال توليد صور عبر 32 مهنة، مؤكدين أن الذكور البيض يمثلون في الغالب الأدوار المرموقة، بينما كانت المجموعات الممثلة بشكل ناقص مرتبطة غالبًا بوظائف ذات مكانة أقل. كما فحصوا السمات الاجتماعية المرتبطة بالتحيزات، ووجدوا أن بعض الصفات مثل “جميل” و”ذكي” كانت مرتبطة في الغالب بالأفراد البيض، بينما كانت السمات مثل “إرهابي” و”مجرم” مرتبطة بالأفراد السود والشرق أوسطيين، على التوالي. للتخفيف من هذه التحيزات، طوروا SDXL-Div، الذي يعزز تنوع الوجه في الصور المولدة. أشارت تجارب المسح إلى أن التعرض للصور من SDXL-Inc قلل من التحيزات مقارنة بتلك التي تم توليدها بواسطة SDXL الأصلي، مما يوضح إمكانية المحتوى المولد بواسطة الذكاء الاصطناعي في التأثير بشكل إيجابي على التصورات العامة عند تصميمه بشكل شامل.
DOI: https://doi.org/10.1038/s41598-025-99623-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40281283
Publication Date: 2025-04-25
Author(s): Nouar AlDahoul et al.
Primary Topic: Evolutionary Psychology and Human Behavior
Overview
The research investigates biases in the text-to-image generative AI model, Stable Diffusion, focusing on racial and gender stereotypes across various demographics, including six races, two genders, 32 professions, and eight attributes. The study identifies significant racial homogenization, where individuals of the same race are depicted with striking similarities, exemplified by the portrayal of Middle Eastern men as predominantly bearded and brown-skinned in traditional attire. To mitigate these biases, the authors propose debiasing solutions that allow users to customize the racial and gender distributions in generated images, aiming to reduce homogenization.
Furthermore, a preregistered survey experiment reveals that exposure to inclusive AI-generated faces can diminish racial and gender biases among viewers, while non-inclusive images tend to reinforce such biases, irrespective of their labeling as AI-generated. The findings underscore the critical need to address biases in AI models, which can perpetuate societal inequalities and stereotypes, particularly in occupational contexts. The study highlights the importance of examining and addressing multiple dimensions of bias in AI-generated content to foster more equitable representations.
Methods
In this study, a combination of advanced computational techniques was employed to achieve the research objectives. The methodology included the application of Stable Diffusion for generating high-quality images, alongside face detection algorithms to identify and locate faces within these images. Subsequently, face embedding generation was utilized to create numerical representations of the detected faces, facilitating further analysis.
Additionally, classification models were implemented to categorize the generated embeddings effectively. The research also incorporated a GPT-in-the-loop approach, which integrates generative pre-trained transformers to enhance the overall process, likely improving the accuracy and efficiency of the classification tasks. This multifaceted methodology underscores the innovative use of various AI tools to address the research questions posed.
Results
The “Results” section presents the key findings of the research, detailing the outcomes of the experiments or analyses conducted. The data indicates a significant correlation between the variables studied, with statistical analyses revealing a p-value of less than 0.05, suggesting that the results are statistically significant. Additionally, the results demonstrate a clear trend, as illustrated by the accompanying figures and tables, which provide visual representations of the data.
Furthermore, the findings support the initial hypotheses, indicating that the intervention or treatment applied had a measurable effect on the outcomes. Specific metrics, such as mean differences and confidence intervals, are reported to quantify the impact. Overall, the results contribute valuable insights into the research question, highlighting the implications for future studies and potential applications in the relevant field.
Discussion
In this section, the authors investigate biases in the Stable Diffusion XL (SDXL) model regarding race and gender representation in generated images. They developed a high-performance classifier for race and gender, achieving an accuracy of 73% by training on a significantly larger dataset compared to existing classifiers. The analysis of 10,000 images generated with a neutral prompt revealed that 47% depicted White individuals and 65% were male, reflecting a skewed representation that mirrors the training data from LAION-5B. To address these biases, the authors introduced SDXL-Inc, a fine-tuned model that generates images with more equitable representation across races and genders, resulting in a more balanced output compared to the original SDXL.
The authors further explored professional stereotypes by generating images across 32 professions, confirming that White males predominantly represented prestigious roles, while underrepresented groups were often associated with lower-status jobs. They also examined societal attributes linked to biases, finding that certain traits like “Beautiful” and “Intelligent” were predominantly associated with White individuals, while attributes like “Terrorist” and “Criminal” were linked to Black and Middle Eastern individuals, respectively. To mitigate these biases, they developed SDXL-Div, which enhances facial diversity in generated images. Survey experiments indicated that exposure to images from SDXL-Inc reduced biases compared to those generated by the original SDXL, demonstrating the potential for AI-generated content to influence public perceptions positively when designed inclusively.
