DOI: https://doi.org/10.1140/epjds/s13688-025-00607-0
تاريخ النشر: 2026-01-13
المؤلف: Palakorn Achananuparp وآخرون
الموضوع الرئيسي: ديناميات سوق العمل وعدم المساواة في الأجور
نظرة عامة
تقدم هذه الورقة البحثية تحليلًا شاملاً لحركة المهنة بين العمال الحاصلين على تعليم جامعي في الولايات المتحدة، مع التركيز على تفاعل الجنس والعرق وخيارات تغيير الوظائف فيما يتعلق بالحركة التصاعدية. باستخدام مجموعة بيانات تضم 228,710 مسارات مهنية وتوظيف تقنيات معالجة بيانات متقدمة، بما في ذلك طريقة تصنيف المهن المعتمدة على نموذج لغة كبير جديد يسمى FewSOC، تتناول الدراسة تحديات البيانات الكبيرة مثل نقص الخصائص الديموغرافية والتسميات غير الدقيقة للمهن. تشير النتائج إلى أن التغييرات في المهن داخل الشركة هي الأكثر فعالية في تسهيل الحركة التصاعدية، تليها التغييرات بين الشركات، بينما تعاني النساء والخريجات السود من عوائد أقل بشكل ملحوظ من تغييرات الوظائف مقارنة بنظرائهن الذكور والبيض.
تستكشف الدراسة أيضًا الديناميكيات الدقيقة للحركة من خلال التمييز بين الانتقالات داخل الشركات وبين الشركات وتحليل تأثيراتها المختلفة عبر مجموعات الجنس والعرق/العرق المختلفة. تكشف النتائج عن تفاوتات مستمرة بين الجنسين، حيث تتلقى النساء عمومًا عوائد أقل من الحركة، وتبرز اختلافات عرقية محددة، لا سيما بين الخريجات الآسيويات اللاتي يواجهن عوائد أقل مقارنة بالخريجات البيض. تؤكد التحليل على أهمية النظر في الحواجز الهيكلية التي قد تحد من فوائد حركة الوظائف للنساء ذوات التعليم العالي وتثير تساؤلات حول العوامل المساهمة في التفاوتات العرقية في التقدم المهني. بشكل عام، تؤكد الأبحاث على الحاجة إلى مزيد من التحقيق في الآليات التي تدعم هذه التفاوتات وتقترح أن التأثيرات الملحوظة من المحتمل أن تكون تقديرات محافظة بسبب الأخطاء المحتملة في قياس تصنيف العرق.
مقدمة
ت outlines مقدمة هذه الورقة البحثية التحولات الكبيرة في سوق العمل الأمريكي، لا سيما تراجع الأسواق الداخلية للعمل التي تتميز بالتوظيف المستقر وطويل الأمد وارتفاع الأسواق الخارجية التي تعزز التوظيف المرن وزيادة الحركة عبر المنظمات. وقد تزامن هذا التحول مع زيادة ملحوظة في مستوى التعليم للقوى العاملة، حيث ارتفعت نسبة العمال الحاصلين على درجة جامعية على الأقل من 26% في عام 1991 إلى ما يقرب من 42% في عام 2022. على الرغم من هذه التغييرات، غالبًا ما تتجاهل الأبحاث الحالية التجارب المحددة للخريجين الجامعيين فيما يتعلق بحركة الوظائف، لا سيما فيما يتعلق بالجنس والعرق، مما يترك فجوات حاسمة في فهم كيفية تأثير هذه العوامل على التقدم المهني.
تهدف الدراسة إلى معالجة هذه الفجوات من خلال استخدام مجموعة بيانات كبيرة من السير الذاتية عبر الإنترنت لتحليل أنماط حركة الوظائف بين العمال الحاصلين على تعليم جامعي. تطرح سؤالين رئيسيين للبحث: كيف يتنقل هؤلاء العمال بين خيارات تغيير الوظائف من أجل الحركة التصاعدية وكيف تختلف نتائج هذه الحركة حسب الجنس والعرق. كما تقدم الورقة نهجًا جديدًا في التعلم الآلي، FewSOC، لتصنيف تسميات المهن بدقة، وهو أمر ضروري لتحليل حركة الوظائف. يحسن هذا الأسلوب من دقة التصنيف الحالية، مما يعزز موثوقية نتائج الدراسة. ستفصل الأقسام التالية منهجية البحث، بما في ذلك معالجة البيانات، وفعالية تصنيف FewSOC، وتحليلات الانحدار التي ستتناول أسئلة البحث المقترحة.
طرق
في هذا القسم، يوضح المؤلفون إعداد التجربة المستخدمة لتقييم طريقة FewSOC لتصنيف المهن. قاموا بإنشاء مجموعة اختبار، تسمى Jobs12K، من خلال أخذ عينات من 11,920 سجل وظيفة من قسم LC0، والذي تضمن أزواج عنوان الوظيفة – اسم الشركة. شملت عملية الاختيار عدة معايير: استبعاد عناوين الوظائف التي تحتوي على أحرف غير أبجدية رقمية أو غير ASCII، وتلك التي تتجاوز سبع كلمات، واختيار رموز التصنيف المهني (SOC) المكونة من 6 أرقام المرتبطة بما لا يقل عن 20 سجل وظيفة، مما أسفر عن 596 رمزًا مؤهلاً. يُلاحظ أن هذه الرموز قد لا تمثل بدقة التوزيع المهني الحقيقي للسجلات المأخوذة ولكنها تعمل كمؤشر أولي للمهن الممثلة بشكل شائع.
بعد إنشاء Jobs12K، تم تطبيق طريقة FewSOC لتصنيف SOC عبر مجموعة البيانات بأكملها. تم تجميع مجموعة ثابتة من 17 مثالًا من نوع k-shot يدويًا، باستخدام رموز SOC المكونة من 8 أرقام من تصنيف O*NET-SOC 2019. تم إنشاء أزواج عنوان الوظيفة – الشركة من خلال اقتران عشوائي لعناوين الوظائف ذات الصلة مع كل من المنظمات الحقيقية والخيالية، مع ضمان عدم وجود تداخل مع مجموعة الاختبار. استخدمت عملية توليد SOC واجهة برمجة التطبيقات OpenAI (نموذج GPT-3.5 Turbo) في أغسطس 2023، مع التركيز على الجدوى الاقتصادية والمخرجات الحتمية، مما أسفر عن تكلفة إجمالية لاستخدام واجهة برمجة التطبيقات قدرها 1.6 دولار أمريكي. يُشار إلى الناتج النهائي لهذه العملية باسم مجموعة FewSOC.
نتائج
في هذا القسم، يقدم المؤلفون نتائج تحليلات الانحدار الخاصة بهم التي تهدف إلى معالجة سؤالين رئيسيين للبحث: تأثير أنواع تغيير الوظائف والعوامل الديموغرافية على الحركة التصاعدية (RQ1)، والعلاقة بين الجنس والعرق مع هذه النتائج (RQ2). يتم تلخيص النتائج في الجدول 4، بينما يوفر الشكل 4 رسمًا بيانيًا للمعاملات يمثل بصريًا التأثيرات الرئيسية والمصطلحات التفاعلية الهامة، مع الإشارة إلى الأهمية الإحصائية من خلال ألوان مميزة للمعاملات التي لديها $p < 0.05$ ورمادي لتلك التي لديها $p > 0.05$. يتم تفصيل معاملات المتغيرات الضابطة في الشكل التكميلي D1.
بالإضافة إلى ذلك، يقدم الجدول C3 المتوسطات اللاحقة لمعاملات التأثير الثابت، والمصطلحات التفاعلية، ومكونات التباين العشوائي للنماذج 1F-4F. لتسهيل المقارنة، تصور الأشكال C1 وD2 هذه التقديرات جنبًا إلى جنب مع التأثيرات الرئيسية من النماذج المعنية. يتم تمييز المعاملات الهامة (مع $p < 0.05$ أو فترات موثوقة بنسبة 95% تستبعد الصفر) بألوان محددة للنموذج، بينما تظهر التقديرات غير الهامة باللون الرمادي. يبرز الشكل C1 المتنبئين الرئيسيين والتفاعلات الرئيسية، بينما يتضمن الشكل D2 مجموعة كاملة من المتغيرات الضابطة، مع تطبيق اهتزاز أفقي لتعزيز الوضوح البصري بين التقديرات ذات القيم القريبة.
مناقشة
في قسم المناقشة، تسلط الورقة الضوء على الحواجز الكبيرة التي تواجه حركة الوظائف من قبل المجموعات التقليدية المحرومة، لا سيما النساء والأقليات. تواجه هذه المجموعات تحيزات نظامية تحد من حركتها الداخلية والخارجية، مما يؤدي غالبًا إلى ركود مهني. تؤكد الأبحاث على دور الشبكات الاجتماعية المنفصلة، التي تقيد الوصول إلى معلومات الوظائف القيمة والإحالات، مما يزيد من تفاقم التحديات التي تواجه هذه الفئات. على الرغم من المزايا المحتملة للتعليم العالي، لا يزال المهنيون من الأقليات يواجهون “سقف زجاجي” يمكن أن يعيق الحركة التصاعدية، مما يشير إلى أن الحصول على التعليم وحده قد لا يخفف تمامًا من الحواجز أمام التقدم المهني.
ينتقد القسم أيضًا الأدبيات الحالية لافتقارها إلى التحديد فيما يتعلق بأنواع حركة الوظائف وميولها لتجاهل تجارب العمال ذوي التعليم العالي. يؤكد على الحاجة إلى فهم دقيق لديناميكيات حركة الوظائف، لا سيما كيف تؤثر أشكال الحركة المختلفة على المسارات المهنية والنتائج. يقترح المؤلفون أن حركة الوظائف، على الرغم من ارتباطها عمومًا بالحركة التصاعدية، يمكن أن تؤدي إلى انتقالات غير فعالة للنساء والأقليات، مما يؤدي غالبًا إلى تحركات جانبية بدلاً من التقدم التصاعدي. تتطلب هذه التعقيدات فحصًا أكثر تفصيلًا لأنواع تغيير الوظائف وآثارها على التقدم المهني، لا سيما في سياق مجموعة البيانات والمنهجيات المستخدمة في الدراسة.
القيود
تسلط قيود إطار عمل FewSOC الضوء على عدة مجالات حاسمة للتحسين والبحث المستقبلي. أولاً، الاعتماد على مجموعة من الأمثلة المنسقة يدويًا، على الرغم من فعاليتها في تعزيز التنبؤات مقارنة بـ Lightcast، قد لا يضمن الأداء الأمثل وقد يقدم تباينًا في الجودة والتمثيل. تشير هذه العملية الاختيارية والوقت المستهلكة إلى الحاجة إلى نهج أكثر نظامية، مثل الجيران الأقرب (kNN)، لتحسين اختيار الأمثلة في السياق.
ثانيًا، على الرغم من التقدم في التنبؤ برموز SOC من خلال FewSOC، يمكن أن تؤدي الأخطاء في هذه التنبؤات إلى تصنيفات خاطئة للأدوار الوظيفية، مما قد يسبب تحيزًا في تحليلات مسارات المهنة وتحريف تقديرات معاملات الانحدار. قد تؤدي التباينات في أخطاء التنبؤ عبر المهن المختلفة إلى استنتاجات مضللة، مما يتطلب تفسيرًا دقيقًا للنتائج. بالإضافة إلى ذلك، تثير انخفاض موثوقية التقييم بين العمال AMT مخاوف بشأن صحة تقييمات رموز SOC المستندة إلى الحشود. بينما تم استخدام تجميع التقييمات المعتمدة على المهارات لمعالجة هذه المشكلة، فإن تحسين موثوقية التوصيف البشري أمر ضروري، ربما من خلال تحسين التدريب وإرشادات أوضح.
أخيرًا، يقدم الاشتقاق الخوارزمي لمقاييس الجنس والعرق مخاوف تتعلق بالدقة، لا سيما لتصنيف العرق، حيث تظهر الطرق المعتمدة على الأسماء دقة غير متساوية عبر مجموعات ديموغرافية مختلفة. قد تؤدي هذه الأخطاء في القياس إلى تقديرات محافظة لتأثيرات العرق في نماذج الانحدار، لا سيما بالنسبة للأفراد السود والآسيويين. يجب أن تهدف الأبحاث المستقبلية إلى تعزيز دقة الاستدلال الديموغرافي من خلال دمج مصادر بيانات إضافية، مثل الصور، عند توفرها في قواعد بيانات السير الذاتية عبر الإنترنت.
DOI: https://doi.org/10.1140/epjds/s13688-025-00607-0
Publication Date: 2026-01-13
Author(s): Palakorn Achananuparp et al.
Primary Topic: Labor market dynamics and wage inequality
Overview
This research paper presents a comprehensive analysis of career mobility among college-educated workers in the U.S., focusing on the interplay of gender, race, and job change options in relation to upward mobility. Utilizing a dataset of 228,710 career trajectories and employing advanced data processing techniques, including a novel large language model-based occupation classification method called FewSOC, the study addresses significant data challenges such as missing demographic attributes and inaccurate occupation labels. The findings indicate that intra-firm occupation changes are the most effective in facilitating upward mobility, followed by inter-firm changes, while women and Black graduates experience notably lower returns from job changes compared to their male and White counterparts.
The study further explores the nuanced dynamics of mobility by distinguishing between intra-firm and inter-firm transitions and analyzing their differential impacts across various gender and racial/ethnic groups. Results reveal persistent gender disparities, with women generally receiving lower mobility returns, and highlight specific racial differences, particularly among Asian graduates who face lower returns compared to White graduates. The analysis underscores the importance of considering structural barriers that may limit the benefits of job mobility for highly educated women and raises questions about the factors contributing to racial disparities in career advancement. Overall, the research emphasizes the need for further investigation into the mechanisms sustaining these inequalities and suggests that the observed effects are likely conservative estimates due to potential measurement errors in race classification.
Introduction
The introduction of this research paper outlines significant transformations in the U.S. labor market, particularly the decline of internal labor markets characterized by stable, long-term employment and the rise of external labor markets that promote flexible employment and increased mobility across organizations. This shift has coincided with a notable increase in the educational attainment of the workforce, with the proportion of workers holding at least a college degree rising from 26% in 1991 to nearly 42% in 2022. Despite these changes, existing research often overlooks the specific experiences of college graduates regarding job mobility, particularly in relation to gender and race, leaving critical gaps in understanding how these factors influence career advancement.
The study aims to address these gaps by utilizing a large online resume dataset to analyze job mobility patterns among college-educated workers. It poses two primary research questions: how these workers navigate job change options for upward mobility and how the outcomes of such mobility differ by gender and race. The paper also introduces a novel machine learning approach, FewSOC, for accurately classifying occupational labels, which is essential for analyzing job mobility. This method improves upon existing classification accuracy, thereby enhancing the reliability of the study’s findings. The subsequent sections will detail the research methodology, including data preprocessing, the effectiveness of the FewSOC classification, and the regression analyses that will address the proposed research questions.
Methods
In this section, the authors detail the experimental setup used to evaluate the FewSOC method for occupational classification. They constructed a test set, termed Jobs12K, by sampling 11,920 job records from the LC0 partition, which included job title-company name pairs. The selection process involved several criteria: exclusion of job titles with non-alphanumeric or non-ASCII characters, those exceeding seven words, and the selection of 6-digit Standard Occupational Classification (SOC) codes associated with at least 20 job records, resulting in 596 qualifying codes. It is noted that these SOC codes may not accurately represent the true occupational distribution of the sampled records but serve as a preliminary indicator of commonly represented occupations.
Following the creation of Jobs12K, the FewSOC method was applied for SOC classification across the entire dataset. A fixed set of 17 k-shot examples was manually curated, utilizing distinct 8-digit SOC codes from the O*NET-SOC 2019 taxonomy. Job title-company pairs were generated by randomly pairing relevant job titles with both real and fictional organizations, ensuring no overlap with the test set. The SOC generation utilized the OpenAI API (GPT-3.5 Turbo model) in August 2023, with a focus on cost-effectiveness and deterministic outputs, resulting in a total API usage cost of $1.6 USD. The final output of this process is referred to as the FewSOC set.
Results
In this section, the authors present the results of their regression analyses aimed at addressing two primary research questions: the impact of job change types and demographic factors on upward mobility (RQ1), and the relationship between gender and race with these outcomes (RQ2). The findings are summarized in Table 4, while Figure 4 provides a coefficient plot that visually represents the main effects and significant interaction terms, with statistical significance indicated by distinct colors for coefficients with $p < 0.05$ and gray for those with $p > 0.05$. Control variable coefficients are detailed in Supplementary Figure D1.
Additionally, Table C3 presents the posterior means of fixed-effect coefficients, interaction terms, and random-effect variance components for Models 1F-4F. To facilitate comparison, Figures C1 and D2 visualize these estimates alongside the main effects from the respective models. Significant coefficients (with $p < 0.05$ or 95% credible intervals excluding zero) are highlighted in model-specific colors, while non-significant estimates are shown in gray. Figure C1 emphasizes the main predictors and key interactions, whereas Figure D2 includes the complete set of control variables, with horizontal jitter applied to enhance visual clarity among closely valued estimates.
Discussion
In the discussion section, the paper highlights the significant barriers to job mobility faced by traditionally disadvantaged groups, particularly women and minorities. These groups experience systemic biases that limit their internal and external mobility, often resulting in career stagnation. The research underscores the role of segregated social networks, which restrict access to valuable job information and referrals, further exacerbating the challenges faced by these populations. Despite the potential advantages of higher education, minority professionals still encounter a “glass ceiling” that can hinder upward mobility, indicating that educational attainment alone may not fully mitigate the barriers to career advancement.
The section also critiques existing literature for its lack of specificity regarding job mobility types and its tendency to overlook the experiences of highly educated workers. It emphasizes the need for a nuanced understanding of job mobility dynamics, particularly how different forms of mobility impact career trajectories and outcomes. The authors propose that job mobility, while generally associated with upward mobility, can lead to inefficient transitions for women and minorities, often resulting in lateral moves rather than upward advancement. This complexity necessitates a more detailed examination of job change types and their implications for career progression, particularly in the context of the dataset and methodologies employed in the study.
Limitations
The limitations of the FewSOC framework highlight several critical areas for improvement and future research. Firstly, the reliance on a manually curated set of in-context examples, while effective in enhancing predictions compared to Lightcast, may not ensure optimal performance and could introduce variability in quality and representativeness. This subjective and time-intensive selection process suggests a need for more systematic approaches, such as k-nearest neighbors (kNN), to refine the selection of in-context examples.
Secondly, despite the advancements in predicting SOC codes through FewSOC, inaccuracies in these predictions can lead to misclassifications of job roles, potentially biasing career trajectory analyses and skewing regression coefficient estimates. The variability in prediction errors across different occupations may result in misleading conclusions, necessitating careful interpretation of the findings. Additionally, the low inter-rater reliability among AMT workers raises concerns regarding the validity of crowdsourced SOC code evaluations. While skill-weighted rating aggregation was employed to address this issue, further improvements in human annotation reliability are essential, potentially through enhanced training and clearer guidelines.
Lastly, the algorithmic derivation of gender and race measures introduces precision concerns, particularly for race classification, where name-based methods show uneven accuracy across different demographic groups. This measurement error may lead to conservative estimates of race effects in the regression models, particularly for Black and Asian individuals. Future research should aim to enhance demographic inference precision by integrating additional data sources, such as images, as they become available in online resume databases.
