تخطى إلى المحتوى
العالِم العربي
  • الصفحة الرئيسية
  • مجالات الأبحاث
  • عن الموقع
  • تواصل معنا
  1. الرئيسية
  2. قائمة الكلمات المفتاحية
  3. تنقيب البيانات

الأبحاث المرتبطة بالكلمة المفتاحية: تنقيب البيانات




  • معالجة عدم التوازن في مجموعات بيانات الصحة: طريقة جديدة NR-Clustering SMOTE وتعديل مقياس المسافة

    2025 | المؤلف: Didik Dwi Prasetya وآخرون | المجلة: Computers, materials & continua/Computers, materials & continua (Print) | المجال: إدارة المعلومات الصحية (Health Information Management)

    تتناول الأبحاث التحديات التي تطرحها مجموعات البيانات غير المتوازنة في تعلم الآلة، وخاصة في مهام التصنيف حيث تكون الفئات الأقل تمثيلاً، مما يؤدي إلى نماذج متحيزة. للتخفيف من هذه المشكلات، تقدم الدراسة طريقة NR-Clustering SMOTE، التي تتعامل في الوقت نفسه مع الضوضاء والتداخل في بيانات الفئة الأقل التي تم إنشاؤها بواسطة تقنية العينة الزائدة الاصطناعية…


  • تحليل تجميع معدل ومعدل الوزن المعتمد على مسافة غاور للبيانات المختلطة: محاكاة وتحليلات تجريبية

    2024 | المؤلف: Pinyan Liu وآخرون | المجلة: BMC Medical Research Methodology | المجال: أمراض اللثة (Periodontics)

    تقدم هذه الدراسة DAFI-Gower، وهي تقنية تجميع جديدة مصممة لمجموعات البيانات المختلطة التي تشمل كل من المتغيرات المستمرة والفئوية، مما يعالج قيود طرق التجميع التقليدية. من خلال تعديل مسافة Gower لتضمين أهمية الميزات كأوزان، يضمن DAFI-Gower مساهمات متوازنة من أنواع الميزات المختلفة. تم تقييم الخوارزمية بدقة مقابل 13 تقنية تجميع موجودة باستخدام كل من مجموعات…


  • تقدير أحجام مجموعات البيانات الدنيا لتوقعات التعلم الآلي في التدخلات الصحية النفسية الرقمية

    2024 | المؤلف: Kirsten Zantvoort وآخرون | المجلة: npj Digital Medicine | المجال: علم النفس التطبيقي (Applied Psychology)

    تبحث الدراسة في تأثير حجم مجموعة البيانات على الأداء التنبؤي لنماذج الذكاء الاصطناعي في سياق التدخلات الرقمية للصحة النفسية. من خلال تحليل بيانات من 3,654 مستخدمًا، تقيم الدراسة توقعات التسرب عبر أحجام مجموعات بيانات مختلفة (N = 100-3654)، ومجموعات الميزات (F = 2-129)، والخوارزميات التي تتراوح من نايف بايز إلى الشبكات العصبية. تشير النتائج إلى…


  • توقعات قوية للسكري باستخدام نماذج تعلم الآلة الجماعية مع تقنية زيادة العينة للأقليات الاصطناعية

    2024 | المؤلف: Zhenyun Du وآخرون | المجلة: Scientific Reports | المجال: إدارة المعلومات الصحية (Health Information Management)

    تتناول هذه الورقة البحثية القضية الصحية العالمية الحرجة المتعلقة بمرض السكري، الذي يتميز بعدم استجابة الجسم الكافية للأنسولين أو نقص إنتاج الأنسولين، مما يؤدي إلى ارتفاع مستويات السكر في الدم ومضاعفات خطيرة مثل أمراض الكلى، وضعف الرؤية، ومشاكل القلب والأوعية الدموية. يقترح المؤلفون إطارًا قويًا لتوقع مرض السكري يستخدم تقنية زيادة العينة للأقليات الاصطناعية (SMOTE)…


  • أداة التحليل الإحصائي CMS ودمج البيانات: دمج

    2024 | المؤلف: A. Hayrapetyan وآخرون | المجلة: Computing and Software for Big Science | المجال: الفيزياء النووية وطاقات عالية (Nuclear and High Energy Physics)

    تحدد هذه القسم حزمة البرمجيات Combine المستخدمة في التحليلات الإحصائية من قبل تعاون CMS، والتي تم تطويرها في البداية للبحث عن بوزون هيغز وتحليلاتها المجمعة. مع مرور الوقت، أصبحت Combine الأداة الإحصائية الرئيسية لمجموعة واسعة من القياسات والبحث ضمن تعاون CMS، بينما يمكن استخدامها أيضًا من قبل مستخدمين خارج هذه التجربة المحددة. تعمل الورقة كمصدر…


  • نهج جديد لتقدير القيم المفقودة يعتمد على MissForest مع استبعاد الميزات التكرارية في التطبيقات الطبية

    2024 | المؤلف: Ya‐Han Hu وآخرون | المجلة: BMC Medical Research Methodology | المجال: الإحصاء والاحتمالات (Statistics and Probability)

    تقدم ورقة البحث طريقة جديدة للتقدير تُسمى “الإزالة التكرارية للميزات – ميس فورست” (RFE-MF)، تهدف إلى تحسين جودة تقدير البيانات في مجموعات البيانات الطبية من خلال تقليل تأثير الميزات غير ذات الصلة. تقارن الدراسة بين RFE-MF وأربع تقنيات تقدير تقليدية – المتوسط/الوضع، الجيران الأقرب (kNN)، التقدير المتعدد بواسطة المعادلات المتسلسلة (MICE)، وميس فورست الأصلية (MF)…


  • تطوير وتحقق من إطار عمل جديد للذكاء الاصطناعي باستخدام معالجة اللغة الطبيعية مع دمج نماذج اللغة الكبيرة لاستخراج البيانات السريرية ذات الصلة من خلال مراجعة المخططات الآلية

    2024 | المؤلف: Mert Marcel Dagli وآخرون | المجلة: Scientific Reports | المجال: إدارة المعلومات الصحية (Health Information Management)

    تتناول هذه الدراسة التحديات المرتبطة بالاستخراج اليدوي للبيانات الجراحية من السجلات الصحية الإلكترونية (EHRs)، وخاصة ملاحظات العمليات، والتي غالبًا ما تعيقها الأخطاء البشرية وتستغرق وقتًا طويلاً. للتغلب على هذه القيود، قام الباحثون بتطوير والتحقق من صحة خوارزمية جديدة لمعالجة اللغة الطبيعية (NLP) مدمجة مع نموذج لغة كبير (LLM)، تحديدًا GPT-4 Turbo، تهدف إلى أتمتة استخراج…


  • تعزيز اكتشاف البرمجيات الضارة من خلال اختيار الميزات الذاتية باستخدام مُحسِّن الذئب الرمادي

    2024 | المؤلف: Mosleh M. Abualhaj وآخرون | المجلة: Indonesian Journal of Electrical Engineering and Computer Science | المجال: معالجة الإشارات (Signal Processing)

    تقدم هذه البحث نظام RFGWO-Mal، وهو نهج مبتكر للكشف عن البرمجيات الضارة وتصنيفها باستخدام مزيج من مصنف الغابة العشوائية (RF) ومحسن الذئب الرمادي (GWO). يستخدم النظام طريقة جديدة لاختيار الميزات ذات الاتحاد الذاتي، والتي تدمج الميزات من مجموعات فرعية مختلفة تم تحديدها بواسطة GWO لمهام التصنيف الثنائي والمتعدد الفئات. تم تقييم فعالية نظام RFGWO-Mal باستخدام…


  • تحليل المشاعر المبتكر وتوقع سعر السهم باستخدام FinBERT وGPT-4 والانحدار اللوجستي: نهج قائم على البيانات

    2024 | المؤلف: Olamilekan Shobayo وآخرون | المجلة: Big Data and Cognitive Computing | المجال: علم الإدارة وبحوث العمليات (Management Science and Operations Research)

    تدرس هذه الدراسة أداء نماذج الذكاء الاصطناعي المتقدمة – تحديدًا FinBERT و GPT-4 والانحدار اللوجستي – في تحليل المشاعر وتوقع مؤشرات الأسهم، مستفيدة من الأخبار المالية وبيانات مؤشر NGX All-Share. تهدف الأبحاث إلى تصنيف مشاعر السوق وتوقع تحركات الأسعار من خلال هذه النماذج، وتقييم فعاليتها باستخدام مقاييس مثل الدقة والدقة المتوسطة والاسترجاع ودرجة F1 و…


  • CRITID: تعزيز CRITIC مع اختبار الاستقلال المتقدم لصنع القرار متعدد المعايير بشكل قوي

    2024 | المؤلف: Qiang Zhang وآخرون | المجلة: Scientific Reports | المجال: الإحصاء والاحتمالات (Statistics and Probability)

    في سياق اتخاذ القرار متعدد المعايير وتقييم النماذج، فإن تحديد وزن المعايير بدقة أمر ضروري، خاصة في عصر البيانات الضخمة حيث يصبح تحليل المشكلات المعقدة أمرًا متزايد الأهمية. تستخدم الطرق التقليدية، مثل أهمية المعايير من خلال ارتباط المعايير (CRITIC)، بشكل أساسي ارتباط بيرسون، والذي قد لا يكون كافيًا لالتقاط العلاقات غير الخطية بين المعايير. لمعالجة…


←السابق
1 … 11 12 13 14 15 … 19
التالي→

حقوق النشر © 2026 العالِم العربي. جميع الحقوق محفوظة. موقع العالِم العربي غير مسؤول عن محتوى المواقع الخارجية.