نظام توصية بالأدوية يعتمد على معالجة اللغة الطبيعية لتحليل مشاعر المرضى Medication Recommendation System Based on Natural Language Processing for Patient Emotion Analysis

المجلة: Academic Journal of Science and Technology، المجلد: 10، العدد: 1
DOI: https://doi.org/10.54097/v160aa61
تاريخ النشر: 2024-03-26

نظام توصية بالأدوية يعتمد على معالجة اللغة الطبيعية لتحليل مشاعر المرضى

هاوتيان تشنغ كانغ مينغ هويمنغ تشو يوفو وانغ غوانغزي سو الهندسة الكهربائية وهندسة الحاسبات، جامعة نيويورك، نيويورك، نيويورك، الولايات المتحدة الأمريكية علوم الحاسوب والهندسة، جامعة سانتا كلارا، كاليفورنيا، الولايات المتحدة الأمريكية علوم الحاسوب، جامعة نورث إيسترن، كاليفورنيا، الولايات المتحدة الأمريكية علوم الحاسوب والهندسة، جامعة سانتا كلارا، سانتا كلارا، كاليفورنيا، الولايات المتحدة الأمريكية علوم المعلومات، جامعة ترين، فينيكس، أريزونا، الولايات المتحدة الأمريكية*البريد الإلكتروني للمؤلف المراسل: hz2687@nyu.edu

الملخص

معالجة اللغة الطبيعية (NLP) هي مجال متعدد التخصصات في علوم الحاسوب، والذكاء الاصطناعي، واللغويات، يركز على قدرة الحواسيب على فهم ومعالجة وتوليد ومحاكاة اللغة البشرية من أجل تحقيق القدرة على إجراء محادثات طبيعية مع البشر. المبادئ الأساسية لمعالجة اللغة الطبيعية تتواجد على مستويات متعددة، بما في ذلك اللغويات، وعلوم الحاسوب، والإحصاء. يتضمن ذلك دراسة بنية اللغة، والدلالات، والقواعد، والبراغماتية، بالإضافة إلى التحليل الإحصائي ونمذجة مجموعات البيانات الكبيرة. في عملية التنفيذ الفعلي، من الضروري معالجة اللغة الطبيعية على مستويات متعددة. بناءً على ذلك، قامت هذه الورقة بدمج التعلم العميق وتقنية معالجة اللغة الطبيعية لإجراء تحليل المشاعر على تعليقات المرضى، بهدف التوصية بالأدوية الأكثر ملاءمة للمرضى، وبالتالي تحقيق وصف دقيق للأدوية وتوصيات مخصصة.

الكلمات الرئيسية: معالجة اللغة الطبيعية (NLP)؛ الذكاء الاصطناعي؛ تحليل المشاعر؛ التوصيات المخصصة؛ تحليل التعليقات.

1. المقدمة

تعود تطورات معالجة اللغة الطبيعية إلى الخمسينيات، عندما بدأ علماء الكمبيوتر في تجربة برامج الكمبيوتر لفهم وتوليد اللغة الطبيعية. كانت الأبحاث المبكرة تركز على الأساليب القائمة على القواعد والمعرفة، مثل كتابة قواعد النحو والقواميس لتحليل الجمل. في الثمانينيات، مع تحسين قوة الحوسبة وظهور مجموعة كبيرة من البيانات، بدأت الأساليب الإحصائية تهيمن تدريجياً على مجال معالجة اللغة الطبيعية. خلال هذه الفترة، ظهرت العديد من طرق الترجمة الآلية المعتمدة على الإحصائيات، وتقسيم الكلمات، ووضع علامات على أجزاء الكلام وغيرها من الأساليب واحدة تلو الأخرى. في القرن الحادي والعشرين، وخاصة في العقد الأخير، ساهم تطور تكنولوجيا التعلم العميق بشكل كبير في تقدم معالجة اللغة الطبيعية. النماذج المعتمدة على الشبكات العصبية العميقة، مثل الشبكات العصبية المتكررة (RNN) وشبكات الذاكرة طويلة وقصيرة الأمد.1-3والمحول، قد حسّن بشكل كبير من كفاءة ودقة معالجة اللغة الطبيعية.
على الصعيد الدولي، حققت عمالقة التكنولوجيا مثل جوجل وفيسبوك وأوبن إيه آي أيضًا سلسلة من الاختراقات المهمة في مجال معالجة اللغة الطبيعية. على سبيل المثال، حقق نموذج BERT من جوجل وعائلة نماذج GPT من أوبن إيه آي أداءً يفوق البشر في العديد من مهام معالجة اللغة الطبيعية. في الصين، حققت أبحاث معالجة اللغة الطبيعية وتطوير الصناعة أيضًا نتائج مثمرة. في الوقت الحالي، هناك العديد من المؤسسات البحثية والشركات المحلية في مجال معالجة اللغة الطبيعية، مثل معهد علوم الحوسبة التابع للأكاديمية الصينية للعلوم، جامعة تسينغhua، بايدو، تينسنت، وغيرها. من بينها، يتمتع نموذج ERNIE من بايدو، ونموذج BERT من علي بابا ونماذج مسبقة التدريب الأخرى بأداء جيد في مختلف مهام معالجة اللغة الطبيعية الصينية.
في نفس الوقت، قامت العديد من الشركات المحلية أيضًا بتطبيق تقنية معالجة اللغة الطبيعية في خدمة العملاء الذكية، ومحركات البحث، وأنظمة التوصية وغيرها من السيناريوهات.
تكنولوجيا معالجة اللغة الطبيعية (NLP) يمكنها معالجة البيانات غير المهيكلة تمامًا، ومن الأغراض الرئيسية التي تدفع الشركات لتبني تكنولوجيا NLP هو دمج أنظمة ذكية لتحسين العمليات التنظيمية، وزيادة كفاءة الوقت، وتقليل التكاليف التشغيلية.
بغض النظر، هناك فوائد أخرى لدمج [7] معالجة اللغة الطبيعية في تطوير تطبيقات الرعاية الصحية. يمكن أن تترجم معالجة اللغة الطبيعية اللغة البشرية إلى شكل يمكن للآلة قراءته، مما يسمح للآلات باستخلاص المعنى من البيانات المقدمة. تستخدم الرعاية الصحية أدوات معالجة اللغة الطبيعية للتحكم في البيانات التي يمكن تخزينها كصوت، نص، هيروغليفية، صور، والمزيد لاستخلاص استنتاجات مفيدة.
تظهر الدراسة أن معالجة اللغة الطبيعية في الرعاية الصحية من المتوقع أن تزيد من مليون في 2016 إلى مليون في عام 2021، مما يمثل معدل نمو سنوي مركب قدره .
قبل أن نناقش استخدام هذه التكنولوجيا الم disruptive في صناعة الرعاية الصحية، دعونا نفهم ما تعنيه NLP فعلاً. [8] NLP هو مجال من مجالات الذكاء الاصطناعي الذي يهدف إلى سد الفجوة بين البشر والروبوتات. مع قدرات NLP، يمكن لنظام قوي أن يفهم ويخزن ويعالج وينفذ الرؤى المستندة إلى البيانات بلغة أو نص يمكن للبشر فهمه.
تزداد أهمية أنظمة معالجة اللغة الطبيعية وفائدتها في تطوير تطبيقات الرعاية الصحية. ونتيجة لذلك، فإن أنظمة مثل بناء روبوتات المحادثة باستخدام معالجة اللغة الطبيعية تحدث تأثيرًا كبيرًا في صناعة الرعاية الصحية. في حالة التنفيذ الفعّال، يمكن للتكنولوجيا أن تساعد الأطباء في تبسيط عمليات الإدارة من خلال تحليل البيانات في الوقت الحقيقي، مما يسمح لهم بقضاء المزيد من الوقت في رعاية المرضى وتحسين تجربة المريض.

2.1. تقنية معالجة اللغة الطبيعية (NLP)

معالجة اللغة الطبيعية (NLP) هي مجال متعدد التخصصات يمتد عبر عدة مجالات مثل علوم الحاسوب، الذكاء الاصطناعي، واللغويات. تهدف إلى تمكين الحواسيب من فهم وتوليد ومعالجة اللغة البشرية، وتحقيق التفاعل الطبيعي بين الحواسيب والبشر. مع التطور المستمر لتكنولوجيا معالجة اللغة الطبيعية، ستستخدم بشكل متزايد في الذكاء الاصطناعي، التعلم الآلي، والبيانات الضخمة. على سبيل المثال، في مجال الذكاء الاصطناعي، يمكن لتكنولوجيا معالجة اللغة الطبيعية أن تساعد الآلات على فهم اللغة البشرية بشكل أفضل وتحسين قدرة التفاعل والفهم الدلالي للآلات. في مجال التعلم الآلي، يمكن لتكنولوجيا معالجة اللغة الطبيعية أن تساعد الآلات على فهم ومعالجة بيانات النصوص بشكل أفضل، وتحسين فعالية ودقة التعلم الآلي. في مجال البيانات الضخمة، يمكن لتكنولوجيا معالجة اللغة الطبيعية أن تساعد الشركات والمنظمات على فهم وتحليل كميات كبيرة من بيانات النصوص، مما يساعدهم على فهم اتجاهات السوق، واحتياجات العملاء، والنقاط الساخنة الاجتماعية بشكل أفضل.
على الرغم من أن تقنية معالجة اللغة الطبيعية توفر العديد من التسهيلات والتطبيقات، إلا أنها تواجه أيضًا العديد من التحديات والمشكلات. على سبيل المثال، كيفية حل مشكلات التعدد الدلالي، والعادات اللغوية، وصعوبة اللغة، وكيفية تحسين دقة وطبيعية الترجمة، وكيفية حل الأبعاد العاطفية للغة وغيرها من المشكلات. [12] تحتاج هذه المشكلات إلى استمرار دراستنا واستكشافنا لتحسين مستوى التطبيق وتأثير تقنية معالجة اللغة الطبيعية. يمكننا أن نرى أن تقنية معالجة اللغة الطبيعية هي موضوع علمي وتكنولوجي ذو نطاق واسع من التطبيقات، وسأستمر في الحديث عن التطورات والتطبيقات المتقدمة لتقنية معالجة اللغة الطبيعية.
في السنوات الأخيرة، حظيت تطبيقات تكنولوجيا معالجة اللغة الطبيعية في مجال التعلم العميق باهتمام وبحث واسع. تستخدم تكنولوجيا التعلم العميق نموذج الشبكة العصبية لمعالجة بيانات النصوص، مما يمكنها من تعلم ميزات لغوية أغنى واستخراج الميزات المخفية تلقائيًا من بيانات النصوص. وقد مكن ذلك تقنيات التعلم العميق من تحقيق العديد من النتائج الرائدة في مجال معالجة اللغة الطبيعية.
من بين هذه التطبيقات، تعتبر نمذجة نماذج اللغة وتوليد اللغة الطبيعية من التطبيقات الأكثر تمثيلاً. نمذجة اللغة هي واحدة من المهام الأساسية في مجال معالجة اللغة الطبيعية، والتي قادرة على نمذجة تسلسلات النصوص للتنبؤ بتوزيع احتمالية الكلمة التالية. يمكن استخدام التقنيات المعتمدة على نماذج اللغة في توليد اللغة الطبيعية، والترجمة الآلية، والتعرف على الكلام، وتصنيف النصوص وغيرها من المهام. في الوقت نفسه، تم أيضًا الاهتمام بتقنية توليد اللغة الطبيعية وتطبيقها على نطاق واسع، مثل: الملخص التلقائي، [13-16]الدردشة الآلية، توليد النصوص، وما إلى ذلك.
بالإضافة إلى ذلك، يمكن أيضًا استخدام تقنيات التعلم العميق في مهام مثل تحليل التركيب، وتحليل المعنى، والتعرف على الكيانات المسماة. على سبيل المثال، يمكن أن يقوم التعرف على الكيانات المسماة باستخراج معلومات الكيانات مثل الاسم الشخصي، واسم المكان، واسم المنظمة من النص تلقائيًا لتوفير المساعدة في استخراج المعلومات والتنقيب عن البيانات. يمكن أن يساعد تحليل المعنى الآلات على فهم اللغة البشرية بشكل أفضل وتحسين قدرتها على الفهم وتأثير التطبيق.
بالإضافة إلى ذلك، مع التطور المستمر وانتشار تقنية معالجة اللغة الطبيعية، أصبحت سيناريوهات تطبيقها تتنوع بشكل متزايد. على سبيل المثال، في المجال الطبي، يمكن أن تساعد تقنية معالجة اللغة الطبيعية الأطباء على معالجة وفهم بيانات السجلات الطبية بشكل أفضل، مما يحسن من كفاءة ودقة التشخيص والعلاج. في المجال المالي، يمكن أن تساعد تقنية معالجة اللغة الطبيعية المؤسسات المالية على إدارة المخاطر والإفصاح عن المعلومات بشكل أفضل. في مجال التعليم، يمكن أن تساعد تقنية معالجة اللغة الطبيعية المؤسسات التعليمية على إجراء التعليم الذكي والتقييم بشكل أفضل[18].
بشكل عام، تعتبر تقنية معالجة اللغة الطبيعية تطورًا تكنولوجيًا مهمًا ومتقدمًا، مما يواصل دفع تقدم وتطور الذكاء الاصطناعي والبيانات الضخمة. مع الابتكار والتقدم المستمر في التكنولوجيا، يُعتقد أن تقنية معالجة اللغة الطبيعية ستُطبق وتُطور في المزيد من المجالات، مما يجلب المزيد من الراحة والتغيير للبشر.

2.2. تحليل عواطف اللغة الطبيعية

تحليل المشاعر للنص في معالجة اللغة الطبيعية (NLP) هو مجال تطبيق مهم، وغالبًا ما يُستخدم لتقييم تعليقات المستخدمين، مثل مراجعات الأفلام ومراجعات ما بعد التسوق. يعتمد تحليل العواطف بشكل أساسي على بيانات نص الإجابة من المستخدم (الصينية) لإجراء تحليل كمي لعواطف النص. تشمل طرق تحليل المشاعر الحالية ما يلي: 1. [19]طريقة تحليل قاموس العواطف. 2. طريقة تحليل التعلم الآلي. وهي تقطع كلمات النص، وتزيل الكلمات التوقف، وتستخرج الكلمات الرئيسية الإيجابية والسلبية في الكلمات الرئيسية، وتحسب درجة العاطفة.
أولاً، يتم قطع بيانات النص، هنا أداة قطع الكلمات الصينية jieba، وهناك العديد من أدوات قطع الكلمات الأخرى، مثل snowNLP، وما إلى ذلك، لها مزاياها الخاصة، ولكن كلما كانت قطع الكلمات أكثر دقة، كانت النتائج أكثر دقة. الثاني يتعلق بإنشاء القواميس، والتي تشمل بشكل رئيسي ثلاثة قواميس، قاموس كلمات التوقف، قاموس العواطف الإيجابية، قاموس العواطف السلبية، من قاموس HowNet. يحتوي قاموس كلمات التوقف على أدوات الربط مثل “لذا” و”كيف” وعلامات الترقيم وما إلى ذلك، وهي كلمات لا تحمل عاطفة، وعندما تزيل هذه الكلمات، يتبقى لديك كلمات تحمل عاطفة. كلما احتوى القاموس على المزيد من البيانات، كانت توقعات المشاعر أكثر دقة.
عادة ما يتم دمجها مع استخدام طرق التعلم الآلي، باستخدام نموذج متجه الكلمات word2vec، حيث يتم تحويل الكلمة إلى مصفوفة، بحيث من خلال حساب المسافة بين البيانات بين الكلمات، يمكن قياس التشابه بين الكلمات، بحيث بعد أن يتعلم النموذج تحت إشراف متجهات الكلمات الإيجابية والسلبية، يمكنك الحصول على النتيجة. يتم استخدام الشبكة العصبية التكرارية LSTM[20] هنا، وتساعد أداء التأخير لـ LSTM في تعلم متجهات الكلمات. يتم استخدام إطار التعلم العميق tensorflow هنا.
مبدأ خوارزمية تحليل العواطف
تشمل المبادئ الرئيسية لخوارزميات تحليل المشاعر ما يلي:
  1. طريقة التعلم الإحصائي: يمكن لخوارزمية تحليل العواطف المعتمدة على طريقة التعلم الإحصائي تحديد معلومات العواطف في النص من خلال تعلم مجموعة بيانات التدريب. تشمل هذه الخوارزميات باي البسيط، وآلات الدعم الشعاعي، وأشجار القرار، وما إلى ذلك.
  2. طريقة التعلم العميق: تتعلم خوارزمية تحليل العواطف المعتمدة على طريقة التعلم العميق معلومات العواطف في النص من خلال شبكة عصبية متعددة الطبقات. تشمل هذه الخوارزميات الشبكة العصبية التلافيفية، والشبكة العصبية التكرارية، وآلية الانتباه الذاتي، وما إلى ذلك.

2.3. معالجة اللغة الطبيعية والرعاية الصحية

  1. التعرف على الكلام
على مدى عقدين من الزمن، كانت أصول معالجة اللغة الطبيعية في الرعاية الصحية مرتبطة بالتعرف على الصوت، وهي تقنية تسمح للأطباء بنقل الوصفات بسرعة إلى السجلات الصحية الإلكترونية (EHR).
يسمح التعرف على الصوت من الواجهة الأمامية للأطباء بإملاء الوصفات دون الجلوس أمام جهاز كمبيوتر نقطة الرعاية، بينما يقوم التعرف من الخلف بتصحيح المشكلات قبل إرسال النسخ إلى الأشخاص للتحقق.
بدون الحاجة إلى كتبة طبية وتكاليفهم العالية، يعد التعرف على الصوت أحد الحلول الأكثر فعالية من حيث التكلفة.
2. الوثائق السريرية
تأثير معالجة اللغة الطبيعية على التعرف على الصوت مرتبط ارتباطًا وثيقًا بالتوثيق السريري بسبب إملاء معالجة اللغة الطبيعية وتحليل البيانات الهيكلية، مما يحرر الأطباء من الهيكل المرهق والمقيد للسجلات الصحية الإلكترونية لرعاية المرضى بشكل أفضل.
تمتلك كل من Nuance وM*Modal تقنية تعمل بالتوازي مع التعرف على الصوت، والتي تجمع البيانات الهيكلية والمصطلحات الموحدة في نقطة الرعاية للاستخدام المستقبلي[21].
3. الترميز المدعوم بالحاسوب (CAC)
يجمع CAC البيانات من الإجراءات وبروتوكولات العلاج من أجل التقاط كل رمز ممكن وتحسين المطالبات. قد يحسن CAC سرعة الترميز، لكنه لا يفعل شيئًا لتحسين دقة الترميز.
على سبيل المثال، أظهرت دراسة لمستشفى كليفلاند أنه بينما قلل CAC من وقت الترميز، كان لديه ضعف في الاسترجاع والدقة عند استخدامه بمفرده دون مساعدة من مُرمز مؤهل.
4. مطابقة التجارب السريرية
ربما تكون مطابقة التجارب السريرية هي الحالة الأكثر مناقشة في فئة “قيد التطوير”. على سبيل المثال، أنشأت شركتان، Linguamatics Health وClinithink، محركات معالجة لغة طبيعية لمعالجة مطابقة التجارب، بينما استثمرت شركتان، IBM Watson Health وInspirata، موارد كبيرة في استخدام معالجة اللغة الطبيعية لدعم أبحاث الأورام.
في المستقبل القريب، يبدو أن معالجة اللغة الطبيعية لديها القدرة على جعل مطابقة التجارب السريرية عملية سلسة وآلية.
5. أبحاث التنقيب عن البيانات
يسمح التنقيب عن البيانات في أنظمة الرعاية الصحية للشركات بتقليل ذاتية القرارات مع توفير المعرفة الطبية ذات الصلة. بمجرد بدء التنقيب عن البيانات، يمكن أن يصبح تقنية دائرية لاكتشاف المعرفة تساعد جميع شركات الرعاية الصحية على تطوير استراتيجيات مالية سليمة لتقديم رعاية أفضل للمرضى.
6. الدردشة الآلية والكتبة الافتراضية
بينما لا يوجد مثل هذا الحل حتى الآن، هناك فرصة جيدة أن تساعد تطبيقات التعرف على الصوت البشر في تعديل الأوراق السريرية. سيكون Alexa من أمازون أو مساعد Google مثاليين لذلك.
تعاونت مايكروسوفت وجوجل في هذا الصدد لتحقيق هذا الهدف المحدد. حاليًا، يمكن للدردشة الآلية المبنية باستخدام معالجة اللغة الطبيعية التقاط أعراض المريض وتوجيههم إلى نقطة العلاج الأكثر ملاءمة.
7. تحليل السبب الجذري
جانب آخر مثير للاهتمام من معالجة اللغة الطبيعية هو قدرة
التحليلات التنبؤية على تقديم حلول لمشاكل الصحة الشائعة.
يمكن أن تساعد كميات كبيرة من السجلات الطبية الرقمية في تحديد مجموعات فرعية من المناطق الجغرافية، أو المجموعات العرقية، أو غيرها من المجموعات السكانية المتنوعة التي تواجه أنواعًا مختلفة من الفجوات الصحية عند تطبيق معالجة اللغة الطبيعية. يقوم نظام معالجة اللغة الطبيعية بتقييم الاستجابات غير المنظمة لتحديد السبب الجذري لمرض المريض.
8. إدارة المراجعات وتحليل العواطف
يمكن أن تساعد معالجة اللغة الطبيعية (NLP) أيضًا منظمات الرعاية الصحية في إدارة المراجعات على الإنترنت. كل يوم، تجمع وتحلل مئات التعليقات حول الرعاية الصحية من قوائم الطرف الثالث، بالإضافة إلى تقييم المشاعر البشرية والسياق الذي يتم فيه التعبير عن تلك المشاعر بسرعة.
يمكن لبعض الأنظمة حتى الاستماع إلى العملاء في التعليقات، مما يمكن الأطباء من فهم كيف ينظر المستهلكون إلى رعايتهم، على سبيل المثال، والتواصل بشكل أكثر فعالية بلغة يفهمها الجميع.
في الختام، يجلب دمج معالجة اللغة الطبيعية (NLP) في الرعاية الصحية مجموعة من الفوائد عبر مجالات مختلفة. من التعرف على الكلام الذي يسهل النسخ الفعال للوصفات الطبية إلى مطابقة التجارب السريرية التي تبسط عمليات البحث، تثبت NLP أنها أداة متعددة الاستخدامات لتعزيز تقديم الرعاية الصحية. بالإضافة إلى ذلك، تقدم التطبيقات المدعومة بـ NLP مثل الدردشة الآلية والكتبة الافتراضية طرقًا واعدة لتحسين التواصل مع المرضى والمهام الإدارية. علاوة على ذلك، توفر قدرة NLP على إجراء تحليل الأسباب الجذرية وتحليل المشاعر رؤى قيمة لمعالجة الفجوات الصحية وتعزيز رضا المرضى. بشكل عام، يحمل استخدام NLP إمكانات هائلة لإحداث ثورة في عمليات الرعاية الصحية وتحسين نتائج المرضى.

3. المنهجية

3.1. خوارزمية تحليل المشاعر

خطوات التشغيل المحددة لخوارزمية تحليل المشاعر:
  1. معالجة البيانات: يتم تنظيف النص المدخل، وإزالة الكلمات التوقف، ووضع علامات على أجزاء الكلام، واستخراج الكلمات وغيرها من المعالجة لاستخراج ميزات ذات مغزى.
  2. استخراج الميزات: يتم تحويل النص المعالج مسبقًا إلى تمثيل متجه لتسهيل فهم الكمبيوتر ومعالجته. يمكن تحقيق ذلك من خلال نموذج كيس الكلمات، TF-IDF، Word2Vec وما إلى ذلك.
  3. تدريب النموذج: وفقًا لمبدأ الخوارزمية المختارة، يتم إجراء تدريب النموذج على مجموعة بيانات التدريب. يمكن تحقيق ذلك من خلال طرق تحسين مثل الانحدار التدرجي والانحدار التدرجي العشوائي.
  4. تقييم النموذج: يتم تقييم مجموعات بيانات الاختبار لقياس أداء ودقة النموذج. يمكن تقييم ذلك من خلال مقاييس مثل الدقة، ومعدلات الاسترجاع، ودرجات F1، وما إلى ذلك.
  5. تحسين النموذج: وفقًا لنتائج تقييم النموذج، يتم تحسين النموذج لتحسين الدقة والأداء. يمكن تحقيق ذلك من خلال ضبط المعلمات الفائقة، واختيار الميزات، ودمج النماذج وما إلى ذلك.

3.2. صيغة النموذج الرياضي لتحليل المشاعر

  1. بايزي البسيط
بايزي البسيط هو طريقة تعلم إحصائية تعتمد على نظرية بايز، والتي تفترض أن الميزات مستقلة عن بعضها البعض. لمشاكل التصنيف الثنائي، يمكن التعبير عن بايزي البسيط كما يلي:
حيث هي احتمالية الفئة y بالنظر إلى المتجه الخاص هي احتمالية المتجه x بالنظر إلى الفئة هي احتمالية الفئة ، و هي احتمالية المتجه x.

2. آلة الدعم الناقل

آلة الدعم الناقل (SVM) هي حل لمشكلة التصنيف الثنائي التي تفصل بين فئات البيانات المختلفة من خلال إيجاد مستوى فائق يعظم هامش الحدود. صيغة آلة الدعم الناقل هي:
حيث هي دالة الإخراج، yi هي علامة بيانات التدريب، هي دالة النواة، b هو مصطلح التحيز، و alpha_i هو مضاعف لاغرانج.

3.3. تصميم التجربة

تستخدم هذه التجربة تقنية معالجة اللغة الطبيعية (NLP) لتحسين أنظمة توصية الأدوية المخصصة لحالات المرضى الفردية. التجربة
اتبعت طرقًا منهجية منظمة تضمنت استكشاف البيانات، ومعالجة البيانات، وتطوير النموذج، وتقييم الاستنتاجات والقيود. في مرحلة استكشاف البيانات، تُستخدم تقنيات التصور والإحصاء للحصول على رؤى حول خصائص مجموعة البيانات. تساعد هذه العملية في معالجة البيانات وهندسة الميزات ذات الصلة للنموذج. لمعالجة القيود الموجودة في معالجة اللغة الطبيعية، نقدم نموذج التعلم الآلي LightGBM. خفف النموذج من التحيز المحتمل وحسن من الموثوقية من خلال دمج ميزات العد المفيدة.
في مرحلة تطوير النموذج، يتم استخدام تقنيات NLP المتقدمة [23-25]، بما في ذلك تحليل المشاعر باستخدام القواميس وn-grams، بالإضافة إلى خوارزميات التعلم العميق. تسمح لنا هذه الطرق باستخراج معلومات ذات مغزى من بيانات النص وتحسين دقة توصيات الأدوية. أخيرًا، يتم تقييم استنتاجات التحليل بشكل نقدي وتحديد أي قيود أو نقاط ضعف في النهج لتحليل النص العاطفي. تضمن هذه الطريقة الشاملة أن يكون نظام توصية الأدوية لدينا قويًا وموثوقًا وقادرًا على تلبية الاحتياجات المتنوعة لمرضانا.

3.4. تحليل بيانات الاستكشاف

أولاً، تحتاج إلى استيراد بيانات التدريب وبيانات الاختبار وعرض أحجامها:
الجدول 1. وظيفة مجموعة البيانات الخام
معرف فريد اسم الدواء الحالة المراجعة التقييم التاريخ عدد المفيدين
0 206461 فالسارتان خلل في البطين الأيسر “ليس له آثار جانبية، أتناوله مع … 9 2012-05-20 27
1 95260 غوانفاسين ADHD “ابني في منتصف أسبوعه الرابع من … 8 2010-04-27 192
2 92703 ليبرل وسيلة منع الحمل “كنت أتناول وسيلة منع حمل فموية أخرى، … 5 2009-12-14 17
3 138000 أورثو إيفرا وسيلة منع الحمل “هذه هي المرة الأولى التي أستخدم فيها أي شكل من أشكال منع الحمل … 8 2015-11-03 10
4 35696 بويبرينورفين / نالوكسون اعتماد الأفيون “سبوكسيون غير حياتي تمامًا … 9 2016-11-27 37
هذه هي الشروحات الإضافية للمتغيرات:
  • اسم الدواء (فئوي): اسم الدواء
  • الحالة (فئوي): اسم الحالة
  • المراجعة (نص): مراجعة المريض
  • التقييم (رقمي): تقييم المريض من 10 نجوم
  • التاريخ (تاريخ): تاريخ إدخال المراجعة
  • عدد المفيدين (رقمي): عدد المستخدمين الذين وجدوا المراجعة مفيدة
    هيكل البيانات هو أن مريضًا يحمل معرفًا فريدًا يشتري دواءً يتناسب مع حالته ويكتب مراجعة وتقييمًا للدواء الذي اشتراه في التاريخ. بعد ذلك، إذا قرأ الآخرون تلك المراجعة ووجدوها مفيدة، فسوف ينقرون على عدد المفيدين، مما سيضيف 1 للمتغير.

3.5. تدريب نموذج مجموعة البيانات

في مرحلة فهم البيانات، يتم أولاً استكشاف المتغيرات بدءًا من المعرف الفريد (معرف فريد). قمنا بمقارنة عدد المعرفات الفريدة وطول بيانات التدريب لمعرفة ما إذا كانت هناك مراجعات متعددة كتبها نفس المريض، وأظهرت النتائج أن كل مريض يتوافق مع مراجعة واحدة فقط، ولم يكن هناك حالة لمراجعات متعددة كتبها نفس المريض. بعد ذلك، قمنا بتحليل العلاقة بين اسم الدواء والحالة، ووجدنا أن هناك ارتباطًا وثيقًا بين اسم الدواء والحالة. من بينها،
كانت القيم الفريدة لاسم الدواء والحالة 3671 و917، على التوالي، بمتوسط حوالي 4 أدوية لكل حالة. قمنا بمزيد من التصور لأعلى 20 من حيث عدد الأدوية لكل حالة.
نتائج التدريب هي كما يلي:
الشكل 1. نموذج نتيجة التدريب
من خلال تدريب النموذج، يمكننا رؤية بعض الاستنتاجات المهمة:
  1. بالنسبة لأولى ثماني حالات، عدد الأدوية
    المطابقة لكل حالة حوالي 100. وهذا يشير إلى أن هناك المزيد من خيارات الأدوية لهذه الحالات الشائعة.
  2. هناك بعض الاستثناءات في البيانات، على سبيل المثال، يحتوي حقل الحالة على ” span> وجد المستخدمون هذه التعليق مفيدًا.”, مما قد يكون خطأ أثناء الزحف. نحتاج إلى إزالة هذه البيانات غير الطبيعية أثناء المعالجة المسبقة.
  3. من خلال ملاحظة توزيع الأدوية لكل حالة، وُجد أن بعض الحالات تحتوي على دواء واحد فقط. بالنسبة لنظام الإحالة، فإن التوصية غير ممكنة في هذه الحالة، لذا سنحلل فقط الحالات التي تحتوي على ما لا يقل عن دواءين.
باختصار، من خلال تدريب النموذج، يمكننا إجراء تحليل متعمق للعلاقة بين الأدوية وحالات المرض، والعثور على البيانات غير الطبيعية ومعالجتها في نفس الوقت، مما يوفر مرجعًا مهمًا لإنشاء نظام التوصية.

3.6. توليد سحابة الكلمات النصية العاطفية

بعد ذلك، الخطوة التالية في تحليل النص هي إنشاء سحابة كلمات. في هذه الخطوة، سنعمل على مراجعة أدوية المريض، بما في ذلك إزالة علامات HTML، والتعامل مع محتوى الأقواس الذي يعبر عن المشاعر، وتصحيح بعض الكلمات والأحرف الخاطئة. ثم سنستخدم بيانات المراجعة المعالجة مسبقًا لإنشاء خريطة سحابة كلمات لعرض الكلمات التي تظهر بشكل متكرر في المراجعات لفهم أفضل لتقييمات وتجارب المرضى مع الأدوية.
الشكل 2. إنشاء مجموعة نصوص سحابية
استنادًا إلى سحابة الكلمات المولدة، يمكننا رؤية الكلمات التي تظهر بشكل متكرر في المراجعات، والتي قد تعكس المخاوف الرئيسية للمرضى بشأن الدواء، وتجربتهم، وتقييمهم لفعالية الدواء. قد تشمل الكلمات الشائعة أسماء الأدوية، ووصف الأعراض، وتأثيرات العلاج، وما إلى ذلك. بالإضافة إلى ذلك، يمكننا أيضًا ملاحظة بعض الكلمات العاطفية، مثل “جيد”، “سيء”، “راضٍ”، “غير راضٍ”، وما إلى ذلك، والتي قد تعكس ميول المرضى العاطفية تجاه الأدوية.
عند النظر إلى توزيع usefulCount، يمكننا أن نلاحظ أن الفارق بين القيم الدنيا والقصوى كبير، حيث يصل إلى 1291، كما أن الانحراف المعياري كبير أيضًا، حيث يصل إلى 36. وذلك لأن كلما زاد عدد الأدوية التي يبحث عنها الناس، بغض النظر عما إذا كانت التقييمات جيدة أو سيئة، زاد عدد الأشخاص الذين يقرؤون التقييمات، مما يجعل usefulCount مرتفعًا جدًا. لذلك، عند إنشاء النموذج، سنأخذ في الاعتبار إمكانية وصول الناس من خلال تطبيع الظروف من أجل تقييم مدى فائدة التعليقات بدقة أكبر.

3.7. النتائج التجريبية

استنادًا إلى النتائج التجريبية، يمكن رؤية أنه تم بناء نموذج بنجاح لتوصية الأدوية المناسبة للمرضى. في مرحلة استكشاف البيانات، نستخدم تقنيات التصوير وتقنيات إحصائية لفهم شكل البيانات، بينما نبحث عن n-grams التي تناسب بشكل أفضل.
تمثل المشاعر، والعلاقة بين التواريخ والتقييمات. في مرحلة معالجة البيانات، قمنا بمعالجة البيانات وفقًا للموضوع المحدد، مثل حذف حالة وجود دواء واحد فقط للتوصية. في عملية النمذجة، استخدمنا نموذج تعلم عميق مع n-gram، واستخدمنا أيضًا نموذج تعلم آلي يسمى Lightgbm للتغلب على قيود معالجة اللغة الطبيعية. بالإضافة إلى ذلك، نستخدم قواميس المشاعر لتحليل المشاعر للتغلب على قيود الحزم المكونة بناءً على بيانات الأفلام. بالإضافة إلى ذلك، نقوم بتطبيع usefulCount مع الشروط لتحسين الموثوقية. تتيح لنا هذه الخطوات حساب القيمة المتوقعة النهائية وتوصية الدواء المناسب لكل حالة بناءً على ترتيب تلك القيمة.
ومع ذلك، لدينا بعض القيود في المشروع:
  1. عند استخدام قاموس المشاعر لتحليل المشاعر، تكون الموثوقية منخفضة عندما يكون عدد الكلمات الإيجابية والسلبية صغيرًا. على سبيل المثال، إذا كانت الكلمة الإيجابية 0 والكلمة السلبية 1، يتم تصنيفها على أنها عاطفة سلبية. [32] لذلك، إذا كان هناك أقل من 5 كلمات عاطفية، يمكننا استبعاد هذه الملاحظات.
  2. من أجل ضمان موثوقية القيمة المتوقعة، قمنا بتطبيع usefulCount وضربه في القيمة المتوقعة. ومع ذلك، مع زيادة العدد التراكمي لزوار الموقع، قد يميل usefulCount نحو المراجعات القديمة. لذلك، عند تطبيع usefulCount، يجب أن نأخذ في الاعتبار أيضًا عامل الوقت.
  3. إذا كانت العاطفة إيجابية، يجب أن تزداد الموثوقية في الاتجاه الإيجابي، وإذا كانت سلبية، يجب أن تزداد في الاتجاه السلبي. ومع ذلك، نحن ببساطة نستخدم usefulCount للموثوقية دون أخذ ذلك في الاعتبار. لذلك، يجب أن نأخذ في الاعتبار رمز usefulCount وفقًا لأنواع العواطف المختلفة، ونقوم بإجراء المعالجة المضاعفة المقابلة.

4. الخاتمة

استنادًا إلى الاستكشاف الشامل والتحليل الذي تم إجراؤه في هذه الدراسة، يمكن استخلاص عدة استنتاجات رئيسية بشأن دمج معالجة اللغة الطبيعية (NLP) في الرعاية الصحية وتطوير خوارزميات تحليل المشاعر:
  1. أهمية معالجة اللغة الطبيعية في الرعاية الصحية: تلعب تقنية معالجة اللغة الطبيعية دورًا حيويًا في جوانب مختلفة من الرعاية الصحية، بدءًا من التعرف على الكلام من أجل النسخ الفعال إلى مطابقة التجارب السريرية وتحليل المشاعر لتحسين رضا المرضى.
  2. التحديات والفرص: بينما تقدم معالجة اللغة الطبيعية فرصًا هائلة لتحسين تقديم الرعاية الصحية، فإنها تواجه أيضًا تحديات مثل انخفاض موثوقية تحليل المشاعر مع محدودية الكلمات العاطفية. ومع ذلك، يمكن معالجة هذه التحديات من خلال المعالجة المسبقة الدقيقة وتقنيات تحسين النموذج.
  3. النهج المنهجي: تضمنت المنهجية المستخدمة في هذه الدراسة استكشاف البيانات، والمعالجة المسبقة، وتطوير النموذج، والتقييم. تم استخدام تقنيات متقدمة مثل تحليل المشاعر باستخدام القواميس و n-grams، بالإضافة إلى نماذج التعلم الآلي مثل LightGBM، للتغلب على القيود وتحسين الموثوقية.
  4. نظام التوصية: تظهر النتائج التجريبية التطوير الناجح لنظام توصية الأدوية المصمم وفقًا لحالات المرضى الفردية. من خلال معالجة البيانات، والنمذجة باستخدام تقنيات التعلم العميق والتعلم الآلي، وتحليل المشاعر، يوصي النظام بشكل فعال بالأدوية المناسبة استنادًا إلى مراجعات المرضى.
  5. القيود والاتجاهات المستقبلية: على الرغم من نجاح نظام التوصيات، هناك قيود تتعلق بموثوقية تحليل المشاعر وتطبيع عدد الاستخدامات المفيد. يجب أن تركز الأبحاث المستقبلية على تحسين مقاييس الموثوقية وأخذ الجانب الزمني في تطبيع البيانات بعين الاعتبار.
في الختام، يحمل دمج معالجة اللغة الطبيعية في الرعاية الصحية وعدًا هائلًا في تحويل عمليات الرعاية الصحية وتحسين نتائج المرضى. من خلال معالجة التحديات المنهجية واستغلال التقنيات المتقدمة، يمكن أن تعزز التطبيقات المدعومة بمعالجة اللغة الطبيعية مثل خوارزميات تحليل المشاعر بشكل كبير من رضا المرضى وكفاءة تقديم الرعاية الصحية.

شكر وتقدير

في بحثنا، استلهمنا من عمل سون وآخرين. وبشكل خاص من ورقتهم في مجلة الهندسة الصناعية والعلوم التطبيقية. [9] “دمج نماذج اللغة واسعة النطاق في التحكيم الذكي: قواعد التبرير وطرق التنفيذ”. من خلال الاطلاع على أبحاثهم، نكتسب فهمًا أعمق لكيفية دمج نماذج اللغة في الأحكام الذكية. نود أن نتقدم بالشكر الخاص لسون وآخرين وفريقهم، حيث قدم عملهم لنا رؤى قيمة وطرق تنفيذ. في الوقت نفسه، نود أن نشكر مؤلفي الورقة، الذين أدت جهودهم وأبحاثهم إلى تقديم أفكار وأساليب جديدة في مجال التحكيم الذكي. نشكرهم بصدق على مساهماتهم ونتطلع إلى مواصلة العمل معهم في المستقبل لتعزيز تطوير تكنولوجيا التحكيم الذكي.

References

[1] Duan, Shiheng, et al. “Prediction of Atmospheric Carbon Dioxide Radiative Transfer Model Based on Machine Learning”. Frontiers in Computing and Intelligent Systems, vol. 6, no. 3, Jan. 2024, pp. 132-6, https://doi.org/10.54097/ObMPjw5n.
[2] Chen, Jianfeng, et al. “Implementation of an AI-Based MRD Evaluation and Prediction Model for Multiple Myeloma”. Frontiers in Computing and Intelligent Systems, vol. 6, no. 3, Jan. 2024, pp. 127-31, https://doi.org/10.54097/zJ4MnbWW.
[3] “Implementation of Computer Vision Technology Based on Artificial Intelligence for Medical Image Analysis”. International Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 69-76, https://doi.org/10.62051/ijcsit.v1n1.10.
[4] Chen, Jianhang, et al. “One-stage object referring with gaze estimation.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.
[5] Zhou, Y., Osman, A., Willms, M., Kunz, A., Philipp, S., Blatt, J., & Eul, S. (2023). Semantic Wireframe Detection.
[6] Cai, Guoqing et al. “A deep learning-based algorithm for crop Disease identification positioning using computer vision.” International Journal of Computer Science and Information Technology (2023): n. pag.
[7] “Machine Learning Model Training and Practice: A Study on Constructing a Novel Drug Detection System”. International Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 139-46, https://doi.org/10.62051/ijcsit.v1n1.19.
[8] “Unveiling the Future Navigating Next-Generation AI Frontiers and Innovations in Application”. International
Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 147-56, https://doi.org/10.62051/ijcsit.v1n1.20.
[9] W. Sun, W. Wan, L. Pan, J. Xu, and Q. Zeng, “The Integration of Large-Scale Language Models Into Intelligent Adjudication: Justification Rules and Implementation Pathways”, Journal of Industrial Engineering & Applied Science, vol. 2, no. 1, pp. 13-20, Feb. 2024.
[10] Zhou, Yanlin, et al. “Utilizing AI-Enhanced Multi-Omics Integration for Predictive Modeling of Disease Susceptibility in Functional Phenotypes.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 45-51.
[11] Chen, J. (2022). The Reform of School Education and Teaching Under the “Double Reduction” Policy. Scientific and Social Research, 4(2), 42-45. (Feb 2022)
[12] Zhang, Y., Gono, R., & Jasiński, M. (2023). An Improvement in Dynamic Behavior of Single Phase PM Brushless DC Motor Using Deep Neural Network and Mixture of Experts. IEEE Access.
[13] Q. Cheng, M. Tian, L. Yang, J. Zheng, and D. Xin, “Enhancing High-Frequency Trading Strategies with Edge Computing and Deep Learning”, Journal of Industrial Engineering & Applied Science, vol. 2, no. 1, pp. 32-38, Feb. 2024.
[14] Liang, Penghao, et al. “Enhancing Security in DevOps by Integrating Artificial Intelligence and Machine Learning.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 31-37.
[15] Zhang, Y., Abdullah, S., Ullah, I., & Ghani, F. (2024). A new approach to neural network via double hierarchy linguistic information: Application in robot selection. Engineering Applications of Artificial Intelligence, 129, 107581.
[16] Ji, Huan, et al. “Utilizing Machine Learning for Precise Audience Targeting in Data Science and Targeted Advertising.” Academic Journal of Science and Technology 9.2 (2024): 215-220.
[17] Zhang, Chenwei, et al. “SegNet Network Architecture for Deep Learning Image Segmentation and Its Integrated Applications and Prospects.” Academic Journal of Science and Technology 9.2 (2024): 224-229.
[18] Wang, Yong, et al. “Autonomous Driving System Driven by Artificial Intelligence Perception Fusion.” Academic Journal of Science and Technology 9.2 (2024): 193-198.
[19] Qian, Wenpin, et al. “Clinical Medical Detection and Diagnosis Technology Based on the AlexNet Network Model.” Academic Journal of Science and Technology 9.2 (2024): 207-211.’
[20] Zhang, Y., & Zhang, H. (2023). Enhancing robot path planning through a twin-reinforced chimp optimization algorithm and evolutionary programming algorithm. IEEE Access.
[21] Zhang, Quan, et al. “Application of the AlphaFold2 Protein Prediction Algorithm Based on Artificial Intelligence.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 5865.
[22] Wang, H., Bao, Q., Shui, Z., Li, L., & Ji, H. (2024). A Novel Approach to Credit Card Security with Generative Adversarial Networks and Security Assessment.
[23] Wu, Jiang, et al. “Case Study of Next-Generation Artificial Intelligence in Medical Image Diagnosis Based on Cloud Computing.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 66-73
[24] Zhu, Mingwei, et al. “Enhancing Collaborative Machine Learning for Security and Privacy in Federated Learning.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 74-82.
[25] Yang, Le, et al. “Research and Application of Visual Object Recognition System Based on Deep Learning and Neural Morphological Computation.” International Journal of Computer Science and Information Technology 2.1 (2024): 1017.
[26] Qian, Jili, et al. “A Liver Cancer Question-Answering System Based on Next-Generation Intelligence and the Large Model Med-PaLM 2.” International Journal of Computer Science and Information Technology 2.1 (2024): 28-35.
[27] Bao, Qiaozhi, et al. “Exploring ICU Mortality Risk Prediction and Interpretability Analysis Using Machine Learning.” (2024).
[28] Xiao, J., Chen, Y., Ou, Y., Yu, H., & Xiao, Y. (2024). Baichuan2-Sum: Instruction Finetune Baichuan2-7B Model for Dialogue Summarization. arXiv preprint arXiv:2401.15496.
[29] Huo, Shuning, et al. “Deep Learning Approaches for Improving Question Answering Systems in Hepatocellular Carcinoma Research.” arXiv preprint arXiv:2402.16038 (2024).
[30] Yu, Hanyi, et al. “Machine Learning-Based Vehicle Intention Trajectory Recognition and Prediction for Autonomous Driving.” arXiv preprint arXiv:2402.16036 (2024).
[31] Xiang, Yafei, et al. “Text Understanding and Generation Using Transformer Models for Intelligent E-commerce Recommendations.” arXiv preprint arXiv:2402.16035 (2024).
[32] Zhu, Mengran, et al. “Utilizing GANs for Fraud Detection: Model Training with Synthetic Transaction Data.” arXiv preprint arXiv:2402.09830 (2024).
[33] Gong, Yulu, et al. “Enhancing Cybersecurity Resilience in Finance with Deep Learning for Advanced Threat Detection.” arXiv preprint arXiv:2402.09820 (2024).

Journal: Academic Journal of Science and Technology, Volume: 10, Issue: 1
DOI: https://doi.org/10.54097/v160aa61
Publication Date: 2024-03-26

Medication Recommendation System Based on Natural Language Processing for Patient Emotion Analysis

Haotian Zheng , Kangming , Huiming Zhou , Yufu Wang , Guangze Su Electrical & Computer Engineering, New York University, New York, NY, USA Computer Science and Engineering, Santa Clara University, CA, USA Computer Science, Northeastern University, CA, USA Computer Science & Engineering, Santa Clara University, Santa Clara, CA, USA Infomation Science, Trine University, Phoenix, AZ, USA*Corresponding author email: hz2687@nyu.edu

Abstract

Natural Language Processing (NLP) is an interdisciplinary field of computer science, artificial intelligence, and linguistics that focuses on the ability of computers to understand, process, generate, and simulate human language in order to achieve the ability to have natural conversations with humans. The underlying principles of natural language processing are at multiple levels, including linguistics, computer science, and statistics. It involves the study of language structure, semantics, grammar and pragmatics, as well as the statistical analysis and modeling of large-scale corpora. In the process of concrete implementation, it is necessary to process natural language at multiple levels. Based on this, this paper combined deep learning and natural language processing technology to conduct sentiment analysis on patients’ comments, so as to recommend drugs that are more suitable for patients, thus achieving accurate drug prescribing and personalized recommendation.

Keywords: Natural language processing (NLP); Artificial intelligence; Emotion analysis; Personalized recommendation; Comment analysis.

1. Introduction

The development of natural language processing dates back to the 1950s, when computer scientists began experimenting with computer programs to understand and generate natural language. Early research focused on rules and knowledge-based approaches, such as writing grammar rules and dictionaries for sentence analysis. In the 1980s, with the improvement of computing power and the emergence of a large corpus, statistical methods gradually dominated the field of natural language processing. During this period, many statistics-based machine translation, word segmentation, part-of-speech tagging and other methods appeared one after another. In the 21st century, especially in the last decade, the development of deep learning technology has greatly promoted the progress of natural language processing. Models based on deep neural networks, such as recurrent neural networks (RNN), Long and short term memory networks 1-3, and Transformer, have greatly improved the efficiency and accuracy of natural language processing.
Internationally, technology giants such as Google, Facebook, and OpenAI have also made a series of important breakthroughs in the field of natural language processing. For example, Google’s BERT model and OpenAI’s GPT family of models have both achieved above-human performance on multiple natural language processing tasks. In China, natural language processing research and industrial development have also achieved fruitful results. At present, there are many domestic natural language processing research institutions and enterprises, such as the Institute of Computing Science of the Chinese Academy of Sciences, Tsinghua University, Baidu, Tencent, etc. Among them, Baidu’s ERNIE, [46]Alibaba’s BERT and other pre-trained models perform well on various Chinese natural language processing tasks. At the
same time, many domestic companies have also applied natural language processing technology to intelligent customer service, search engines, recommendation systems and other scenarios.
Natural language processing (NLP) technology can process completely unstructured data, and one of the main purposes for companies to adopt NLP technology is to embed intelligent systems to optimize organizational processes, improve time efficiency, and reduce operational costs.
Regardless, there are other benefits to incorporating [7]NLP into healthcare application development. NLP can translate human language into a machine-readable form, allowing machines to derive meaning from the data provided. Healthcare is using NLP tools to control data that can be stored as voice, text, hieroglyphics, photos, and more to draw useful conclusions.
The study shows that natural language processing in healthcare is expected to increase from million in 2016 to million in 2021, representing a compound annual growth rate of .
Before we discuss the use of this disruptive technology in the healthcare industry, let’s understand what NLP actually means. [8]NLP is a field of artificial intelligence that aims to bridge the gap between humans and robots. With NLP capabilities, a powerful system can understand, store, process, and execute data-driven insights in human-understandable speech or text.
Natural language processing systems are becoming increasingly important and useful in healthcare application development. As a result, systems like building chatbots using NLP are also making waves in the healthcare industry. In an efficient execution state, technology can help clinicians streamline management operations by analyzing real-time data, allowing them to spend more time on patient care and improving the patient experience.

2.1. Natural language processing technology (NLP)

Natural language processing (NLP) is an interdisciplinary discipline that spans multiple fields such as computer science, artificial intelligence, and linguistics. It aims to enable computers to understand, generate and process human language, and realize natural language interaction between computers and humans. With the continuous development of natural language processing technology, it will be more and more widely used in artificial intelligence, machine learning and big data. For example, in the field of artificial intelligence, natural language processing technology can help machines better understand human language and improve the interaction and semantic understanding ability of machines.[9-11] In the field of machine learning, natural language processing technology can help machines better understand and process text data, and improve the effectiveness and accuracy of machine learning. In the field of big data, natural language processing technology can help enterprises and organizations better understand and analyze large amounts of text data, helping them better understand market trends, customer needs and social hot spots.
Although natural language processing technology brings many conveniences and applications, it also faces many challenges and problems. For example, how to solve the problems of polysemy, language habits and language difficulty, how to improve the accuracy and naturalness of translation, how to solve the emotional color of language and other problems. [12]These problems need us to continue to study and explore to improve the application level and effect of natural language processing technology. It can be seen that natural language processing technology is a science and technology topic with a wide range of applications, and I will continue to talk about the cutting-edge development and application of natural language processing technology.
In recent years, the application of natural language processing technology in the field of deep learning has received extensive attention and research. Deep learning technology uses neural network model to process text data, which can learn richer language features and automatically extract hidden features from text data. This has enabled deep learning techniques to achieve many breakthrough results in the field of natural language processing.
Among them, the most representative applications are language model modeling and natural language generation. Language modeling is one of the core tasks in the field of natural language processing, which is capable of modeling text sequences to predict the probability distribution of the next word. Techniques based on language models can be used in natural language generation, machine translation, speech recognition, text classification and other tasks. At the same time, natural language generation technology has also been widely concerned and applied, such as: automatic summary, [13-16]chatbot, text generation and so on.
In addition, deep learning techniques can also be used for tasks such as syntax analysis, semantic analysis, and named entity recognition. For example, named entity recognition can automatically extract entity information such as personal name, place name and organization name from text to provide help for information extraction and data mining. Semantic analysis can help machines better understand human language and improve their understanding ability and application effect.
In addition, with the continuous development and popularization of natural language processing technology, its application scenarios are becoming more and more diversified. For example, in the medical field, natural language processing technology can help doctors better process and understand medical record data, improving the efficiency and accuracy of diagnosis and treatment. In the financial field, natural language processing technology can help financial institutions to better manage risk and information disclosure. In the field of education, natural language processing technology can help educational institutions better conduct intelligent teaching and assessment[18].
In general, natural language processing technology is a very important and cutting-edge technological development, which continues to promote the progress and development of artificial intelligence and big data. With the continuous innovation and progress of technology, it is believed that natural language processing technology will be applied and developed in more fields, bringing more convenience and change to human beings.

2.2. Natural language emotion analysis

Sentiment analysis of text in natural language processing (NLP) is an important application area, and it is often used for evaluative user feedback, such as movie reviews and postshopping reviews. Emotion analysis is mainly based on the user’s answer text data (Chinese) to conduct quantitative analysis of text emotion. The existing sentiment analysis methods are as follows: 1. [19]Emotion dictionary analysis method. 2. Machine learning analysis method. It is to cut the words of the text, remove the stop words, extract the positive keywords and negative keywords in the keywords, and calculate the emotion score.
First, the text data is cut, here the Chinese word cutting tool jieba, there are many other word cutting tools, such as snowNLP, etc., have their own advantages, but the more accurate the word cutting the more accurate the results. The second is about the generation of dictionaries, which mainly includes three dictionaries, stop word dictionary, positive emotion dictionary, negative emotion dictionary, from the dictionary of HowNet. The stop word dictionary contains conjunctions like “so” and “how” and punctuation and so on, words that don’t have emotion, and when you remove these words, you’re left with words that have emotion. The more data the dictionary contains, the more accurate the sentiment predictions will be.
Usually combined with the use of machine learning methods, mainly using the word vector model word2vec, the word into an array, so that by calculating the data distance between words, to measure the similarity between words, so that after the model has supervised learning of positive and negative word vectors, you can get the result. The cyclic neural network LSTM[20] is used here, and the delay performance of LSTM helps the word vector learning. The deep learning framework of tensorflow is used here.
Principle of emotion analysis algorithm
The main principles of sentiment analysis algorithms include:
  1. Statistical learning method: Emotion analysis algorithm based on statistical learning method can identify emotion information in text by learning training data set. Such algorithms include naive Bayes, support vector machines, decision trees and so on.
  2. Deep learning method: Emotion analysis algorithm based on deep learning method learns emotion information in text through multi-layer neural network. Such algorithms include convolutional neural network, recurrent neural network, self-attention mechanism and so on.

2.3. NLP and Healthcare

  1. Speech recognition
For nearly two decades, NLP’s origins in healthcare have been tied to voice recognition, a technology that allows physicians to quickly transcribe prescriptions into electronic health records (EHR).
Front-end speech recognition allows doctors to dictate prescriptions without sitting in front of a point-of-care computer, while back-end recognition corrects problems before sending transcriptions to people for verification.
Without the need for medical transcriptionists and the high costs of paying them, speech recognition is one of the most cost-effective solutions.
2. Clinical documents
The impact of NLP on speech recognition is closely related to clinical documentation due to NLP’s speech-to-text dictation and structured data entry, which frees physicians from the burdensome and constrained structure of electronic health records to better care for patients.
Both Nuance and M*Modal have technology that works in tandem with speech recognition, which collects structured data and standardised terminology at the point of care for future use[21].
3. Computer Aided Coding (CAC)
The CAC collects data from procedures and treatment protocols in order to capture every possible code and optimize claims. CAC may improve the coding speed, but it does nothing to improve the accuracy of the coding.
For example, a Cleveland Clinic study showed that while CAC reduced coding time, it had poor recall and accuracy when used alone without the assistance of a qualified coder.
4. Clinical trial matching
Clinical trial matching is probably the most discussed case in the “in development” category. For example, two companies, Linguamatics Health and Clinithink, have created NLP engines to address trial matching, while two companies, IBM Watson Health and Inspirata, have invested significant resources in using NLP to aid oncology research.
In the near future, NLP appears to have the ability to make clinical trial matching a seamless and automated process.
5. Data mining research
Data mining in healthcare systems allows businesses to reduce the subjectivity of decisions while providing relevant medical knowledge. Once data mining begins, it can become a circular technique for knowledge discovery that helps all healthcare companies develop sound financial strategies to provide better patient care.
6. Ai chatbots and virtual scribes
While there is no such solution yet, there is a good chance that voice recognition applications will help humans modify clinical paperwork. Amazon’s Alexa or Google Assistant would be ideal for this.
Microsoft and Google have joined forces in this regard to achieve this specific goal. Currently, chatbots built using NLP can pick up a patient’s symptoms and direct them to the most appropriate treatment point.
7. Root cause analysis
Another interesting aspect of NLP is the ability of
predictive analytics to provide solutions to common health problems.
Large caches of digital medical records can help identify subsets of geographic areas, ethnic groups, or other diverse demographic groups that face different types of health disparities when applying NLP. The NLP system assesses unstructured responses to determine the root cause of a patient’s disease.
8. Review management and emotion analysis
NLP can also help healthcare organizations manage Internet reviews. Every day, it collects and analyzes hundreds of comments about healthcare from third-party lists, in addition to quickly assessing human emotions and the context in which those emotions are expressed[22].
Some systems can even listen to customers in comments, which can help doctors understand how consumers view their care, for example, and communicate more effectively in a language they all understand.
In conclusion, the integration of natural language processing (NLP) in healthcare brings forth a multitude of benefits across various domains. From speech recognition facilitating efficient transcription of prescriptions to clinical trial matching streamlining research processes, NLP proves to be a versatile tool for enhancing healthcare delivery. Additionally, NLP-powered applications such as chatbots and virtual scribes offer promising avenues for improving patient communication and administrative tasks. Furthermore, the ability of NLP to conduct root cause analysis and emotion analysis provides valuable insights for addressing health disparities and enhancing patient satisfaction. Overall, the utilization of NLP holds immense potential to revolutionize healthcare operations and improve patient outcomes.

3. Methodology

3.1. Emotion analysis algorithm

Emotion analysis algorithm specific operation steps:
  1. Data preprocessing: The input text is cleaned, the words to stop, the partof speech tagging, the word extraction and other processing to extract meaningful features.
  2. Feature extraction: The preprocessed text is converted into a vector representation for easy computer understanding and processing. This can be achieved by means of bag of words model, TF-IDF, Word2Vec and so on.
  3. Model training: According to the selected algorithm principle, model training is carried out on the training data set. This can be achieved through optimization methods such as gradient descent and random gradient descent.
  4. Model evaluation: Test data sets are evaluated to measure the performance and accuracy of the model. This can be assessed by metrics such as accuracy, recall rates, F1 scores, etc.
  5. Model optimization: According to the model evaluation results, the model is optimized to improve the accuracy and performance. This can be achieved through hyperparameter adjustment, feature selection, model fusion and so on.

3.2. Emotion analysis mathematical model formula

  1. Naive Bayes
Naive Bayes is a statistical learning method based on Bayes’ theorem, which assumes that features are independent of each other. For binary classification problems, naive Bayes can be expressed as:
Where is the probability of class y given the eigenvector is the probability of the eigenvector x given class is the probability of class , and is the probability of the eigenvector x .

2. Support vector machine

A support vector machine (SVM) is a solution to the binary classification problem that separates different classes of data by finding a hyperplane that maximizes the boundary margin. The formula of support vector machine is:
Where is the output function, yi is the label of the training data, is the kernel function, b is the bias term, and alpha_i is the Lagrange multiplier.

3.3. Experimental design

This experiment uses natural language processing (NLP) technology to improve drug recommendation systems tailored to individual patient conditions. The experimental
methods followed a structured methodology that included data exploration, data preprocessing, model development, conclusion and limitation assessment. In the data exploration phase, visualization and statistical techniques are used to gain insight into the characteristics of the data set. This process helps to pre-process the data and engineer the relevant features for the model. To address the limitations inherent in natural language processing, we introduce the LightGBM machine learning model. The model mitigated potential bias and improved reliability by integrating useful counting features.
In the model development phase, advanced [23-25]NLP techniques are employed, including sentiment analysis using dictionaries and n-grams, as well as deep learning algorithms. These methods allow us to extract meaningful information from text data and improve the accuracy of drug recommendations. Finally, the conclusions of the analysis are critically evaluated and any limitations or weaknesses in the approach to emotional text analysis are identified. This comprehensive approach ensures that our drug recommendation system is robust, reliable, and able to meet the diverse needs of our patients.

3.4. Exploration Data Analysis

First, you need to import training data and test data and display their sizes:
Table 1. Function of raw data set
uniqueID drugName condition review rating date usefulCount
0 206461 Valsartan Left Ventricular Dysfunction “It has no side effect, I take it in combinati… 9 2012-05-20 27
1 95260 Guanfacine ADHD “My son is halfway through his fourth week of … 8 2010-04-27 192
2 92703 Lybrel Birth Control “I used to take another oral contraceptive, wh… 5 2009-12-14 17
3 138000 Ortho Evra Birth Control “This is my first time using any form of birth… 8 2015-11-03 10
4 35696 Buprenorphine / naloxone Opiate Dependence “Suboxone has completely turned my life around… 9 2016-11-27 37
These are additional explanations for variables:
  • drugName (categorical): name of drug
  • condition (categorical): name of condition
  • review (text): patient review
  • rating (numerical): 10 star patient rating
  • date (date): date of review entry
  • usefulCount (numerical): number of users who found review useful
    The structure of the data is that a patient with a unique ID purchases a drug that meets his condition and writes a review and rating for the drug he/she purchased on the date. Afterwards, if the others read that review and find it helpful, they will click usefulCount, which will add 1 for the variable[28].

3.5. Data set model training

In the data understanding phase, variables are first explored starting with the uniqueID (uniqueID). We compared the number of unique ids and the length of the training data to see if multiple reviews were written by the same patient, and the results showed that each patient corresponded to only one review, and there was no case of multiple reviews written by the same patient. Next, we analyzed the relationship between DrugName and condition, and found that there was a close correlation between drug name and condition. Among them,
the unique values of drug name and condition were 3671 and 917, respectively, with an average of about 4 drugs for each condition. We further visualized the top 20 in terms of the number of drugs for each condition.
The training results are as follows:
Figure 1. Training result model
Through training the model, we can see some important conclusions:
  1. For the first eight conditions, the number of drugs
    corresponding to each condition is about 100 . This suggests that there are more drug options for these common conditions.
  2. There are some exceptions in the data, for example, the condition field contains ” span> users found this comment helpful.”, which may be an error during the crawl. We need to remove these abnormal data during preprocessing.
  3. By observing the distribution of drugs for each condition, it was found that some conditions had only one drug. For the referral system, recommendation is not feasible in this case, so we will only analyze conditions with at least two drugs.
In summary, through training the model, we can conduct an in-depth analysis of the relationship between drugs and disease conditions, and find and handle abnormal data at the same time, which provides an important reference for the establishment of the recommendation system.

3.6. Emotional text cloud word generation

Next, the next step in text analysis is to generate a word cloud. In this step, we will work on the patient’s drug review, including removing HTML tags, dealing with the content of brackets that express emotion, and fixing some wrong words and characters. We will then use this pre-processed review data to generate a word cloud map to visually show the words that occur more frequently in reviews to better understand patient evaluations and experiences of drugs.
Figure 2. Generating a cloud text set
Based on the generated word cloud, we can see the words that appear more frequently in the reviews, which may reflect the patients’ main concerns about the drug, their experience, and their evaluation of the drug’s effectiveness. Common words may include drug names, symptom descriptions, treatment effects, etc. In addition, we can also observe some emotional words, such as “good”, “bad”, “satisfied”, “dissatisfied”, etc., which may reflect the patients’ emotional tendencies towards drugs.
When looking at the distribution of usefulCount, we can notice that the difference between the minimum and maximum values is large, reaching 1291, and the standard deviation is also large, reaching 36 . This is because the more drugs people search for, regardless of whether the reviews are good or bad, the more people read the reviews, making the usefulCount very high. Therefore, when creating the model, we will take into account people’s accessibility by normalizing the conditions in order to more accurately assess how useful the comments are.

3.7. Experimental result

Based on the experimental results, it can be seen that a model was successfully built to recommend suitable drugs to patients. In the data exploration phase, we use visualization techniques and statistical techniques to understand the form of the data, while looking[29-31] for n-grams that best
represent emotions, and the relationship between dates and ratings. In the data preprocessing stage, we preprocessed the data according to the set topic, such as deleting the case of only one drug to recommend. In the modeling process, we used a deep learning model with n-gram, and also used a machine learning model called Lightgbm to overcome the limitations of natural language processing. In addition, we utilize sentiment dictionaries for sentiment analysis to overcome the limitations of packages formed based on movie data. In addition, we normalize usefulCount with conditions to improve reliability. These steps allow us to calculate the final predicted value and recommend the appropriate drug for each case based on the order of that value.
However, we have some limitations in the project:
  1. When using the sentiment dictionary for sentiment analysis, the reliability is low when the number of positive and negative words is small. For example, if the positive word is 0 and the negative word is 1 , it is classified as a negative emotion. [32]Therefore, if there are fewer than 5 emotional words, we can rule out these observations.
  2. In order to ensure the reliability of the predicted value, we normalized usefulCount and multiplied it by the predicted value. However, as the cumulative number of site visitors increases, usefulCount may tilt toward older reviews. Therefore, when normalizing usefulCount, we should also consider the time factor.
  3. If the emotion is positive, reliability should increase in the positive direction, if it is negative, it should increase in the negative direction. However, we simply use usefulCount for reliability without taking this into account. Therefore, we should consider the symbol of usefulCount according to different emotion types, and carry out the corresponding multiplication processing.

4. Conclusion

Based on the comprehensive exploration and analysis conducted in this study, several key conclusions can be drawn regarding the integration of natural language processing (NLP) in healthcare and the development of emotion analysis algorithms:
  1. Significance of NLP in Healthcare: NLP technology plays a crucial role in various aspects of healthcare, ranging from speech recognition for efficient transcription to clinical trial matching and emotion analysis for improving patient satisfaction.
  2. Challenges and Opportunities[33-34]: While NLP presents immense opportunities for enhancing healthcare delivery, it also faces challenges such as low reliability in sentiment analysis with limited emotional words. However, these challenges can be addressed through careful preprocessing and model optimization techniques.
  3. Methodological Approach: The methodology employed in this study involved data exploration, preprocessing, model development, and evaluation. Advanced techniques like sentiment analysis using dictionaries and n-grams, as well as machine learning models like LightGBM, were utilized to overcome limitations and improve reliability.
  4. Recommendation System: The experimental results demonstrate the successful development of a drug recommendation system tailored to individual patient conditions. Through data preprocessing, modeling with deep learning and machine learning techniques, and sentiment analysis, the system effectively recommends suitable drugs based on patient reviews.
  5. Limitations and Future Directions: Despite the success of the recommendation system, there are limitations related to sentiment analysis reliability and normalization of usefulCount. Future research should focus on improving reliability metrics and considering the temporal aspect in data normalization.
In conclusion, the integration of NLP in healthcare holds immense promise for revolutionizing healthcare operations and improving patient outcomes. By addressing methodological challenges and leveraging advanced techniques, NLP-powered applications like emotion analysis algorithms can significantly enhance patient satisfaction and healthcare delivery efficiency.

Acknowledgment

In our research, we were inspired by the work of Sun et al. In particular their paper in The Journal of Industrial Engineering and Applied Sciences. [9]”The Integration of Large-Scale Language Models Into Intelligent Adjudication: Justification Rules and Implementation Pathways”. By perusing their research, we gain a deeper understanding of how language models can be integrated into intelligent rulings. We would like to give special thanks to Sun et al and their team, as their work has provided us with valuable insights and implementation paths. At the same time, we would like to thank the authors of the paper, whose hard work and research results have brought new thinking and methods to the field of intelligent adjudication. We sincerely thank them for their contributions and look forward to continuing to work with them in the future to promote the development of intelligent adjudication technology.

References

[1] Duan, Shiheng, et al. “Prediction of Atmospheric Carbon Dioxide Radiative Transfer Model Based on Machine Learning”. Frontiers in Computing and Intelligent Systems, vol. 6, no. 3, Jan. 2024, pp. 132-6, https://doi.org/10.54097/ObMPjw5n.
[2] Chen, Jianfeng, et al. “Implementation of an AI-Based MRD Evaluation and Prediction Model for Multiple Myeloma”. Frontiers in Computing and Intelligent Systems, vol. 6, no. 3, Jan. 2024, pp. 127-31, https://doi.org/10.54097/zJ4MnbWW.
[3] “Implementation of Computer Vision Technology Based on Artificial Intelligence for Medical Image Analysis”. International Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 69-76, https://doi.org/10.62051/ijcsit.v1n1.10.
[4] Chen, Jianhang, et al. “One-stage object referring with gaze estimation.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.
[5] Zhou, Y., Osman, A., Willms, M., Kunz, A., Philipp, S., Blatt, J., & Eul, S. (2023). Semantic Wireframe Detection.
[6] Cai, Guoqing et al. “A deep learning-based algorithm for crop Disease identification positioning using computer vision.” International Journal of Computer Science and Information Technology (2023): n. pag.
[7] “Machine Learning Model Training and Practice: A Study on Constructing a Novel Drug Detection System”. International Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 139-46, https://doi.org/10.62051/ijcsit.v1n1.19.
[8] “Unveiling the Future Navigating Next-Generation AI Frontiers and Innovations in Application”. International
Journal of Computer Science and Information Technology, vol. 1, no. 1, Dec. 2023, pp. 147-56, https://doi.org/10.62051/ijcsit.v1n1.20.
[9] W. Sun, W. Wan, L. Pan, J. Xu, and Q. Zeng, “The Integration of Large-Scale Language Models Into Intelligent Adjudication: Justification Rules and Implementation Pathways”, Journal of Industrial Engineering & Applied Science, vol. 2, no. 1, pp. 13-20, Feb. 2024.
[10] Zhou, Yanlin, et al. “Utilizing AI-Enhanced Multi-Omics Integration for Predictive Modeling of Disease Susceptibility in Functional Phenotypes.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 45-51.
[11] Chen, J. (2022). The Reform of School Education and Teaching Under the “Double Reduction” Policy. Scientific and Social Research, 4(2), 42-45. (Feb 2022)
[12] Zhang, Y., Gono, R., & Jasiński, M. (2023). An Improvement in Dynamic Behavior of Single Phase PM Brushless DC Motor Using Deep Neural Network and Mixture of Experts. IEEE Access.
[13] Q. Cheng, M. Tian, L. Yang, J. Zheng, and D. Xin, “Enhancing High-Frequency Trading Strategies with Edge Computing and Deep Learning”, Journal of Industrial Engineering & Applied Science, vol. 2, no. 1, pp. 32-38, Feb. 2024.
[14] Liang, Penghao, et al. “Enhancing Security in DevOps by Integrating Artificial Intelligence and Machine Learning.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 31-37.
[15] Zhang, Y., Abdullah, S., Ullah, I., & Ghani, F. (2024). A new approach to neural network via double hierarchy linguistic information: Application in robot selection. Engineering Applications of Artificial Intelligence, 129, 107581.
[16] Ji, Huan, et al. “Utilizing Machine Learning for Precise Audience Targeting in Data Science and Targeted Advertising.” Academic Journal of Science and Technology 9.2 (2024): 215-220.
[17] Zhang, Chenwei, et al. “SegNet Network Architecture for Deep Learning Image Segmentation and Its Integrated Applications and Prospects.” Academic Journal of Science and Technology 9.2 (2024): 224-229.
[18] Wang, Yong, et al. “Autonomous Driving System Driven by Artificial Intelligence Perception Fusion.” Academic Journal of Science and Technology 9.2 (2024): 193-198.
[19] Qian, Wenpin, et al. “Clinical Medical Detection and Diagnosis Technology Based on the AlexNet Network Model.” Academic Journal of Science and Technology 9.2 (2024): 207-211.’
[20] Zhang, Y., & Zhang, H. (2023). Enhancing robot path planning through a twin-reinforced chimp optimization algorithm and evolutionary programming algorithm. IEEE Access.
[21] Zhang, Quan, et al. “Application of the AlphaFold2 Protein Prediction Algorithm Based on Artificial Intelligence.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 5865.
[22] Wang, H., Bao, Q., Shui, Z., Li, L., & Ji, H. (2024). A Novel Approach to Credit Card Security with Generative Adversarial Networks and Security Assessment.
[23] Wu, Jiang, et al. “Case Study of Next-Generation Artificial Intelligence in Medical Image Diagnosis Based on Cloud Computing.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 66-73
[24] Zhu, Mingwei, et al. “Enhancing Collaborative Machine Learning for Security and Privacy in Federated Learning.” Journal of Theory and Practice of Engineering Science 4.02 (2024): 74-82.
[25] Yang, Le, et al. “Research and Application of Visual Object Recognition System Based on Deep Learning and Neural Morphological Computation.” International Journal of Computer Science and Information Technology 2.1 (2024): 1017.
[26] Qian, Jili, et al. “A Liver Cancer Question-Answering System Based on Next-Generation Intelligence and the Large Model Med-PaLM 2.” International Journal of Computer Science and Information Technology 2.1 (2024): 28-35.
[27] Bao, Qiaozhi, et al. “Exploring ICU Mortality Risk Prediction and Interpretability Analysis Using Machine Learning.” (2024).
[28] Xiao, J., Chen, Y., Ou, Y., Yu, H., & Xiao, Y. (2024). Baichuan2-Sum: Instruction Finetune Baichuan2-7B Model for Dialogue Summarization. arXiv preprint arXiv:2401.15496.
[29] Huo, Shuning, et al. “Deep Learning Approaches for Improving Question Answering Systems in Hepatocellular Carcinoma Research.” arXiv preprint arXiv:2402.16038 (2024).
[30] Yu, Hanyi, et al. “Machine Learning-Based Vehicle Intention Trajectory Recognition and Prediction for Autonomous Driving.” arXiv preprint arXiv:2402.16036 (2024).
[31] Xiang, Yafei, et al. “Text Understanding and Generation Using Transformer Models for Intelligent E-commerce Recommendations.” arXiv preprint arXiv:2402.16035 (2024).
[32] Zhu, Mengran, et al. “Utilizing GANs for Fraud Detection: Model Training with Synthetic Transaction Data.” arXiv preprint arXiv:2402.09830 (2024).
[33] Gong, Yulu, et al. “Enhancing Cybersecurity Resilience in Finance with Deep Learning for Advanced Threat Detection.” arXiv preprint arXiv:2402.09820 (2024).