دراسة مقارنة لمؤشر سومبور وإصداراته المختلفة باستخدام نماذج الانحدار للهيدروكربونات العطرية متعددة الحلقات ذات الأولوية القصوى
Comparative study of Sombor index and its various versions using regression models for top priority polycyclic aromatic hydrocarbons

المجلة: Scientific Reports، المجلد: 14، العدد: 1
DOI: https://doi.org/10.1038/s41598-024-69442-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39191878
تاريخ النشر: 2024-08-27
المؤلف: B. Kirana وآخرون
الموضوع الرئيسي: نظرية الرسوم البيانية وتطبيقاتها

نظرة عامة

يتناول هذا القسم من ورقة البحث أهمية المؤشرات الطوبولوجية في فهم علاقات الهيكل-الخاصية للهيدروكربونات العطرية متعددة الحلقات (PAHs). على وجه التحديد، يقيم القدرات التنبؤية لمؤشرات مختلفة، بما في ذلك مؤشر سومبور (SO)، مؤشر سومبور البيضاوي (ESO)، مؤشر أويلر سومبور (EU)، مؤشر سومبور العكسي (RSO)، مؤشر سومبور البيضاوي العكسي (RESO)، ومؤشر أويلر سومبور العكسي (REU)، باستخدام نماذج الانحدار على مجموعة محددة من 38 PAHs. تشير النتائج إلى أن SO و RSO يظهران كأكثر المؤشرات التنبؤية فعالية، حيث يظهران ارتباطات قوية مع الخصائص الفيزيائية لـ PAHs.

يكشف التحليل أن SO هو أفضل مؤشر تنبؤي بين المؤشرات المعتمدة على الدرجة، بينما يتفوق RSO بين المؤشرات المعتمدة على الدرجة العكسية، وكلاهما يتميز بأقل خطأ جذر متوسط المربعات (RMSE). تتضمن الدراسة معادلات الانحدار لخصائص مختلفة، مثل الوزن الجزيئي (MW)، نقطة الانصهار (MP)، ونقطة الغليان (BP)، موضحة العلاقات بين هذه الخصائص والمؤشرات المعنية. يتم تمثيل النتائج بصريًا من خلال مخططات لنماذج الانحدار الخطي، التربيعي، والتكعيبي، مما يوفر فهمًا شاملاً للقدرات التنبؤية للمؤشرات. تعتبر هذه البحث مصدرًا قيمًا للدراسات المستقبلية حول PAHs وتطبيق المؤشرات الطوبولوجية التي تم فحصها.

مقدمة

يركز المقال على تحديد مؤشر طوبولوجي يعتمد على درجة الرأس يتعلق بالخصائص الفيزيائية والكيميائية لـ 38 هيدروكربون عطري متعدد الحلقات (PAHs) ذو أولوية. يفحص بشكل خاص عدة مؤشرات، بما في ذلك مؤشر سومبور، مؤشر سومبور البيضاوي، مؤشر أويلر سومبور، ونظائرها المعتمدة على الدرجة العكسية. لتقييم فعالية هذه المؤشرات، يقوم المؤلفون بإجراء تحليلات إحصائية باستخدام نماذج الانحدار، معتمدين على خطأ الجذر المتوسط (RMSE) كمقياس لتحديد دقة التنبؤات مقابل القيم الفعلية.

تسلط النتائج الضوء على اختيار المؤشر الذي يمتلك أقل RMSE، مما يشير إلى أقل خطأ في التنبؤات. بالإضافة إلى ذلك، يتضمن المقال مخططات تشتت للانحدار الخطي ويمتد التحليل إلى نماذج الانحدار التربيعي والتكعيبي، مما يسهل فهمًا شاملاً للتغيرات في البيانات. يبرز هذا النهج المنهجي أهمية المؤشرات الطوبولوجية المحددة فيما يتعلق بالخصائص الفيزيائية والكيميائية لـ PAHs المدروسة.

طرق

في هذا القسم، يصف المؤلفون منهجيتهم لنمذجة 38 هيدروكربون عطري متعدد الحلقات (PAHs) كرسوم جزيئية، يُشار إليها بـ \( G = (V, E) \)، حيث يمثل \( V \) مجموعة الرؤوس و \( E \) مجموعة الحواف. لكل رأس \( u \in V \)، يتم استخدام الدرجة \( d_u \) لحساب ستة مؤشرات طوبولوجية تعتمد على درجة الرأس، بما في ذلك مؤشر سومبور، مؤشر سومبور البيضاوي، ومؤشر أويلر سومبور. يتم الإشارة إلى تعريفات هذه المؤشرات في النص، مما يشير إلى نهج منظم لتحديد الخصائص الجزيئية.

بالإضافة إلى ذلك، يقدم المؤلفون مؤشرات تعتمد على الدرجة العكسية، وتحديدًا مؤشر سومبور العكسي ومؤشر سومبور البيضاوي العكسي، بينما يحاولون أيضًا تعريف مؤشر أويلر سومبور العكسي. يتميز هذا المؤشر الأخير بالصيغة حيث \( c_u = d_u + 1 \) لأي رأس \( u \in E(G) \)، مع دمج الحد الأقصى لدرجة الرأس للرسم البياني \( G \). تهدف هذه المنهجية الشاملة إلى تعزيز فهم الخصائص الهيكلية لـ PAHs من خلال نهج نظرية الرسوم البيانية.

نتائج

في قسم النتائج، يتم تفصيل تقييم نماذج الانحدار، مع التركيز على العلاقة بين المتغير التابع \( y \) والمتغيرات المستقلة \( x_i \) (حيث \( i = 1, 2, 3 \)). تتضمن معادلة الانحدار ثابتًا \( a \) ومعاملات \( b_i \)، التي تحدد تأثير كل متغير مستقل على المتغير التابع. يتم استخدام مقاييس إحصائية رئيسية لتقييم أداء النموذج، بما في ذلك معامل الارتباط \( r \)، الخطأ المعياري للتقديرات (SE)، وإحصائية فيشر (F).

يتم تسليط الضوء على خطأ الجذر المتوسط (RMSE) كمقياس حاسم لتقييم دقة نماذج الانحدار. يقيس الانحراف بين القيم الفعلية \( y_i \) والقيم المتوقعة \( \hat{y}_i \) عبر \( n \) نقطة بيانات، مما يوفر رؤى حول قدرة النموذج التنبؤية. يبرز هذا الإطار التقييمي الشامل أهمية هذه المقاييس الإحصائية في فهم وتحسين نماذج الانحدار.

مناقشة

في هذه الدراسة، قام المؤلفون بالتحقيق في القدرات التنبؤية لمؤشرات طوبولوجية مختلفة (TIs) لـ 38 هيدروكربون عطري متعدد الحلقات (PAHs) من خلال تحليل ثمانية خصائص فيزيائية وكيميائية: الوزن الجزيئي (MW)، نقطة الانصهار (MP)، نقطة الغليان (BP)، الانكسارية المولية (MR)، القابلية للاستقطاب (PO)، الحجم المولي (MV)، نقطة الوميض (FP)، والتعقيد (C). أشارت النتائج إلى أن مؤشر سومبور (SO) أظهر ارتباطًا قويًا مع سبع من الخصائص الثمانية التي تم تحليلها، بينما ارتبط مؤشر سومبور البيضاوي (ESO) بشكل كبير فقط مع نقطة الانصهار. على العكس، أظهر مؤشر سومبور العكسي (RSO) أيضًا ارتباطًا عاليًا مع سبع خصائص، وارتبط مؤشر سومبور البيضاوي العكسي (RESO) بشكل أساسي مع الحجم المولي.

استخدمت الدراسة نماذج الانحدار الخطي لاشتقاق معادلات تنبؤية للخصائص الفيزيائية والكيميائية بناءً على TIs. كشفت النتائج أن مؤشر سومبور (SO) قدم أفضل أداء تنبؤي بين المؤشرات المعتمدة على الدرجة، كما يتضح من أقل خطأ جذر متوسط المربعات (RMSE). وبالمثل، تم تحديد مؤشر سومبور العكسي (RSO) كأكثر المؤشرات التنبؤية فعالية بين المؤشرات المعتمدة على الدرجة العكسية. قدم المؤلفون معادلات الانحدار لكل خاصية، موضحين العلاقة بين المؤشرات والخصائص الفيزيائية والكيميائية، مما يوفر رؤى قيمة للبحوث المستقبلية حول PAHs وتطبيق هذه المؤشرات.

Journal: Scientific Reports, Volume: 14, Issue: 1
DOI: https://doi.org/10.1038/s41598-024-69442-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39191878
Publication Date: 2024-08-27
Author(s): B. Kirana et al.
Primary Topic: Graph theory and applications

Overview

This section of the research paper discusses the significance of topological indices in understanding the structure-property relationships of polycyclic aromatic hydrocarbons (PAHs). Specifically, it evaluates the predictive capabilities of various indices, including the Sombor index (SO), elliptic Sombor index (ESO), Euler Sombor index (EU), reverse Sombor index (RSO), reverse elliptic Sombor index (RESO), and reverse Euler Sombor index (REU), using regression models on a prioritized set of 38 PAHs. The findings indicate that SO and RSO emerge as the most effective predictive indices, demonstrating strong correlations with the physical properties of PAHs.

The analysis reveals that SO is the best predictive index among the degree-based indices, while RSO excels among the reverse degree-based indices, both characterized by minimal root mean square error (RMSE). The study includes regression equations for various properties, such as molecular weight (MW), melting point (MP), and boiling point (BP), illustrating the relationships between these properties and the respective indices. The results are visually represented through plots for linear, quadratic, and cubic regression models, providing a comprehensive understanding of the predictive capabilities of the indices. This research serves as a valuable resource for future studies on PAHs and the application of the examined topological indices.

Introduction

The article focuses on identifying a vertex degree-based topological index related to the physicochemical properties of 38 priority polycyclic aromatic hydrocarbons (PAHs). It specifically examines several indices, including the Sombor index, elliptic Sombor index, Euler Sombor index, and their reverse degree-based counterparts. To evaluate the effectiveness of these indices, the authors conduct statistical analyses using regression models, employing the Root Mean Square Error (RMSE) as a measure to quantify the accuracy of predictions against actual values.

The findings highlight the selection of the index with the minimal RMSE, indicating the least error in predictions. Additionally, the article includes scatter diagrams for linear regression and extends the analysis to quadratic and cubic regression models, facilitating a comprehensive understanding of the variations in the data. This methodological approach underscores the significance of the identified topological indices in relation to the physicochemical characteristics of the studied PAHs.

Methods

In this section, the authors describe their methodology for modeling 38 priority polycyclic aromatic hydrocarbons (PAHs) as molecular graphs, denoted as \( G = (V, E) \), where \( V \) represents the vertex set and \( E \) the edge set. For each vertex \( u \in V \), the degree \( d_u \) is utilized to compute six vertex degree-based topological indices, including the Sombor index, elliptic Sombor index, and Euler Sombor index. The definitions of these indices are referenced in the text, indicating a structured approach to quantifying molecular properties.

Additionally, the authors introduce reverse degree-based indices, specifically the reverse Sombor index and reverse elliptic Sombor index, while also attempting to define a reverse Euler Sombor index. This latter index is characterized by the formula where \( c_u = d_u + 1 \) for any vertex \( u \in E(G) \), incorporating the maximum vertex degree of the graph \( G \). This comprehensive methodology aims to enhance the understanding of the structural properties of PAHs through graph-theoretical approaches.

Results

In the results section, the evaluation of regression models is detailed, focusing on the relationship between the dependent variable \( y \) and independent variables \( x_i \) (where \( i = 1, 2, 3 \)). The regression equation incorporates a constant \( a \) and coefficients \( b_i \), which quantify the influence of each independent variable on the dependent variable. Key statistical metrics are employed to assess model performance, including the correlation coefficient \( r \), standard error of estimates (SE), and Fisher’s statistic (F).

The Root Mean Square Error (RMSE) is highlighted as a critical measure for evaluating the accuracy of the regression models. It quantifies the deviation between actual values \( y_i \) and predicted values \( \hat{y}_i \) across \( n \) data points, providing insight into the model’s predictive capability. This comprehensive evaluation framework underscores the importance of these statistical measures in understanding and refining regression models.

Discussion

In this study, the authors investigated the predictive capabilities of various topological indices (TIs) for 38 polycyclic aromatic hydrocarbons (PAHs) by analyzing eight physicochemical properties: molecular weight (MW), melting point (MP), boiling point (BP), molar refractivity (MR), polarizability (PO), molar volume (MV), flash point (FP), and complexity (C). The results indicated that the Sombor index (SO) exhibited a strong correlation with seven out of the eight properties analyzed, while the elliptic Sombor (ESO) index correlated significantly only with the melting point. Conversely, the reverse Sombor index (RSO) also showed high correlation with seven properties, and the reverse elliptic Sombor (RESO) index correlated primarily with molar volume.

The study employed linear regression models to derive predictive equations for the physicochemical properties based on the TIs. The findings revealed that the Sombor index (SO) provided the best predictive performance among the degree-based indices, as evidenced by the minimal root mean square error (RMSE). Similarly, the reverse Sombor index (RSO) was identified as the most effective predictive index among the reverse degree-based indices. The authors presented the regression equations for each property, demonstrating the relationship between the indices and the physicochemical properties, thereby offering valuable insights for future research on PAHs and the application of these indices.