DOI: https://doi.org/10.1007/s11042-026-21198-6
تاريخ النشر: 2026-02-01
المؤلف: Sok‐Ian Sou وآخرون
الموضوع الرئيسي: التفاعلات اللمسية والحسية
نظرة عامة
تقدم ورقة البحث ViTrack، وهو نظام ملاحة مبتكر مصمم لمساعدة الأفراد ذوي الإعاقة البصرية في البيئات الداخلية من خلال دمج تقنيات الملاحة المعتمدة على الرؤية وتقنيات تحديد المواقع اللاسلكية. تواجه طرق الملاحة التقليدية تحديات مثل الرؤية المحجوبة وتداخل الإشارات، وهو ما تعالجه ViTrack من خلال استخدام كاميرات المراقبة الموجودة وكاشفات لاسلكية منخفضة التكلفة. يعزز هذا النهج دعم الملاحة مع إعطاء الأولوية لراحة المستخدم وخصوصيته، مما يلغي الحاجة إلى أجهزة إضافية. يستخدم النظام الشبكات العصبية طويلة وقصيرة المدى (LSTM) لتحديد المواقع بدقة وتتبعها، مما يظهر أداءً متفوقًا مقارنةً بالهياكل الأخرى. تلعب زيادة البيانات دورًا حيويًا في تحسين موثوقية النظام، مما يقلل من آثار فشل الأجهزة.
في الختام، تمثل ViTrack حلاً مستدامًا ومركزًا على المستخدم يستفيد من البنية التحتية الحالية لتوفير إرشادات في الوقت الفعلي، مما يعزز السلامة والعملية في الملاحة للمستخدمين ذوي الإعاقة البصرية. يسهل تصميم النظام التعرف التلقائي على المستخدم وتجنب العقبات الديناميكية، مما يعالج قيود المساعدات التقليدية. ستركز الأعمال المستقبلية على تقييم الأداء في البيئات المزدحمة، ودمج مناطق المراقبة المتعددة، وتعزيز الوظائف من خلال توقع الحركة وخيارات تركيب الهواتف الذكية. تهدف الدراسة إلى التحقق من قابلية استخدام ViTrack في السيناريوهات الواقعية، مع التأكيد على إمكانية الحلول الفعالة من حيث الموارد لتحسين الملاحة اليومية بشكل كبير للأفراد ذوي الإعاقة البصرية.
مقدمة
تسلط مقدمة الورقة الضوء على القضية الحرجة للإعاقة البصرية، التي تؤثر على حوالي 2.2 مليار شخص على مستوى العالم، مع وجود مليار حالة يمكن تجنبها أو تتطلب مزيدًا من الاهتمام، كما أفادت منظمة الصحة العالمية (WHO). يؤكد المؤلفون على ضرورة وجود حلول تكنولوجية مبتكرة لتحسين جودة الحياة للأفراد ذوي الإعاقة البصرية. يشيرون إلى أنه بينما أظهرت الأرصفة اللمسية أنها تحسن الملاحة لهذه الفئة، فإن فعاليتها غالبًا ما تعيقها العوائق الثابتة مثل المركبات المتوقفة والأثاث الشارعي، التي تشكل حواجز كبيرة أمام الحركة والسلامة.
لمعالجة هذه التحديات، يقترح المؤلفون ViTrack، وهو منصة ملاحة تعتمد على الرؤية تستخدم شبكات كاميرات المراقبة الموجودة وتحديد المواقع اللاسلكية (BLE/Wi-Fi) لإرشاد المستخدمين ذوي الإعاقة البصرية. تعالج ViTrack بيانات الفيديو والإشارات في الوقت الفعلي عبر الهواتف الذكية، مما يوفر إرشادات صوتية دون الحاجة إلى أجهزة إضافية. يهدف هذا النظام إلى التغلب على قيود مساعدات الملاحة التقليدية من خلال تقديم مجال رؤية أوسع لكشف العقبات وضمان خصوصية المستخدم. توضح المقدمة المساهمات الرئيسية للدراسة، بما في ذلك تطوير خوارزميات لتحديد هوية المستخدم، واكتشاف الانحرافات، وتجنب العقبات، مما يمهد الطريق لاستكشاف شامل لهندسة ViTrack وتطبيقاتها في الأقسام التالية.
الطرق
في هذا القسم، يصف المؤلفون الإعداد التجريبي لتقييم نظام إرشاد يعتمد على الرؤية باستخدام تقنية Bluetooth Low Energy (BLE). تم إجراء التجربة في حرم جامعة تشنغ كونغ الوطنية (NCKU) في تايوان، حيث يدخل مستخدم يحمل هاتفًا ذكيًا مرسلًا منطقة مراقبة محددة (OZ)، مما يؤدي إلى تنشيط اكتشاف BLE ومطابقة المستخدم. يتضمن الإعداد كاميرا قادرة على التقاط طول 16 مترًا من الرصيف اللمسي في صورة واحدة، مع وجود أربعة كاشفات لاسلكية موضوعة بشكل استراتيجي في مجال الاختبار. يتم تقسيم الرصيف اللمسي إلى ثمانية أقسام فرعية، كل منها بطول 2 متر، مع نقاط مرجعية لإدارة الموقع بدقة.
لتقييم فعالية النظام، تم تصميم مسارين اختباريين – “العودة إلى الكاميرا” و”مواجهة الكاميرا” – حيث تم عبور كل مسار خمس مرات بواسطة مستخدم يحمل علامتين تجاريتين مختلفتين من الهواتف الذكية المدعومة بتقنية BLE. أسفر ذلك عن جمع عشرة مجموعات من بيانات الاختبار. يبدأ النظام بث الفيديو عند تحديد طلب إرشاد، مما يوفر إرشادات اتجاهية في الوقت الفعلي أثناء اكتشاف الانحرافات والتنقل عبر العقبات. بالإضافة إلى ذلك، تم تنفيذ مسارين اختباريين إضافيين، “الانحراف” و”تجنب العقبات”، لتقييم أداء نظام الإرشاد المعتمد على الرؤية في سيناريوهات مختلفة. يتم تلخيص معلمات النظام التفصيلية، بما في ذلك عدد كاشفات BLE، ونقاط المرجعية، ومواصفات الكاميرا، في الجدول 3.
النتائج
تظهر نتائج تقدير اتجاه جسم المستخدم (HBOE) في نظام ViTrack دوره الحاسم في تسهيل الملاحة الفعالة من خلال اكتشاف الانحرافات وتجنب العقبات. تم تقييم دقة نموذج HBOE من خلال قياس الفروق الزاوية المطلقة لمشاركين، A وB، أثناء تنقلهما عبر مسار محدد بسرعات مختلفة مصنفة على أنها “سريعة” (0.8 م/ث إلى 1 م/ث) و”بطيئة” (0.4 م/ث إلى 0.6 م/ث). تم التقاط بيانات الحقيقة الأرضية باستخدام كاميرا متوافقة مع اتجاه الرصيف اللمسي.
تظهر النتائج، الموضحة في الأشكال المرفقة، أن المشارك A حافظ على فرق زاوي وسطي يبلغ حوالي 5 درجات بغض النظر عن سرعة المشي. في المقابل، أظهر المشارك B فروق زوايا متوسطة تبلغ 10 درجات أثناء المشي السريع و5 درجات أثناء المشي البطيء. تؤكد هذه النتائج قدرة ViTrack على تقدير اتجاه الجسم بدقة عبر سرعات المشي المختلفة، مما يضمن خدمات ملاحة موثوقة للمستخدمين.
المناقشة
تقدم قسم المناقشة في ورقة البحث نظرة شاملة على نظام المراقبة بالفيديو ViTrack الذي تم تنفيذه في حرم NCKU في تايوان، مع التركيز على دوره في تعزيز السلامة والملاحة في الحرم الجامعي للأفراد ذوي الإعاقة البصرية. يتكون النظام من أكثر من 500 كاميرا مراقبة و69 خادم تسجيل فيديو شبكي، مما يوفر تدفقات فيديو عالية الدقة تتكامل مع واجهة ويب (MapTalk) وجهاز اكتشاف كائنات في الوقت الفعلي (YOLOv7). يسمح هذا الإعداد للمستخدمين بالتفاعل مع شبكة الكاميرات بكفاءة، مما يسهل المراقبة في الوقت الفعلي ومساعدة الملاحة. يستفيد نظام ViTrack من البنية التحتية الحالية للكاميرات، مستخدمًا تقنيات متقدمة مثل إعادة تحديد هوية الأشخاص ومعالجة الإشارات اللاسلكية لتتبع المستخدمين وإرشادهم بأمان عبر بيئات الحرم الجامعي.
تتناول الورقة أيضًا تفاصيل هيكل النظام، الذي يتضمن خوارزمية مطابقة المستخدم التي تجمع البيانات من كاشفات لاسلكية ولقطات الكاميرا لتحديد هوية المستخدمين ذوي الإعاقة البصرية بدقة. تعزز دمج نماذج التعلم العميق، مثل DNN و1D-CNN وLSTM، دقة تحديد المواقع من خلال معالجة قيم مؤشر قوة الإشارة المستلمة (RSSI) والبيانات المرئية. يركز إطار الإرشاد داخل ViTrack على تقدير اتجاه الجسم واكتشاف الانحرافات، مما يضمن بقاء المستخدمين على المسارات اللمسية المحددة مع تجنب العقبات. يسمح التصميم المعياري للنظام بإجراء تعديلات في الوقت الفعلي وتقديم ملاحظات صوتية، مما يحسن بشكل كبير الملاحة للأفراد ذوي الإعاقة البصرية في البيئات المعقدة. بشكل عام، يمثل نظام ViTrack نهجًا قويًا لتعزيز السلامة والوصول في الحرم الجامعي، مما يوضح إمكانية دمج تكنولوجيا المراقبة مع حلول الملاحة المساعدة.
DOI: https://doi.org/10.1007/s11042-026-21198-6
Publication Date: 2026-02-01
Author(s): Sok‐Ian Sou et al.
Primary Topic: Tactile and Sensory Interactions
Overview
The research paper presents ViTrack, an innovative navigation system designed to assist visually impaired individuals in indoor environments by integrating vision-based and wireless positioning technologies. Traditional navigation methods face challenges such as obstructed views and signal interference, which ViTrack addresses by utilizing existing surveillance cameras and low-cost wireless sniffers. This approach enhances navigation support while prioritizing user comfort and privacy, eliminating the need for additional devices. The system employs Long Short-Term Memory (LSTM) neural networks for accurate localization and tracking, demonstrating superior performance compared to other architectures. Data augmentation plays a crucial role in improving system reliability, mitigating the effects of device failures.
In conclusion, ViTrack represents a sustainable, user-centered solution that leverages existing infrastructure to provide real-time guidance, enhancing the safety and practicality of navigation for visually impaired users. The system’s design facilitates automatic user identification and dynamic obstacle avoidance, addressing the limitations of traditional aids. Future work will focus on evaluating performance in crowded environments, integrating multiple observation zones, and enhancing functionality through movement prediction and smartphone mounting options. The research aims to validate ViTrack’s usability in real-world scenarios, emphasizing the potential of resource-efficient solutions to significantly improve daily navigation for visually impaired individuals.
Introduction
The introduction of the paper highlights the critical issue of vision impairment, affecting approximately 2.2 billion people globally, with 1 billion cases being preventable or requiring further attention, as reported by the World Health Organization (WHO). The authors emphasize the necessity for innovative technological solutions to enhance the quality of life for visually impaired individuals. They note that while tactile paving has been shown to improve navigation for this population, its effectiveness is often hindered by static obstructions such as parked vehicles and street furniture, which pose significant barriers to mobility and safety.
To address these challenges, the authors propose ViTrack, a vision-based navigation platform that utilizes existing surveillance camera networks and wireless signal localization (BLE/Wi-Fi) to guide visually impaired users. ViTrack processes real-time video and signal data via smartphones, providing audio navigation without the need for additional devices. This system aims to overcome the limitations of traditional navigation aids by offering a broader field of view for obstacle detection and ensuring user privacy. The introduction outlines the main contributions of the study, including the development of algorithms for user identification, deviation detection, and obstacle avoidance, setting the stage for a comprehensive exploration of the ViTrack architecture and its applications in subsequent sections.
Methods
In this section, the authors describe the experimental setup for evaluating a visual-based guidance system utilizing Bluetooth Low Energy (BLE) technology. The experiment was conducted on the campus of National Cheng Kung University (NCKU) in Taiwan, where a user carrying a transmitting smartphone enters a designated observation zone (OZ), triggering BLE detection and user matching. The setup includes a camera capable of capturing a 16-meter length of tactile paving in a single image, with four wireless sniffers placed strategically in the test field. The tactile paving is divided into eight subsections, each 2 meters long, with reference points for precise location management.
To assess the system’s effectiveness, two testing routes—”Back to the camera” and “Facing the camera”—were designed, with each route traversed five times by a user carrying two different brands of BLE-enabled smartphones. This resulted in the collection of ten sets of test data. The system initiates video streaming upon identifying a Guiding Request, providing real-time directional guidance while detecting deviations and navigating obstacles. Additionally, two further testing routes, “Deviation” and “Obstacle avoidance,” were implemented to evaluate the visual-based guidance system’s performance in various scenarios. Detailed system parameters, including the number of BLE sniffers, reference points, and camera specifications, are summarized in Table 3.
Results
The results of the user body orientation estimation (HBOE) in the ViTrack system demonstrate its critical role in facilitating effective navigation through deviation detection and obstacle avoidance. The accuracy of the HBOE model was evaluated by measuring the absolute angle differences for two participants, A and B, as they navigated a designated route at varying speeds categorized as “fast” (0.8 m/s to 1 m/s) and “slow” (0.4 m/s to 0.6 m/s). Ground truth data was captured using a camera aligned with the tactile paving direction.
The findings, illustrated in the accompanying figures, reveal that participant A maintained a median angle difference of approximately 5 degrees regardless of walking speed. In contrast, participant B exhibited median angle differences of 10 degrees during fast walking and 5 degrees during slow walking. These results underscore ViTrack’s capability to accurately estimate body orientation across different walking speeds, thereby ensuring reliable navigation services for users.
Discussion
The discussion section of the research paper presents a comprehensive overview of the ViTrack video surveillance system implemented at NCKU campus in Taiwan, emphasizing its role in enhancing campus safety and navigation for visually impaired individuals. The system comprises over 500 surveillance cameras and 69 network video recorder servers, providing high-resolution video feeds that integrate with a web interface (MapTalk) and a real-time object detection device (YOLOv7). This setup allows users to interact with the camera network efficiently, facilitating real-time monitoring and navigation assistance. The ViTrack system leverages existing camera infrastructure, employing advanced techniques such as person re-identification and wireless signal processing to track users and guide them safely through campus environments.
The paper also details the system’s architecture, which includes a user matching algorithm that combines data from wireless sniffers and camera footage to identify visually impaired users accurately. The integration of deep learning models, such as DNN, 1D-CNN, and LSTM, enhances the localization accuracy by processing received signal strength indicator (RSSI) values and visual data. The guiding framework within ViTrack focuses on body orientation estimation and deviation detection, ensuring users remain on designated tactile pathways while avoiding obstacles. The system’s modular design allows for real-time adjustments and audio feedback, significantly improving navigation for visually impaired individuals in complex environments. Overall, the ViTrack system exemplifies a robust approach to campus safety and accessibility, demonstrating the potential of integrating surveillance technology with assistive navigation solutions.
