DOI: https://doi.org/10.11141/ia.72.5
تاريخ النشر: 2026-01-01
المؤلف: Jonas Abele وآخرون
الموضوع الرئيسي: المكتبات وخدمات المعلومات
نظرة عامة
تتناول الورقة استراتيجيات تخزين البيانات على المدى الطويل للوثائق الأثرية الأولية في المكتب الإقليمي لحماية المعالم في بادن-فورتمبيرغ (LAD-BW). تم تأسيس المستودع المركزي في عام 2016 لإدارة الحجم المتزايد من الوثائق الرقمية الناتجة عن زيادة أنشطة البناء والحفريات الإنقاذية. منذ عام 2018، التزم المستودع بالإرشادات التي توحد هياكل البيانات، والصيغ، والبيانات الوصفية، مما أدى إلى تحسين كبير في إمكانية العثور على أكثر من 6400 حزمة بيانات (70 تيرابايت اعتبارًا من يوليو 2025) والحفاظ عليها. ومع ذلك، لا تزال التحديات قائمة، خاصة مع هياكل البيانات غير المتجانسة وإدارة بيانات الهيكل من الحركة (SfM)، التي أصبحت شائعة في الحفريات واسعة النطاق.
تسلط النتائج الضوء على أنه على الرغم من أن الإرشادات قد حسنت من ممارسات الحفاظ على البيانات، إلا أن الامتثال لا يزال صعبًا بسبب حجم المشاريع وتنوع صيغ البيانات. يهدف مشروع البيانات التراثية إلى معالجة هذه القضايا بشكل منهجي من خلال تنفيذ عمليات موحدة لاختيار البيانات، والنظافة، والهجرة. تشمل الاتجاهات المستقبلية مراجعة إرشادات الحفر وتطوير أنظمة جديدة، مثل قاعدة بيانات جغرافية، لتعزيز إنشاء بيانات متوافقة مع الإرشادات. من المتوقع أن تعزز الجهود المستمرة مبادئ FAIR (قابلة للاكتشاف، وقابلة للوصول، وقابلة للتشغيل المتبادل، وقابلة لإعادة الاستخدام)، مما يضمن أن الوثائق الأثرية أكثر سهولة في الوصول إليها واستخدامها لأغراض البحث المستقبلية. بالإضافة إلى ذلك، يهدف إنشاء سلسلة نشر مفتوحة الوصول إلى نشر نتائج الحفريات والبيانات البحثية المرتبطة بها على الفور.
نقاش
يوفر قسم النقاش في ورقة البحث نظرة شاملة على عمليات إدارة البيانات المرتبطة بالمشاريع الأثرية، مع التركيز بشكل خاص على إنشاء وتنظيم حزم البيانات الموحدة. هذه الحزم ضرورية لأرشفة بيانات الوثائق الأولية التي تم إنشاؤها أثناء العمل الميداني، مثل الحفريات وإشراف البناء. يتم هيكلة سير عمل إدارة البيانات وفقًا للإرشادات المعمول بها، التي تحدد تنظيم البيانات الجغرافية والنصية ضمن مجلدات محددة في حزمة معلومات التقديم (SIP). من الجدير بالذكر أن الإرشادات قد تطورت لمعالجة التحديات التي تطرحها البيانات الخاصة بالمشاريع التي قد لا تتوافق مع البروتوكولات القياسية، مما أدى إلى إدخال هيكل مجلدات منقح وإرشادات GIS محسنة.
تشمل عملية إدخال حزم البيانات مراجعة رسمية لضمان الامتثال لهذه الإرشادات، على الرغم من أن المراجعات الشاملة للمحتوى غالبًا ما تكون غير عملية بسبب حجم التقديمات. يتم بعد ذلك إيداع حزمة المعلومات الأرشيفية (AIP) في مستودع مركزي، حيث يتم إنشاء بيانات وصفية إضافية. تسلط الورقة الضوء على نمو المستودع، مشيرة إلى أنه يحتوي على أكثر من 6400 حزمة بيانات و70 تيرابايت من البيانات، مع زيادات كبيرة في تقديمات المشاريع منذ عام 2016. يكشف تحليل ملاءمة الأرشفة أن العديد من صيغ الملفات لا تزال غير قابلة للأرشفة أو قابلة للأرشفة بشروط، خاصة تلك التي تم إنشاؤها قبل إدخال الإرشادات الملزمة في عام 2018. يؤكد النقاش على الحاجة إلى عمليات نظافة واختيار البيانات المستمرة لإدارة الحجم المتزايد من بيانات التراث الرقمية بشكل فعال، مما يضمن الاحتفاظ فقط بالبيانات التي تستحق الحفظ مع الحفاظ على الشفافية وقابلية التتبع في عمليات اتخاذ القرار.
DOI: https://doi.org/10.11141/ia.72.5
Publication Date: 2026-01-01
Author(s): Jonas Abele et al.
Primary Topic: Libraries and Information Services
Overview
The paper discusses the long-term data storage strategies for archaeological primary documentation at the Landesamt für Denkmalpflege Baden-Württemberg (LAD-BW). Established in 2016, the central repository was created to manage the growing volume of digital documentation resulting from increased construction activities and rescue excavations. Since 2018, the repository has adhered to guidelines that standardize data structures, formats, and metadata, significantly improving the findability and preservation of over 6400 data packages (70 TB as of July 2025). However, challenges persist, particularly with heterogeneous data structures and the management of structure-from-motion (SfM) data, which has become prevalent in large-scale excavations.
The findings highlight that while guidelines have improved data preservation practices, compliance remains difficult due to the volume of projects and the diversity of data formats. The Legacy Data Project aims to systematically address these issues by implementing standardized processes for data selection, hygiene, and migration. Future directions include revising excavation guidelines and developing new systems, such as a geodatabase, to enhance the creation of guideline-compliant data. The ongoing efforts are expected to strengthen the FAIR (Findable, Accessible, Interoperable, and Reusable) principles, ensuring that archaeological documentation is more accessible and usable for future research. Additionally, the establishment of open-access publication series aims to disseminate excavation results and associated research data promptly.
Discussion
The discussion section of the research paper provides a comprehensive overview of the data management processes associated with archaeological projects, particularly focusing on the creation and organization of standardized data packages. These packages are essential for archiving primary documentation data generated during fieldwork, such as excavations and construction supervision. The data management workflow is structured according to established guidelines, which dictate the organization of geodata and textual data within specific folders in the Submission Information Package (SIP). Notably, the guidelines have evolved to address the challenges posed by project-specific data that may not conform to standard protocols, leading to the introduction of a revised folder structure and enhanced GIS guidelines.
The ingest process for data packages involves a formal review to ensure compliance with these guidelines, although comprehensive content reviews are often impractical due to the volume of submissions. The Archival Information Package (AIP) is subsequently deposited in a central repository, where additional metadata is generated. The paper highlights the repository’s growth, noting that it contains over 6,400 data packages and 70 TB of data, with significant increases in project submissions since 2016. The analysis of archival suitability reveals that many file formats remain non-archivable or conditionally archivable, particularly those generated before the introduction of binding guidelines in 2018. The discussion emphasizes the need for ongoing data hygiene and selection processes to manage the growing volume of digital legacy data effectively, ensuring that only data worthy of preservation is retained while maintaining transparency and traceability in the decision-making processes.
