DOI: https://doi.org/10.1108/jd-09-2025-0284
تاريخ النشر: 2026-01-20
المؤلف: Marilena Daquino وآخرون
الموضوع الرئيسي: التصوير الفوتوغرافي والثقافة البصرية
نظرة عامة
تستكشف هذه المقالة تعقيدات تسوية السجلات المتنوعة في المؤسسات الثقافية، مع التركيز بشكل خاص على أرشيفات الصور التاريخية الفنية ضمن اتحاد PHAROS. من خلال دراسات حالة، تفحص الأبحاث سير العمل في التسوية وتقاليد الفهرسة، مع التأكيد على تأثير السياقات المؤسسية، ودقة البيانات، واستراتيجيات النمذجة. تكشف النتائج أن التسوية نادراً ما تكون عملية مباشرة من واحد إلى واحد؛ بدلاً من ذلك، تتأثر بالغموض، والبيانات غير المكتملة، والممارسات المتنوعة. تشمل الاستراتيجيات المحددة إنشاء كيانات جماعية، واستخدام مصطلحات شاملة، ودمج مؤهلات عدم اليقين، مما يبرز الطبيعة التفسيرية للتسوية.
تؤكد الدراسة على ضرورة نمذجة عدم اليقين بشكل صريح وتقترح إطار عمل يربط بين طرق التسوية التقنية والممارسات المؤسسية. وتجادل بأن التسوية يجب أن تُعتبر عملية مستمرة وقابلة للمراجعة بدلاً من مهمة نهائية، داعية إلى تحقيق توازن بين الدعم الخوارزمي واتخاذ القرار المدفوع بالخبراء. من خلال تعزيز التوافقية وتمثيلات الوعي بالأصل، يهدف مشروع PHAROS إلى الحفاظ على تنوع الأصوات داخل مجموعات التراث الثقافي. الاستراتيجيات المتعلقة بالتسوية التي تم مناقشتها قابلة للتطبيق خارج أرشيفات الصور، وتمتد إلى المكتبات والمتاحف التي تواجه تحديات مماثلة في مواءمة البيانات المتنوعة. يعمل الإطار المقترح كهيكل قابل لإعادة الاستخدام لمنظمات GLAM التي تسعى لتوحيد مجموعات بيانات متنوعة بطريقة متوافقة دلالياً.
مقدمة
في قطاع GLAM، أصبحت البيانات المرتبطة نهجاً محورياً لتطوير مجمعات بيانات وصفية واسعة تسهل اكتشاف الأبحاث عبر المجموعات. من خلال نشر البيانات كبيانات مفتوحة مرتبطة ومواءمتها مع موارد السلطة المشتركة مثل VIAF وWikidata، يمكن للمؤسسات تعزيز التوافقية وإمكانية إعادة استخدام مجموعاتها. جانب حاسم من هذه العملية هو تسوية البيانات، التي تتناول التحديات التي تطرحها URI المكررة أو المجزأة أو المعبر عنها بشكل متنوع للكيانات مثل الأشخاص، والأماكن، أو الأعمال الفنية. هذه التسوية ضرورية لإنشاء شبكات متماسكة وغنية من معلومات التراث الثقافي.
تتكون جمعية PHAROS، التي تضم 13 أرشيفاً تاريخياً فنياً، حالياً من منصة البحث عبر الإنترنت artresearch.net، التي تدمج 1.7 مليون صورة لحوالي 1 مليون عمل فني. لضمان التوافقية، تستخدم PHAROS ملف تعريف تطبيق CIDOC-CRM لتوحيد أوصاف البيانات الوصفية. ومع ذلك، تواجه عملية التسوية تحديات كبيرة بسبب الطبيعة المتنوعة للبيانات، التي تشكلها ممارسات الفهرسة المتنوعة والتحيزات التاريخية. تتفاقم هذه التحديات بسبب نقص الأوصاف القياسية للصور، مما يعقد التوافقية عبر المؤسسات ويستمر في perpetuating inconsistencies من جهود الفهرسة السابقة. نتيجة لذلك، يجب أن يوازن تصميم منصة artresearch.net بين تمثيل عدم اليقين في البيانات وسهولة الاستخدام، مما يضمن أن المستخدمين يمكنهم التنقل في تعقيدات البيانات الوصفية دون أن يشعروا بالإرهاق.
طرق
في قسم الطرق، تناقش الورقة التعقيدات المتعلقة بتسوية المصطلحات المتعلقة بالمواد، والتقنيات، وأنواع الأعمال الفنية ضمن قاموس الفن والعمارة (AAT). تبرز غموض مصطلحات مثل “الألبومين”، التي يمكن أن تشير إلى المادة الخام، أو العملية الفوتوغرافية، أو المنتج النهائي، مما يؤدي إلى عدم اتساق محتمل في ممارسات الفهرسة عبر المؤسسات. للتخفيف من الضوضاء الدلالية في المحاذاة الآلية، تشجع مشروع PHAROS الفهرسين على تحديد المصطلحات على جميع المستويات المفاهيمية ذات الصلة، مما يضمن فهماً شاملاً للمصطلحات المستخدمة.
تناقش الورقة أيضاً التحديات الناجمة عن الاختلافات في دقة الوصف، مثل العناوين، والتواريخ، والمواد المختلفة بسبب سياسات الفهرسة أو التقاليد المؤسسية. تؤكد على ضرورة الترتيب البشري لتسوية هذه الجوانب، حيث قد لا تؤدي التسوية الآلية إلى نتائج موثوقة. تعتمد PHAROS نموذجاً يوثق جميع المتغيرات مع أصلها ودرجة اليقين، مما يسمح بتمثيل دقيق لسجلات الأعمال الفنية. بالإضافة إلى ذلك، يتم تسوية المواد والتقنيات يدوياً مع مصطلحات Getty AAT، مما يسهل تقديم هيكل من الطبقات التصنيفية للمستخدمين، على غرار معالجة RDA لعائلات الأعمال والتجليات المتغيرة. تهدف هذه الطريقة إلى الحفاظ على التفاصيل مع توفير تنقل متماسك للكيانات المفاهيمية.
نقاش
في سياق المعارض، والمكتبات، والأرشيفات، والمتاحف (GLAM)، تعتبر تسوية الكيانات مثل الفنانين، والأعمال الفنية، وسجلات الأصل مهمة معقدة تعتمد على السيطرة على السلطة والمفردات الموحدة. توفر السيطرة على السلطة، كما يتضح من أنظمة مثل VIAF ومفردات Getty، إطاراً للاسم والتعريف المتسق عبر بيانات التراث الثقافي. تسهل دمج الأنطولوجيات مثل CIDOC-CRM وملفات تعريف التطبيقات مثل الفن المرتبط المحاذاة عبر المؤسسات، بينما تعزز أدوات مثل OpenRefine وتقنيات التعلم الآلي من الترتيب شبه الآلي للبيانات. ومع ذلك، تستمر التحديات بسبب الغموض المتأصل في الأسماء، والنسب، والهويات التاريخية، مما يتطلب إشراف القيم وتطوير سياسات لإدارة هذه التعقيدات بشكل فعال.
في مشروع PHAROS، يتم تسوية الفنانين بشكل أساسي ضد سلطة ULAN، مع استخدام Wikidata كمصدر ثانوي للحالات التي تفتقر إلى تطابقات ULAN. تتناول عملية التسوية القضايا المتكررة مثل مؤهلات النسب، وأسماء العائلات، والهويات المتباينة، كل منها يتطلب نمذجة دقيقة للحفاظ على سلامة العلاقات مع الاعتراف بعدم اليقين. على سبيل المثال، يتم التعامل مع الفنانين المجهولين ككيانات متميزة للحفاظ على ارتباطهم بالشخصيات المعروفة، بينما يتم تمثيل أسماء العائلات الغامضة ككيانات جماعية دون التأكيد على العلاقات الرسمية. بالإضافة إلى ذلك، فإن تسوية سجلات الأصل والكيانات الجغرافية تضيف مزيداً من التعقيد، حيث تعقد التناقضات في البيانات الوصفية ومستويات الدقة المتنوعة إعادة بناء تاريخ الملكية. تسلط الجهود المستمرة في PHAROS الضوء على الحاجة إلى استراتيجيات قوية تشمل كل من الأساليب الخوارزمية والخبرة البشرية للتنقل في المشهد الدقيق لوثائق التراث الثقافي.
DOI: https://doi.org/10.1108/jd-09-2025-0284
Publication Date: 2026-01-20
Author(s): Marilena Daquino et al.
Primary Topic: Photography and Visual Culture
Overview
This article explores the complexities of reconciling heterogeneous records in cultural institutions, specifically focusing on art historical photo archives within the PHAROS consortium. Through case studies, the research examines reconciliation workflows and cataloguing traditions, emphasizing the influence of institutional contexts, data granularities, and modeling strategies. The findings reveal that reconciliation is rarely a straightforward one-to-one process; instead, it is affected by ambiguities, incomplete data, and varying practices. Strategies identified include the creation of collective entities, the use of umbrella terms, and the incorporation of uncertainty qualifiers, highlighting the interpretive nature of reconciliation.
The study underscores the necessity of explicitly modeling uncertainty and proposes a framework that links technical reconciliation methods with institutional practices. It argues that reconciliation should be viewed as an ongoing, revisable process rather than a definitive task, advocating for a balance between algorithmic support and expert-driven decision-making. By promoting interoperability and provenance-aware representations, the PHAROS project aims to preserve the diversity of voices within cultural heritage datasets. The reconciliation strategies discussed are applicable beyond photographic archives, extending to libraries and museums facing similar challenges in aligning heterogeneous data. The proposed framework serves as a reusable structure for GLAM organizations striving to consolidate diverse datasets in a semantically interoperable manner.
Introduction
In the GLAM sector, Linked Data has become a pivotal approach for developing extensive metadata aggregators that facilitate cross-collection discovery and research. By publishing data as Linked Open Data and aligning it with shared authority resources like VIAF and Wikidata, institutions can enhance the interoperability and reusability of their collections. A critical aspect of this process is data reconciliation, which addresses the challenges posed by duplicated, fragmented, or variably expressed URIs for entities such as people, places, or artworks. This reconciliation is essential for creating coherent and enriched networks of cultural heritage information.
The PHAROS association, comprising 13 art historical photo archives, is currently piloting the online research platform artresearch.net, which integrates 1.7 million photographs of approximately 1 million artworks. To ensure interoperability, PHAROS employs a CIDOC-CRM application profile to standardize metadata descriptions. However, the reconciliation process faces significant challenges due to the heterogeneous nature of the data, shaped by diverse cataloguing practices and historical biases. These challenges are exacerbated by the lack of standardized descriptors for photographs, which complicates cross-institutional interoperability and perpetuates inconsistencies from earlier cataloguing efforts. As a result, the design of the artresearch.net platform must balance the representation of uncertainty in the data with usability, ensuring that users can navigate the complexities of the metadata without being overwhelmed.
Methods
In the section on Methods, the paper discusses the complexities involved in reconciling terminology related to materials, techniques, and artwork types within the Art & Architecture Thesaurus (AAT). It highlights the ambiguity of terms like “albumen,” which can refer to the raw material, the photographic process, or the final product, leading to potential inconsistencies in cataloging practices across institutions. To mitigate semantic noise in automated alignments, the PHAROS project encourages cataloguers to identify terms at all relevant conceptual levels, ensuring a comprehensive understanding of the terminology used.
The paper also addresses challenges stemming from variations in descriptive granularity, such as differing titles, dates, and materials due to cataloging policies or institutional traditions. It emphasizes the necessity of human curation for reconciling these aspects, as automatic reconciliation may not yield reliable results. PHAROS adopts a model that documents all variants with their provenance and certainty, allowing for a nuanced representation of artwork records. Additionally, materials and techniques are manually reconciled with Getty AAT terms, facilitating a structured presentation of taxonomical layers to users, akin to the RDA’s treatment of work families and variant manifestations. This approach aims to preserve detail while providing coherent navigation of conceptual entities.
Discussion
In the context of Galleries, Libraries, Archives, and Museums (GLAM), the reconciliation of entities such as artists, artworks, and provenance records is a complex task that relies on authority control and standardized vocabularies. Authority control, exemplified by systems like VIAF and the Getty Vocabularies, provides a framework for consistent naming and identification across cultural heritage data. The integration of ontologies like CIDOC-CRM and application profiles such as Linked Art facilitates cross-institutional alignment, while tools like OpenRefine and machine learning techniques enhance the semi-automatic curation of data. However, challenges persist due to the inherent ambiguity in names, attributions, and historical identities, necessitating curator oversight and the development of policies to manage these complexities effectively.
In the PHAROS project, artists are primarily reconciled against the ULAN authority, with Wikidata serving as a secondary resource for cases lacking ULAN matches. The reconciliation process addresses recurring issues such as attribution qualifiers, family names, and diverging identities, each requiring careful modeling to maintain the integrity of relationships while acknowledging uncertainty. For instance, anonymous artists are treated as distinct entities to preserve their association with known figures, while ambiguous family names are represented as collective entities without asserting formal relationships. Additionally, the reconciliation of provenance records and geographical entities introduces further complexity, as inconsistencies in metadata and varying levels of granularity complicate the reconstruction of ownership histories. The ongoing efforts in PHAROS highlight the need for robust strategies that encompass both algorithmic approaches and human expertise to navigate the nuanced landscape of cultural heritage documentation.
