DOI: https://doi.org/10.46298/jdmdh.9805
تاريخ النشر: 2024-07-02
المؤلف: Estelle Guéville وآخرون
الموضوع الرئيسي: الإنسانيات الرقمية والدراسات الأكاديمية
نظرة عامة
تتناول هذه المقالة نسخ المخطوطات في العصور الوسطى، مع تسليط الضوء على تطور طرق النسخ من التطبيع التقليدي إلى التعرف على النصوص المكتوبة باليد الحديثة (HTR). بينما كانت النسخ تاريخياً مصدر قلق للباحثين في العصور الوسطى، فإن ظهور HTR لم يسهل فقط أشكال جديدة من إنشاء النصوص الرقمية، بل استلزم أيضاً إعادة تقييم نظرية لممارسات النسخ ضمن العمل الأكاديمي. يؤكد المؤلفون على أهمية تخصيص مخططات النسخ لتناسب أسئلة البحث المحددة والتطبيقات الأكاديمية، خاصة في سياق أبحاثهم حول الكتاب المقدس اللاتيني في العصور الوسطى.
تركز الإرشادات المقترحة من قبل المؤلفين على التقاط مساهمات النسخ، بما في ذلك الاختصارات والتباينات الإملائية بين الشهود النصيين المختلفين، لتعزيز تطبيقات التعلم الآلي. تختتم المقالة بتوضيح كيف تمكن النسخ الناتجة عن HTR الباحثين من استكشاف استفسارات جديدة على نطاق واسع، مثل تحليل التباين النصي عبر المخطوطات، وتوقع التغيرات في أنماط النسخ ضمن مخطوطة واحدة، وتوصيف الخصائص الفردية والإقليمية للنسخ.
مقدمة
في أوائل القرن العشرين، ركز الباحثون بشكل أساسي على إعداد طبعات وترجمات للنصوص في العصور الوسطى، والتي كانت متاحة فقط لعدد قليل مختار. لقد تقدم هذا العمل الأساسي بشكل كبير دراسات العصور الوسطى، ومع ذلك، لا تزال العديد من المواد الأرشيفية التاريخية، بما في ذلك المجموعات الرقمية، تحت النسخ. لقد وسعت التطورات الأخيرة في الرقمنة الوصول إلى النصوص في العصور الوسطى، مما أدى إلى استفسارات بحثية جديدة. ومع ذلك، فإن صعود الأتمتة في الممارسات الأرشيفية يقدم تحديات للباحثين في العصور الوسطى، خاصة فيما يتعلق بطرق النسخ.
يدعو المؤلفون إلى العودة إلى ممارسات النسخ الدقيقة المشابهة لتلك المستخدمة في الكتابات في العصور الوسطى، مؤكدين على الحاجة إلى إرشادات منهجية تلتقط عدة طبقات من البيانات من الشهود المخطوطين. يجادلون بأن خيارات التطبيع التحريري يجب أن تُقلل للحفاظ على سلامة النصوص الأصلية، حيث يمكن أن تؤثر هذه الخيارات على نتائج التحليلات الحاسوبية. تفترض المقالة أن إرشادات النسخ يجب أن تكون مخصصة لاستخدامها المقصود، مع تحقيق توازن بين احتياجات القراء العامين واحتياجات الباحثين الذين يركزون على الفيلولوجيا. في النهاية، يدعو المؤلفون إلى إطار نظري للنسخ يستوعب كل من المعالجة البشرية والآلية، مما يمكّن الدراسات الحاسوبية المتقدمة لملفات النسخ في المخطوطات في العصور الوسطى.
نقاش
في هذا القسم، يستكشف المؤلفون الممارسات المتطورة لنسخ المخطوطات في العصور الوسطى، خاصة في سياق تقنيات التعرف على النصوص المكتوبة باليد (HTR). يؤكدون على الأهمية التاريخية لأساليب النسخ، مشيرين إلى أنه بينما كانت الطبعات السابقة غالباً ما تحافظ على الميزات الفريدة للمخطوطات، فإن الممارسات المعاصرة تميل إلى تطبيع النصوص، مما يمكن أن يؤدي إلى فقدان البيانات. يحدد المؤلفون ثلاث نقاط حاسمة تتعلق بتطبيع النسخ: طبيعتها المعتمدة تاريخياً، والضرورة لتوافق النسخ مع احتياجات البحث، والأثر التحويلي لنماذج HTR على التحليل النصي في العلوم الإنسانية.
يسلط النقاش الضوء على أنواع النسخ المختلفة—المطابقة، شبه الدبلوماسية، والدبلوماسية—كل منها له دلالات مميزة على تمثيل البيانات وقابليتها للاستخدام. على سبيل المثال، تبسط النسخ المطابقة أشكال الحروف وتصحيح النص، مما يسهل القراءة ولكنه قد يخفي ميزات المخطوطة الأصلية. في المقابل، تهدف النسخ الدبلوماسية إلى الاحتفاظ بأكبر قدر ممكن من الشكل الأصلي للمخطوطة، وهو أمر ضروري لبعض الاستفسارات الأكاديمية. يجادل المؤلفون بأن صعود HTR يتطلب إعادة تقييم معايير النسخ، داعين إلى نهج أكثر دقة يستوعب كل من قابلية القراءة البشرية وقدرات المعالجة الآلية. يقترحون أن ممارسات النسخ المستقبلية يجب أن تدمج مستويات متعددة من تمثيل البيانات لتعزيز البحث والتحليل الأكاديمي في دراسات العصور الوسطى.
DOI: https://doi.org/10.46298/jdmdh.9805
Publication Date: 2024-07-02
Author(s): Estelle Guéville et al.
Primary Topic: Digital Humanities and Scholarship
Overview
This article examines the transcription of medieval manuscripts, highlighting the evolution of transcription methods from traditional normalization to modern handwritten text recognition (HTR). While transcription has historically been a concern for medievalists, the advent of HTR has not only facilitated new forms of digital text creation but has also necessitated a theoretical reevaluation of transcription practices within scholarly work. The authors emphasize the importance of tailoring transcription schemes to specific research questions and scholarly applications, particularly in the context of their research on medieval Latin Bibles.
The guidelines proposed by the authors focus on capturing scribal contributions, including abbreviations and orthographic variations among different textual witnesses, to enhance machine learning applications. The article concludes by illustrating how HTR-generated transcriptions enable researchers to explore new inquiries at scale, such as analyzing textual variance across manuscripts, predicting changes in scribal hands within a single manuscript, and profiling individual and regional scribal characteristics.
Introduction
In the early twentieth century, scholars primarily focused on preparing editions and translations of medieval texts, which were accessible only to a select few. This foundational work significantly advanced medieval studies, yet many historical archival materials, including digitized collections, remain under-transcribed. Recent advancements in digitization have expanded access to medieval texts, prompting new research inquiries. However, the rise of automation in archival practices presents challenges for medievalists, particularly regarding transcription methods.
The authors advocate for a return to meticulous transcription practices akin to those used in medieval scriptoria, emphasizing the need for systematic guidelines that capture multiple layers of data from manuscript witnesses. They argue that editorial normalization choices should be minimized to preserve the integrity of the original texts, as these choices can influence the outcomes of computational analyses. The article posits that transcription guidelines should be tailored to their intended use, balancing the needs of general readers with those of philologically focused researchers. Ultimately, the authors call for a theoretical framework for transcription that accommodates both human and machine processing, enabling advanced computational studies of scribal profiles in medieval manuscripts.
Discussion
In this section, the authors explore the evolving practices of transcribing medieval manuscripts, particularly in the context of handwritten text recognition (HTR) technologies. They emphasize the historical significance of transcription methodologies, noting that while earlier editions often preserved the unique features of manuscripts, contemporary practices tend to normalize texts, which can lead to data loss. The authors identify three critical points regarding the normalization of transcription: its historically contingent nature, the necessity for aligning transcriptions with research needs, and the transformative impact of HTR models on textual analysis in the humanities.
The discussion highlights various transcription types—normalized, semi-diplomatic, and diplomatic—each with distinct implications for data representation and usability. For instance, normalized transcriptions simplify letter-forms and correct text, facilitating readability but potentially obscuring original manuscript features. In contrast, diplomatic transcriptions aim to retain as much of the manuscript’s original form as possible, which is essential for certain scholarly inquiries. The authors argue that the rise of HTR necessitates a reevaluation of transcription norms, advocating for a more nuanced approach that accommodates both human readability and machine processing capabilities. They suggest that future transcription practices should integrate multiple levels of data representation to enhance scholarly research and analysis in medieval studies.
