Využití generativní umělé inteligence při digitalizaci tištěných a rukopisných historických dokumentů a její přínos pro pro historické a archivní vzdělávání
Home Research Details
Klára Rybenská, Sylva Sklenářová

Využití generativní umělé inteligence při digitalizaci tištěných a rukopisných historických dokumentů a její přínos pro pro historické a archivní vzdělávání

0.0 (0 ratings)

Introduction

Využití generativní umělé inteligence při digitalizaci tištěných a rukopisných historických dokumentů a její přínos pro pro historické a archivní vzdělávání. Zkoumá se využití generativní AI pro digitalizaci a analýzu českých historických rukopisů. Studie hodnotí přesnost, přínos pro archivní vzdělávání a zdůrazňuje etické aspekty a potřebu lidského dohledu.

0
3 views

Abstract

Cíle: Studie zkoumá, jak mohou současné generativní jazykové modely podporovat archivní a historickou práci s českými rukopisnými texty, se zaměřením na transkripci a základní předběžnou analýzu, a vymezuje klíčová omezení i etické souvislosti jejich využití ve výuce v archivnictví a digitálních humanitních vědách. Metody: Byla provedena kvalitativní případová studie na souboru sedmi moderních osobních rukopisných českých textů z 80. a 90. let 20. století (báseň psaná dítětem, milostné básně, školní test a studijní poznámky). Tři široce dostupné nástroje v bezplatných verzích (ChatGPT, Claude a Copilot) byly testovány za použití shodných instrukcí k úloze. Výstupy byly komparativně hodnoceny z hlediska přesnosti transkripce, obsahové a stylistické interpretace a rozpoznání vybraných formálních rysů textů. Empirické srovnání bylo doplněno kritickou analýzou relevantní odborné literatury a reflexí otázek autenticity, integrity dat, epistemické bezpečnosti a ochrany osobních údajů. Výsledky: Nejlepší celkový výkon dosáhl model Claude, následovaný ChatGPT, zatímco Copilot vykázal v testovaných úlohách výrazně slabší výsledky. Napříč nástroji se ukázalo, že interpretace a analýza jsou pro generativní modely náročnější než samotná transkripce; výstupy navíc obsahovaly chyby a nadinterpretace, které vyžadovaly odborné ověření. Závěry: Generativní jazykové modely mohou fungovat jako podpůrné nástroje pro transkripci, předběžnou analýzu a didaktickou práci, nemohou však doposud nahradit profesionální archivní ani historickou expertizu. Odpovědné využití vyžaduje kritický lidský dohled a explicitní zohlednění etických a datově-ochranných aspektů.


Review

This timely study investigates the potential of generative artificial intelligence, specifically large language models (LLMs), to assist in the digitization of Czech handwritten historical documents, with a focus on transcription and preliminary analysis. Beyond technical capabilities, the research also critically examines the limitations and ethical implications of integrating these tools into archival and digital humanities education. Given the rapid advancements in AI and the growing demand for digital access to historical records, this topic is of significant interest to archivists, historians, educators, and researchers grappling with the practical and pedagogical challenges of incorporating new technologies into their fields. The authors employed a qualitative case study methodology, testing three widely accessible LLMs (ChatGPT, Claude, and Copilot) on a diverse set of seven modern personal Czech handwritten texts from the 1980s and 1990s, including poems, a school test, and study notes. Outputs were rigorously evaluated for transcription accuracy, content and stylistic interpretation, and recognition of formal text features. The empirical findings revealed that Claude generally outperformed the other models, followed by ChatGPT, while Copilot demonstrated notably weaker results. A key finding was the consistent difficulty models faced with interpretative and analytical tasks compared to mere transcription, often producing errors and overinterpretations that necessitated expert human verification. This practical assessment was complemented by a critical review of relevant literature concerning data authenticity, integrity, epistemic security, and privacy. The study concludes that while generative language models show promise as supportive tools for transcription, preliminary analysis, and didactic applications, they are currently incapable of replacing professional archival or historical expertise. Their effective and responsible deployment hinges on critical human oversight, a thorough understanding of their limitations, and explicit consideration of ethical and data protection aspects. While the research provides valuable insights into the performance of LLMs with modern Czech script, its focus on recent, informal personal texts from the late 20th century might limit the direct generalizability of findings to older, more stylistically diverse, or formal historical documents, suggesting an area for future research. Nevertheless, the emphasis on critical engagement and ethical considerations remains highly pertinent for any application of AI in historical and archival contexts.


Full Text

You need to be logged in to view the full text and Download file of this article - Využití generativní umělé inteligence při digitalizaci tištěných a rukopisných historických dokumentů a její přínos pro pro historické a archivní vzdělávání from Pedagogika .

Login to View Full Text And Download

Comments


You need to be logged in to post a comment.