Dottorato di ricerca SDA

XXXIX | Umanesimo e Tecnologie

KEYWORDSArtificial Intelligence, Natural Language Processing, Machine Learning, Archives, ItalianHistoricalDocuments 

Cristian Santini.png

Gli strumenti di intelligenza artificiale disponibili oggi devono affrontare le sfide della digitalizzazione del patrimonio culturale nel settore GLAM (Gallerie, Biblioteche, Archivi e Musei). La ricerca si propone di esplorare l'applicazione degli strumenti di intelligenza artificiale, in particolare quelli basati sul trattamento del linguaggio naturale (NLP), negli Archivi degli Autori Italiani (AAI). Si mira a sfruttare i progressi nell'apprendimento automatico e nella modellazione del linguaggio per sviluppare strumenti automatici che supportino gli archivisti e i bibliotecari nella digitalizzazione delle risorse e nel miglioramento della catalogazione, del recupero e dell'esplorazione all'interno degli AAI. La ricerca prevede di fornire una prima serie di modelli di intelligenza artificiale e dataset utilizzabili dalla comunità degli archivisti e dei bibliotecari italiani per risolvere in maniera computazionale problemi nel loro settore. Inoltre, si prevede di pubblicare i materiali e i risultati della ricerca seguendo i principi dell'Open Science, rendendo i risultati accessibili all'intera comunità scientifica. 

Nowadays, the digitalization of cultural heritage in the GLAM sector (Galleries, Libraries, Archives and Museums) facescrucial challenges. In specific, the heterogeneity of data collected by these institutions and the plurality of standards used to describe and cataloguetheseresourcesaffect the capabilities of algorithms, includingthosebased on Artificial Intelligence (AI), in dealing with suchtypes of data. Thus, the goal of thisresearchis to investigate in which ways AI tools, especiallythosebased on Natural Language Processing (NLP), can be applied to Archives of ItalianAuthors (AIAs). More in depth, aim of this work is to leverage currentadvancements in machine learning and languagemodelling to developautomatic tools that can serve archivists and librarians in digitizingresources and model the information withinthesedocuments to enhancecataloguing, retrieval and exploration inside AIAs. To reachthis goal, thisresearchwill focus on the creation of a domain-specific dataset of annotatedarchivalrecordswhichwill be used to train AI tools in support of AIAs, suchas Optical CharacterRecognition (OCR) and Entity Linking systems. In the end, thisresearchwillprovide a first suite of AI models and datasets which can be used by the community of Italianarchivists and librarians to computationally solve problemswithintheir domain. Further benefit of this work will be to publishthesematerials and results of the research following Open Science principles, to make the outcome of this work accessible for the wholescientific community.  

Ultimo aggiornamento  2024/02/29 11:45:45 GMT+2

5x1000

Sostieni l'Università di Macerata
Sostieni i giovani e il territorio

PERCHÈ DONARE

Con il tuo 5 x1000 puoi sostenere i servizi
per il benessere e la vita comunitaria
delle studentesse e degli studenti

COME DONARE

Apponi la tua firma nel riquadro
"Finanziamento della ricerca scientifica e della
Università" e indica questo codice fiscale
00177050432