Nouvelles Du Monde

Utiliser l’IA pour déchiffrer les manuscrits historiques

Utiliser l’IA pour déchiffrer les manuscrits historiques

2023-11-09 01:20:41

Combien d’hommes autochtones ont été sélectionnés pour combattre lors de la tournée de John Ferdinand Dalziel Smith en Amérique du Nord en 1784 ?

Quelle superficie de terres près de Sillery les sœurs augustines de l’Hôtel-Dieu de Québec ont-elles concédée en concession aux autochtones de Tadoussac en 1642 ?

Quelle sanction le Conseil Souverain inflige-t-il aux contrebandiers de Trois-Rivières en 1667 ?

Les réponses à ces questions et à bien d’autres se trouvent dans le Louis-François-Georges Baby Collection de documents historiques conservés par la Division des archives et de la gestion de l’information de l’Université de Montréal (TOUJOURS).

Et voilà que la collection dévoile de nouveaux secrets, redécouverts par Jean-Olivier Dicaire-Leduc, qui termine une maîtrise en histoire à l’UdeM et a récemment effectué un stage au DAGI.

Dicaire-Leduc s’est concentré sur une partie de la collection Baby, la série N, qui comprend une variété de documents manuscrits traitant des affaires autochtones, en vue de déchiffrer l’écriture manuscrite, qui est dans de nombreux cas illisible.

Les études de maîtrise de Dicaire-Leduc ont été supervisées par le professeur d’histoire Mathieu Arsenault, tandis que son stage a été supervisé par un archiviste du DAGI. L’historien en herbe a également reçu le soutien de l’équipe à l’origine du Donner le goût de l’archive à l’ère numérique dédié à la promotion de l’archivage à l’ère numérique et dirigé par le professeur Dominique Deslandres.

Lire aussi  L'offensive russe touche à son paroxysme. L'Ukraine pourrait lancer une contre-attaque

Logiciel open source développé en Autriche

Jean-Olivier Dicaire Leduc

Credit: Amélie Philibert, Université de Montréal

Pour déchiffrer les manuscrits historiques, Dicaire-Leduc a utilisé je transcrirais, un logiciel open source développé par une équipe de l’Université d’Innsbruck, en Autriche. Il scanne les photos des manuscrits puis retranscrit automatiquement le texte manuscrit qui y figure. Il permet également de partager des documents et d’effectuer des recherches exhaustives sur plusieurs centaines de milliers de pages, qui sont ensuite archivées.

“Après avoir pris une image numérique haute résolution d’un document d’archives et l’avoir téléchargée sur Transkribus, le logiciel génère des modèles de langage à l’aide d’algorithmes d’apprentissage qui analysent le texte, identifient les mots et les tournures de phrases récurrents, et finalement déchiffrent le message”, a expliqué Dicaire. -Léduc.

Le défi avec la série N de Baby Collection était que les documents couvraient un large éventail de sujets et étaient rédigés par différents auteurs à différentes périodes.

“Cette série couvre toute la gamme des décisions de justice aux concessions foncières, en passant par les observations démographiques et les bons de commande de marchandises”, a déclaré le chercheur. “Les transcriptions automatisées générées par Transkribus contenaient quelques erreurs, j’ai donc dû apporter des corrections afin que les documents soient plus faciles à lire et à indexer.”

Lire aussi  Avis aux voyageurs en Jamaïque : les États-Unis émettent un avertissement aux voyageurs visitant les Caraïbes en raison de l'augmentation de la criminalité | Ce qu'il faut savoir

Trois objectifs en tête

Dicaire-Leduc avait trois objectifs pour son stage, qui était un projet pilote pour DAGI.

La première consistait à transcrire des documents afin que leur contenu soit plus accessible et puisse être indexé à l’aide d’outils de recherche archivistique comme l’application de description archivistique AtoM de l’UdeM.

Il espérait également contribuer à l’initiative de l’université visant à promouvoir l’archivage à l’ère numérique en produisant et en partageant des données historiques et archéologiques sur les peuples vivant dans la région de Montréal au XVIIe siècle.

«Enfin, je voulais analyser le contenu des documents et revoir de manière critique les descriptions archivistiques produites lors de l’archivage initial de la Collection Bébé, il y a 70 ans», a ajouté Dicaire-Leduc. “Nous ne voulons pas éliminer les termes qui ont mal vieilli, mais nous voulons les contextualiser.”

Dicaire-Leduc estime que ce stage lui a permis avant tout de « faciliter l’accès à une partie de l’histoire de la Nouvelle-France et éventuellement de créer des supports de recherche archivistique et des outils de diffusion accessibles à tous ».

Qui était Louis-François-Georges Bébé ?

Né en 1832, Louis-François-Georges Baby étudie le droit avant de devenir maire de Joliette, député fédéral de Joliette en 1872, puis ministre du Revenu intérieur du Canada sous le premier ministre John A. Macdonald de 1878 à 1880. Il démissionne de ce poste. poste à nommer à la Cour supérieure du Québec et, l’année suivante, il fut promu à la Cour d’appel, où il servit jusqu’à sa retraite en 1896.

Lire aussi  Graines d'épis : Le blé, la prune jaune et le blé mûr peuvent éliminer l'humidité et prévenir les coups de chaleur.

Pendant une grande partie de sa vie d’adulte, Baby était un passionné collectionneur de documents historiques et d’antiquités. Il a rassemblé quelque 20 000 documents d’archives s’étalant sur trois siècles (1601-1905), ainsi qu’une bibliothèque de 3 400 livres rares et anciens, aujourd’hui conservés à la Bibliothèque des livres rares et collections spéciales de l’UdeM.

Sa collection couvre un large éventail de sujets, notamment l’agriculture, l’éducation, les affaires militaires, la littérature et la politique. Certains éléments notables comprennent des documents signés par d’importants personnages historiques tels que le roi de France Louis XIV et le cardinal de Richelieu, ainsi que la correspondance du chef et homme politique des Patriotes Louis-Joseph Papineau.

Une description plus détaillée du Louis-François-George Baby Collection est disponible dans le catalogue en ligne des Archives de l’UdeM.

L’ensemble de la Collection Bébé se retrouve également dans le répertoire du patrimoine culturel québécois (Répertoire du patrimoine culturel du Québec).

#Utiliser #lIA #pour #déchiffrer #les #manuscrits #historiques
1699486817

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT