L'intelligence artificielle au service des textes anciens

L'intelligence artificielle au service des textes anciens
Par Denis Loctier
Partager cet articleDiscussion
Partager cet articleClose Button
Copier/coller le lien embed de la vidéo de l'article :Copy to clipboardLien copié

Les scientifiques du projet européen READ ont conçu un système s'appuyant sur l'intelligence artificielle pour lire plus facilement de vieux manuscrits rédigés à la main.

Comment trouver des textes dans des manuscrits anciens et le faire vite ? Jusqu'à récemment, les ordinateurs avaient du mal à lire du texte écrit à la main. Mais l'intelligence artificielle permet des progrès.

Les Archives fédérales du Tyrol, en Autriche, renferment d'innombrables documents qui remontent pour certains jusqu'au XIè siècle. Des documents officiels ou légaux en majorité, mais aussi des courriers manuscrits de grande valeur. Retranscrire ces livres n'est pas facile. Mais ce fonds travaille avec les scientifiques pour automatiser la transcription, en utilisant les dernières technologies.

"Avec des écritures cursives difficiles comme celles-là, la nouvelle technique risque de rencontrer des problèmes, explique Christoph Haidacher, directeur des Archives du Tyrol. Mais avec une calligraphie assez jolie comme celle-là, le nouveau système offre de grands avantages et nous aide beaucoup."

Pour numériser de tels livres, les scientifiques du projet de recherche européen READ ont conçu un système simple fondé sur une application mobile. Elle détecte le moment où les pages sont tournées et prend automatiquement des photos de chaque page en haute résolution. Guenter Muehlberger coordonne le projet. "C'est, bien sûr, une combinaison de haute technologie et de technologie plus traditionnelle, expose-t-il. Cette tente est un accessoire relativement simple. Mais elle fonctionne en lien avec une application mobile connectée à la plateforme Transkribus. L'application charge les images sur le serveur qui réalise la reconnaissance du texte écrit à la main."

Transkribus - c'est le nom du système - simplifie les tâches qui pourraient demander des années de travail, aidant les spécialistes à déchiffrer les écritures complexes et les mises en pages inhabituelles. Mario Klarer l'a utilisé pour transcrire le "Livre des Héros" une importante anthologie de textes médiévaux germaniques du début du XVIè siècle.

"Le grand avantage de ce système est qu'il fournit un lien entre l'image et le texte et il le fait de manière très simple, donc celui qui transcrit possède une image d'ensemble immédiatement, explique Mario Klarer, professeur de littérature et d'histoire culturelle à l'Université d'Innsbruck. C'est une façon de réduire le risque d'erreur au minimum, ce que ne peut faire aucun autre système."

Après que les utilisateurs ont transcrit une partie du texte à la main, le logiciel apprend à identifier les caractères et termine ensuite la tâche de façon automatique. Avec une précision impressionnante, il retranscrit les documents indépendamment de leur langue ou de leur écriture.

"Je donne à l'ordinateur une image et une partie du texte correspondant et à partir de là, l'ordinateur peut apprendre exactement l'écriture manuelle et les polices de caractère correspondantes" explique Guenter Muehlberger. 

Le système peut transcrire le texte dans n'importe quelle langue, et est disponible à la fois aux étudiants, aux scientifiques et aux archivistes. Les développeurs prévoient de commercialiser Transkribus à travers le monde.

"Nous avons été étonnés par le grand succès du projet et nous sommes en contact avec beaucoup d'institutions qui nous disent leur intérêt, poursuit Guenter Muehlberger. Et comme nous souhaitons continuer à offrir et à étendre le service, nous lançons une entreprise dérivée."

Partager cet articleDiscussion

À découvrir également

The Brief from Brussels : l’arrivée des robots justiciers ?

Comment restaurer la biodiversité dans les océans et eaux d'Europe ?

Plus de compétitivité et de sécurité dans la construction grâce aux robots à câble