Google Deepmind, en collaboration avec des chercheurs de plusieurs universités, a dévoilé Aeneas, un nouveau modèle d’IA conçu pour aider les historiens à déchiffrer les inscriptions latines anciennes. Annoncé le 23 juillet 2025, dans un papier Le travail minutieux de l’épigraphie en fournissant aux chercheurs des hypothèses basées sur les données et des comparaisons pertinentes. En intégrant dans le flux de travail historique, le l’outil disponible gratuitement promet d’approfondir notre compréhension du monde romain en connectant les morceaux fragmentés du passé plus efficacement que jamais. Le défi dans l’épigraphie est le contexte. Pendant des siècles, les historiens ont fait face à la tâche minutieuse d’interpréter les inscriptions qui sont souvent fragmentaires, altérées ou retirées de leur emplacement d’origine. Ce travail nécessite traditionnellement Érudition extraordinaire et des recherches manuelles laborieuses via de vastes archives pour trouver des parallels-des textes simultanés qui peuvent fournir des coulies à une inscription de signification, rendez-vous, ou originaire. width=”734″height=”412″src=”data: image/svg + xml; nitro-empty-id=mtyznjo0nju=-1; base64, phn2zyb2awv3qm94psiwidagnje2idm0 Niigd2lkdgg9ijyxniigagvpz2h0psizndyiihhtbg5zPjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi + pc9zdmc +”>

Aeneas est conçu pour automatiser ce processus complexe et long. Il raisonne dans des milliers d’inscriptions latines, récupérant des parallèles textuels et contextuels en quelques secondes. L’objectif est de réduire la dépendance à l’égard des hypothèses spéculatives et de fonder l’interprétation d’un historien dans un réseau plus large de preuves, Le projet met fortement l’accent sur la collaboration humaine-AI. L’équipe se concentre sur la «fabrication d’un outil qui s’intègre au flux de travail d’un historien», selon le chercheur de Google Deepmind, Yannis Assael. L’objectif n’est pas de remplacer les experts humains mais d’augmenter leurs capacités, en les libérant de se concentrer sur une analyse de niveau supérieur plutôt que sur la collecte de données manuelles.

pour valider cette approche collaborative, l’équipe a mené une grande échelle Étude avec 23 épigraphes , allant des étudiants en maîtrise aux professeurs. Les résultats ont été significatifs: les suggestions d’Aeneas ont servi de précieux point de départ pour l’enquête 75% du temps, et les historiens ont signalé une augmentation moyenne de 23% de la confiance lors de l’utilisation de ses parallèles.

Les gains d’efficacité étaient particulièrement frappants. Un participant a noté: «Les parallèles récupérés par Aeneas ont complètement changé mon objectif historique. […] Cela m’aurait pris quelques jours plutôt que 15 minutes [pour trouver ces textes].”Un autre a salué son impact qualitatif, déclarant: «Les parallèles d’Aneas ont complètement changé ma perception de l’inscription. Il a remarqué que les détails qui ont fait toute la différence pour restaurer et attribuer chronologiquement le texte et les images

sous le capot: contextualiser avec le code et les images Bien que les LLM massives nécessitent des milliards de documents, la nature spécialisée de l’épigraphie et la disponibilité limitée des analyses de haute qualité nécessitent une solution plus personnalisée.

La puissance du modèle provient d’une architecture sophistiquée et basée sur un transformateur. À la base, un décodeur T5 qui traite des séquences de caractères, augmentés de réseaux de neurones spécialisés, ou «têtes», chacune adaptée à une tâche épigraphique spécifique comme la restauration, la datation ou l’attribution, comme détaillé dans le projet .

Une percée clé est sa capacité à restaurer les lacunes dans le texte où la longueur du segment manquant est inconnue-un problème commun et difficile pour les historiens. Aeneas utilise un symbole spécial pour désigner cette incertitude et utilise un réseau auxiliaire pour prédire si un ou plusieurs caractères sont nécessaires, ce qui en fait un outil beaucoup plus polyvalent pour les scénarios du monde réel.

En outre, Aeneas est le premier modèle de son genre à utiliser des entrées multimodales-la fois de texte et d’images-pour déterminer une origine géographique d’une inscription. Un réseau de vision analyse l’objet physique, permettant au modèle de considérer sa forme et sa disposition aux côtés de son contenu, un aspect crucial de l’étude épigraphique.

Tout ce système est formé sur l’ensemble de données épigraphique latin nouvellement compilé (LED). Ce corpus massif, contenant plus de 176 000 inscriptions, a été harmonisé à partir de grandes bases de données académiques. Le modèle utilise ces données pour créer des «intérêts» historiquement riches pour chaque texte, capturant des modèles subtils qui identifient les connexions profondes au-delà des recherches de mots clés simples.

De la théorie à la pratique: les éeneas dans le domaine

Les performances du modèle ont été rigoureusement benclées. Il peut attribuer une inscription à l’une des 62 provinces romaines avec une précision de 72% et des textes de date à une moyenne de 13 ans suivant les gammes fournies par les historiens.

Dans une étude de cas convaincante, Aeneas a analysé le célèbre res Gestae Divi Augusti, le compte de l’empereur Augustus de ses réalisations. Le modèle a produit une distribution de date bimodale qui reflétait quantitativement le débat savant sur sa composition, identifiant les mêmes marqueurs linguistiques et historiques que les experts utilisent.

L’étude collaborative a en outre confirmé sa valeur pratique. Les historiens utilisant Aeneas ont vu leur performance en solo s’améliorer et 90% des participants ont indiqué que les suggestions de l’outil avaient stimulé de nouvelles idées de recherche. Un historien a salué son impact, déclarant: «Les parallèles d’Aeneas ont complètement changé ma perception de l’inscription. Il a remarqué des détails qui ont fait toute la différence pour la restauration et l’attribution chronologiquement du texte.»

Cependant, certains experts restent prudemment optimistes. Kathleen Coleman, professeur à Harvard, a noté que, bien que prometteur,”il n’est pas encore clair à quel point il sera utile aux flux de travail des historiens à long terme”, mettant en évidence le prochain chapitre de la «AI pour la saga de la science». Initiative, un effort stratégique pour appliquer l’IA à des défis de recherche fondamentaux. Ce portefeuille comprend des outils tels que AlphaFold pour la prédiction de la structure des protéines et l’alphagénome pour la recherche génétique.

Ce travail suit un modèle clair de développement de l’IA spécifique au domaine qui peut analyser de vastes espaces d’information complexes pour accélérer la découverte de l’ouragan. Le modèle Aeneas, son code et l’ensemble de données sous-jacents sont tous accessibles au public via un site Web dédié et Github Repository . Dans le cadre du lancement, le précédent iThaca Model for Ancient Greek a été mis à niveau avec le rêve plus puissant. Comme l’épigraphe Thea Sommerschhield de l’Université de Nottingham l’a dit,”Pour avoir des Éenais à vos côtés pendant que vous êtes dans le musée ou sur le site archéologique où une nouvelle inscription vient d’être trouvée-c’est notre genre de scénario de rêve.”

Categories: IT Info