Google DeepMind與幾所大學的研究人員合作,揭幕了AENEAS,這是一種新的AI模型,旨在幫助歷史學家解密古代拉丁文銘文。於2025年7月23日在A paper ,工具分析文本和圖像以恢復損壞的文本和圖像,以預測其原始parease and partept parease and partect at acrop and a partect

免費提供工具可以通過比以前更有效地將過去的零碎段來加深我們對羅馬世界的理解。題詞是背景。幾個世紀以來,歷史學家一直面臨著艱苦的任務,即解釋通常從其原始地點脫離碎片,風化或刪除的銘文。傳統上,這項工作需要非凡的博學和費力的手動搜索通過大量檔案來找到相關文字,這些文字可以提供插圖 simpripts 。寬度=“ 734″高度=“ 412″ src=“數據:image/svg+xml; nitro-empty-id=mtyznjo0nju=-1; base64,phn2zyb2AWV3QM94PSIWIDAGNJE2IDM0 niigd2lkdgg9ijyxniigagvpz2h0psizndyiiihhtbg5zpsjodhrwoi8vd3d3d3lnczlm9yzy8ymdawl3n2n2zyi+pc9zdmc+“>

AENEAS旨在自動化這個複雜且耗時的過程。它的原因是成千上萬的拉丁銘文,在幾秒鐘內檢索文本和上下文相似之處。目的是減少對投機性假設的依賴,並在更廣泛的證據網絡中進行解釋, shord after in a in aff in a in af aff in a in a pros a pros 薩迪尼亞113/14 C.E.的銅製軍事文憑(CIL XVI,60)。 (資料來源:Google)

該項目強烈強調人類的合作。 Google DeepMind研究員Yannis Assael表示,該團隊專注於“制定將與歷史學家的工作流程集成的工具”。目的不是要取代人類專家,而是要增強其能力,使他們專注於高級分析而不是手動數據收集。

要驗證這種協作方法,該團隊進行了大規模的與23個ePragersers fromanging fromanging fromanging fromanging fromanging from tossers fromsters tossers from tosserters fromanging,結果很重要:埃涅阿斯的建議是75%的時間詢問的寶貴起點,歷史學家在使用其相似之處時報告說,平均增強了23%的信心。

效率的提高尤其引人注目。一位參與者指出:“埃涅阿斯(Aeneas)檢索到的相似之處完全改變了我的歷史重點。 Another praised its qualitative impact, stating, “aeneas’ parallels completely changed my perception of the inscription. It noticed details that made all the difference for restoring and chronologically attributing the text.”

Under the Hood: Contextualizing with Code and Images

Aeneas introduces several technical innovations that set it apart from general-purpose language models.儘管大規模的LLM需要數十億個文檔,但題詞的專業性質和高質量掃描的有限可用性需要更量身定制的解決方案。

該模型的功率來自基於變壓器的複雜,基於變壓器的建築。 At its core is a T5 decoder that processes character sequences, augmented with specialized neural networks, or “heads,”each tailored for a specific epigraphic task like restoration, dating, or attribution, as detailed in the project’s foundational紙

一個關鍵的突破是它可以在缺失段的長度未知的文本中恢復差距的能力,這對歷史學家來說是一個常見和困難的問題。埃涅阿斯使用特殊符號來表示這種不確定性,並採用輔助網絡來預測是否需要一個或多個字符,使其成為現實世界情景的用途更廣泛的工具。

此外,AENEAS是使用多模態輸入的第一個模型,可以使用多模態輸入,以確定插入的地理學。視覺網絡分析了物理對象,允許模型將其形狀和佈局與其內容一起考慮,這是題詞研究的關鍵方面。

整個系統都經過了新彙編的拉丁語epigraphic數據集(LED)的培訓。這個大規模的語料庫,其中包含176,000多個銘文,從主要的學術數據庫中進行了協調。該模型使用此數據為每個文本創建歷史上豐富的“嵌入”,捕獲微妙的模式,這些模式超出了簡單的關鍵字搜索。

從理論到實踐:田野中的AENEAS

該模型的性能已嚴格進行了基準標記。它可以將銘文歸因於62個羅馬省之一,其準確性為72%,日期文本平均在歷史學家提供的範圍的13年之內。

在一個引人入勝的案例研究中,AENEAS分析了著名的Res Gestae Gestae Gestae Divi Augusti,Emperorus對其成就的說明。該模型產生了雙峰日期分佈,該分佈定量地反映了學術上的辯論,並確定了專家使用的相同語言和歷史標記。

合作研究進一步證實了其實踐價值。使用埃涅阿斯的歷史學家看到他們的獨奏表現有所改善,90%的參與者報告說該工具的建議促使了新的研究思想。一位歷史學家稱讚其影響力,他說:“埃涅阿斯(Aeneas)的相似之處完全改變了我對銘文的看法。它注意到了細節,這些細節使文本恢復和按時間順序歸因於文本。 ”

,但是,一些專家仍然謹慎樂觀。哈佛大學教授凱瑟琳·科爾曼(Kathleen Coleman)指出,“從長遠來看,尚不清楚歷史學家對歷史學家的工作流程有多麼有用。倡議是將AI應用於基本研究挑戰的戰略努力。 This portfolio includes tools like AlphaFold for protein structure prediction and AlphaGenome for genetic research.

This work follows a clear pattern of developing domain-specific AI that can parse vast, complex information spaces to accelerate discovery, as also seen with models like AlphaGeometry2 for mathematics and others for hurricane forecasting.

This project also reflects a commitment to open science. AENEAS模型,其代碼和基礎數據集均通過專用網站和 github reposority 公開獲得。作為發布的一部分,以前的 ithaca型號for古希臘語 與AENEAS更強大的建築相似。正如諾丁漢大學的題詞人Thea Sommerschield所說:“在博物館或剛剛發現新銘文的考古遺址時,請在您身邊,這是我們的夢想場景。”

。 ”

Categories: IT Info