DeepMind最新AI模型,开始破译古希腊铭文了?( 二 )


当前 , 自然语言处理(NLP)模型通常会使用大量单词来进行训练 , 因为这些单词在句子中出现的顺序与它们之间的关系可以提供额外的含义 。 比如 , “onceuponatime”一起出现 , 就比单个字符或单词更有含义 。
在此次研究中 , Ithaca是基于帕卡德人文学院(PackardHumanitiesInstitute)提供的最大希腊碑文数字数据集训练的 。
为确保Ithaca模型在使用缺失字符时仍能正常进行训练 , 研究人员同时将单词和单个字符作为输入 , 模型核心的稀疏自我注意机制并行地评估这两个输入 , 允许Ithaca根据需要评估铭文 。
结果表明 , Ithaca的设计决策和可视化辅助可以帮助历史学家更容易地复原铭文 , 强大的人机合作潜力 , 有助于更好地还原历史真相 , 甚至帮助解决一些争议性问题 。
例如 , 历史学家们对雅典颁布的一系列重要法令的日期存在分歧 , 这些法令是在苏格拉底和伯里克利等著名人物在世时期颁布的 , 被认为是在公元前446/5年之前书写的 。 而Ithaca与历史学家一起 , 将这一日期更新到了公元前424/3年 。
DeepMind最新AI模型,开始破译古希腊铭文了?
文章图片
图|碑文记录了迦尔西斯城对雅典的效忠誓言 。 (来源:卫城博物馆)
放眼历史长河 , 尽管这两个数字看起来差别不大 , 但这些法令对当前人类理解古雅典的政治史是至关重要的 。
此外 , 历史学家们也与Ithaca一起 , 重新复原了希腊历史上一次关于雅典卫城的法令 。
DeepMind最新AI模型,开始破译古希腊铭文了?
文章图片
DeepMind最新AI模型,开始破译古希腊铭文了?
文章图片
图|修复后的铭文记录了一项关于公元前485/4年雅典卫城的法令 。
Ithaca的架构侧重于协作、决策支持和可解释性 。 尽管单独使用Ithaca修复受损铭文的准确率只有62% , 但当与历史学家们协同工作时 , 可以将人类的准确率从25%提高到72% 。
这一变化证明 , Ithaca具有强大的协同效应 。
“学者们不会被取代 , 相反 , Ithaca就像一只猎犬 , 会为学者寻找线索 , 但不做最后的决定 。 ”英国伦敦国王学院(King'sCollegeLondon)荣誉退休教授CharlotteRoueche?在评论文章中表示 。
Roueche?认为 , 这一进步不应该被解读为对上百年传统的威胁 , 而应该是对传统的一种补充 。 人工智能不应该让学者变得多余 , 而应该是挑战他们对自认为已经知道的东西的理解 。
原文链接:
https://www.nature.com/articles/s41586-022-04448-z
https://en.wikipedia.org/wiki/Writing_system