利用AI 有望快速破译五千年前楔形文字
來源:大纪元考古专家估计,世上有100万块写有楔形文字的泥板,其中90%仍未被翻译出来。图为伊拉克北部城市摩苏尔博物馆中带有楔形文字铭文的文物碎片。(Zaid Al-Obeidi/AFP)
【大纪元2023年12月10日讯】(大纪元专题部记者吴瑞昌编译报导)伊朗美索不达米亚文明出土的楔形文字泥板,多数尚未破译。最近德国科学家开始利用AI破解这些泥板上的内容,而且有望快速破译。美索不达米亚文明与古中国、古印度和古埃及一起称为四大古文明。该古文明大约5000年前就开始使用苏美语,最终被阿卡德语所取代,但这两种语言都以楔形文字进行书写,苏美人被认为是世界上最早使用文字的种族之一,他们在泥板(黏土片)上书写楔形文字。当时苏美人占领了现代的伊拉克及伊朗、科威特、叙利亚的部分地区和土耳其,而该文明大约在公元前2004年正式结束,并逐渐融入亚摩利人的城邦,直至公元前18世纪被巴比伦文明取代。因此,留下的楔形文字板不仅是用多种语言书写的,而且还有数千年的历史。考古专家估计,世界上仍然存在一百万块泥板,但这些留下的楔形文字,需要考古学家进行繁琐的工作,才能翻译和编录泥板上的内容,且目前大约有90%的楔形文字文本仍未被翻译出来。从过去解开的泥板内容可以看到,从大到建造壮举寺庙的细节,一直小到客户因铜矿石的交付感到不满意,而进行的服务投诉。若未来能解读这些内容,将帮助现代人了解5000年前的古代生活细节和历史变迁。为此,德国马丁路德‧哈勒维腾贝格大学(Martin-Luther-Universität Halle-Wittenberg,MLU)、约翰内斯‧古腾堡大学(Johannes Gutenberg University)和美因茨应用科技大学(Mainz University of Applied Sciences)团队想到解决翻译的办法。团队训练AI电脑进行辨别和学习美索不达米亚文明的苏美语和阿卡德语,再让它辨别这些3D的楔形文字,以快速解析泥板上的内容。这项研究被写成论文,于11月底被发表到《欧洲图形与文化遗产研讨会》。由于这种楔形文字是以3D的形式呈现在泥板上,但文字经过时间磨损和泥板处理的问题,其品质严重受到影响,因此过去难以扫描到电脑中,提供历史学家和考古学家进行研究和翻译。此外,这种泥板经常没有上下文,通常只有一小串文本内容,因此考古学家很难解读出其原本的真实含义,就像人们试图通过阅读一本书的一段小句子去理解一整本书的内容一样。因此,该团队的研究人员使用了近2,000块楔形文字板的3D模型让AI学习和辨别,同时向AI程式输入了21,000个符号和4,700个楔形符号,创建了一个新的资料集,可供其他想要研究楔形文字的研究人员使用,而AI使用的数据大部分由美因茨应用科技大学提供。团队开发的AI新系统,能比以前的方法更好地破解字符。其工作原理与光学字元辨识(optical character recognition,OCR)软体基本相同,后者将书写的文字和文本转换成机器可读的文字形式。这种方法有很多优点,一旦转换成电脑文本,文字就可以更容易阅读或搜寻。AI在工作过程中会对楔形文字进行拆解,确保每个标志都会被裁剪成单一图像,以便它能对楔形文字进行辨别和学习,之后工作人员修正其错误,再让AI继续辨别楔形文字,借此提高AI辨识能力和准确度。为了测试该种AI的可靠性,他们让AI去辨识其它未辨识过的泥板。结果显示,AI可以准确地检测楔形文字和符号,其准确率最高可达76%。虽然AI在某些情况下的准确性仍有待加强,原因是有些文字变形或叠加,导致AI无法正常辨识,但AI经过多次训练后,对于泥板照片3D文字识别准确性会有所提高。另外,AI的分析能力不仅仅是适用于保存性完好的泥板,对于那些保存较差的泥板也能辨识出来。MLU的硕士生恩斯特‧斯托茨纳(Ernst Stötzner)对该大学新闻室解释道,“OCR技术通常适用于照片或扫描,应用在辨识纸上或羊皮纸上的墨水没问题,但用于辨识泥板上的楔形文字,就变得十分困难,因为拍摄这些泥板的光线和视角都会极大地影响某些字符的识别效果。”他接着表示,“不过,我们惊讶地发现,团队开发的系统可以很好地处理这些泥板照片,而这些照片实际上是一种较差的材料来源(泥板大多都有破损)。”MLU的助理教授与该篇论文作者休伯特‧马拉(Hubert Mara)则表示,“这些石板可以让我们得以一睹人类几千年前的过去,我们可以在泥板上面找到许多东西,从购物清单到法庭裁决。但它们已经风化严重,因此即使是受过训练的人也很难破解。要了解楔形文字板的内容一直是很困难的。”研究人员表示,目前已知共存在十二种楔形文字,但目前该AI只能够准确识别两种语言符号的原型。不过随着AI不断的开发和学习,未来可能辨识更多楔形文字,甚至能帮助破解严重风化的铭文,因为这些铭文与楔形文字一样都是三维的。该团队计划未来使用更大量的泥板样本去训练AI,以实现更准确的阅读,因为他们怀疑泥板样本数量相对较少可能会限制其能力。另外,他们希望把泥板样本中的图像切割成更小的部分,以便AI需要处理的资讯更少,来提高其准确性。
页:
[1]