河南省学业规划中心

logo

科研支持:北京学信信息科学研究院

“计算古文字学”正在路上


2023-01-16 10:50  光明日报  浏览量:10741

尽管甲骨文常让人想到“古老”二字,但在甲骨文的研究历程中,各种前沿科技的运用屡见不鲜,并为甲骨学进步作出了很大贡献。甲骨学与计算机的结合就是这样的例子。早在20世纪80年代,甲骨文字的计算机编码研究就已展开,通过创建专门的字库、设计专用的输入法,甲骨文得以进入数字空间。20世纪90年代开始,两岸三地的甲骨文数据库次第兴起,各具特色的数据库不仅丰富了甲骨文的信息存储和管理方式,也促使甲骨文研究模式开始从纸质化向电子化转变。这些基础性先导工作,既是在甲骨学和计算机之间搭建了一座桥梁,同时也昭示了学科协同的无限可能。

近年来,人工智能技术突飞猛进,推动甲骨学与计算机深度结合。人工智能使得计算机功能更强大,与甲骨学结合的领域更多样化,涌现了一批引人注目的成果。比如,利用计算机缀合甲骨,早在20世纪70年代,便有学者发文探讨其可行性。受当时算力和算法的限制,一直难以取得实际效果。而随着人工智能技术的介入,近年来,已有多家机构实现了突破,这一设想终于成为现实。再比如识读甲骨文,过去只能依靠古文字学家的眼目,而现在有些小程序利用手机拍照功能,便让普通大众也能认出一些甲骨文。除此以外,甲骨图像校重、甲骨材质分类、甲骨文字体辨识、甲骨文残辞预测等等,这些过去只有甲骨学家才能涉足的领域,现在也都可以看到计算机的影子。

在甲骨学与计算机深度结合的背后,还有着更深的学科发展背景。放眼世界,“人工智能+古文字”的浪潮正席卷而来。以色列发现的“死海古卷”曾被称为20世纪最重要的考古发现,人工智能通过“虚拟拼图”帮助残卷复原,又通过辨析古卷上的笔迹类型,推测出“死海古卷”的撰写人数。著名的人工智能团队Deepmind与古希腊文专家合作,不仅使得古希腊文字的修复准确率不断提高,而且还确定了这些文字的书写时期。所以,甲骨学与计算机的深度结合,也正是这一波浪潮中的一朵浪花。

为什么人工智能会与古文字碰撞出如此多火花呢?因为二者有很多天然的契合点。人工智能近期取得突破的重要领域,恰好能与古文字密切联系起来。比如,大家都很熟悉的人脸识别运用的是人工智能的图像识别技术,所有古文字本质上都是一种平面图像,识别起来并没有什么特殊的困难。再如,运用广泛的语音识别、机器翻译,本质上是人工智能的自然语言处理技术,而古文字是古代语言的一种书面形式,当然也可以成为自然语言处理的对象。还有大家经常用到的搜索引擎,背后都有知识图谱的加持,利用其中蕴含的知识,搜索引擎才越来越智能。而古文字问题的解决,也离不开语言、历史、文化等知识的应用。结合知识图谱技术,便可以让这些知识服务于古文字研究。可以说,人工智能取得重要突破的这些领域,自然而然会让人与古文字研究发生联想。

在人工智能的助推下,古文字与计算机已经从初步连接开始走向深度结合,“计算古文字学”正在路上。与计算机素有渊源的甲骨学,无疑又走在这一深度结合的前列,“计算甲骨学”已经启航。伴随着这种深度结合,新的合作模式正在成型,新的发展特征正在显现。笔者认为,以下几个方面或将代表计算甲骨学未来发展的趋势。

首先,创新性研究是深度结合的发展方向。计算机具有运算速度快、存储容量大等特点,利用好这些特点,发挥计算机在大数据处理方面的优势,计算甲骨学便能获得创新性发展。以甲骨缀合、甲骨校重等这些传统甲骨学题目为例,过去依靠人力很难保证全面性和穷尽性,而随着人工智能技术的成熟和进步,通过系统而全面的整理便可展现出创新的前景。过去由于数据量太大,做不好或不能做的题目,也都将成为计算甲骨学可以重点发力的方向。

其次,综合性研究是深度结合的必然要求。过去计算机所参与的甲骨学题目,都是一些性质很单一的问题。但甲骨学是一门综合性学科,真正要解决一个问题往往会牵涉众多方面。以甲骨文字考释为例,其困难程度极高,一个重要原因便是考释过程涉及众多问题。著名古文字学家杨树达曾有言:“每释一器,首求字形之无牾,终期文义之大安,初因字以求义,继复因义而定字。义有不合,则活用其字形,借助于文法,乞灵于声韵,以假读通之。”可见,只有把文字的形、音、义三者都综合起来处理好,才可能真正解决甲骨文字考释的问题。所以,单一化结合是一种初级形态,综合化模式才能面对更复杂的任务。

最后,学科交融度将是决定深度结合成败的关键因素。笔者了解到,一些计算机界的朋友为了做好结合工作,主动学习甲骨学知识。而一些年轻的甲骨学者也开始接触了解人工智能,甚至学习编程语言。这样做的好处是显而易见的,任何深度合作都离不开相互学习。计算机并不是万能的,人工智能在面对因果理解、自然语言理解和推理等问题时,还存在比较大的困难。只有依靠学科交融、密切协作,才能逾越这些障碍、顺利前行。

古文字学与计算机,将在计算古文字学中谱写新的篇章。

(作者:莫伯峰,系首都师范大学甲骨文研究中心教授)