使用AI平台阅读旧字迹
使用人工智能,计算机可以破译手写文本并使每个人都可以阅读。由奥地利因斯布鲁克大学共同开发的Transkribus平台使这项技术可供学者和公众使用。越来越多的人正在使用Transkribus来研究他们的家族史。最近,来自世界各地的用户齐聚因斯布鲁克。
笔迹和人一样有个性。然而,今天的计算机能够自动识别各种语言的笔迹。由因斯布鲁克大学共同开发的Transkribus软件平台使这项技术可供科学界、档案馆和公众使用。来自世界各地的90,000多名用户已经在使用该平台使手写文档具有可读性和可搜索性。越来越多的人对他们的家族历史感兴趣,并开始在教会记录、合同或其他历史文件中寻找他们的祖先。
“手动搜索这些文件可能是一项非常乏味的任务。我们的技术现在使研究家族史变得更加容易,”奥地利因斯布鲁克大学数字化和数字归档工作组的GünterMühlberger说,他是董事会主席欧洲合作社READ-COOP。
快速搜索大型馆藏
档案馆和图书馆保存着价值不可估量的历史文献。这些文件占用了大量空间。例如,奥地利国家档案馆的文件占据了350公里的货架。这些文档中的大多数仅以手写形式提供,并且对于许多用户来说不再可读,因为它们是用一种名为Kurrent的脚本编写的,这是一种基于中世纪晚期草书的旧式德语手写体。
“这就是Transkribus平台派上用场的地方,它可以自动识别这种笔迹,从而使每个人都可以阅读,”GünterMühlberger解释道。此外,还可以轻松搜索文档。这使得使用历史收藏的研究变得更加容易,因为可以同时搜索成百上千的文档以查找姓氏或其他术语。
Transkribus与神经网络一起工作。这种机器学习方法具有很大的优势,您不再需要为每种类型的写作手动识别程序。“用户教机器阅读笔迹,”GünterMühlberger说。“而且机器不会累,这意味着它可以自动处理数千、数十万或数百万页。这就是我们为芬兰国家档案馆所做的事情,例如,超过200万份手写文件可以追溯到到19世纪,现在每个人都可以搜索。”
所使用的技术完全独立于语言和实际脚本或写作类型。Transkribus不仅可以识别德国的Kurrent或现代笔迹,还可以识别中世纪的文字,以及希伯来语、阿拉伯语或语的笔迹。“而现在,我们正在对古代汉语进行试验,”Mühlberger补充道。
对研究人员有很大帮助
在科学和人文学科中,Transkribus的应用是多方面的。例如,因斯布鲁克古典语言学家威廉·巴顿(WilliamBarton)在Transkribus的帮助下获得了120万欧元的START奖,他解码了19世纪被认为丢失的KarlBenediktHase的日记条目,用手写的古希腊语书写.其中包含的宝贵信息将可供其他研究领域使用。
“学者KarlBenediktHase的私人和秘密日记包含九年的记录。文本量巨大,大约有2,500页,”新拉丁研究系的威廉巴顿解释说。“我训练机器根据100页来模拟Hase的笔迹。现在它能够阅读他的所有日记并可靠地转录文本。”爱丁堡大学最近的一项研究表明,在Transkribus的帮助下,现已出版了400多篇科学出版物。
标签: