5月20日,由中华书局和清华大学中国古典文献研究中心联合发起的“《数字人文》专家面对面”系列讲座活动首期开讲。
《数字人文》是由清华大学和中华书局联合主办,旨在为数字人文研究提供发表平台的学术期刊。活动邀请《数字人文》三位主编:清华大学计算机科学与技术系教授孙茂松、人文学院教授刘石和中华书局执行董事周绚隆,以《浅谈人工智能背景下的数字人文》为题进行分享。
中华书局古联公司副总经理、《数字人文》副主编朱翠萍介绍,“《数字人文》专家面对面”系列讲座活动将以《数字人文》发表的论文成果为线索,邀请作者亲身解读研究思路和方法,讨论跨学科研究领域的数字人文问题,以期更多专业的人文学者关注数字人文研究成果、利用数字人文方法和手段进行学术研究。
刘石认为,在深度学习技术的快速发展下,数字人文正在经历从数字化向知识化的转变,从简单的搜索转向更为复杂的分析与研究。数字人文技术不仅为人文研究带来新的材料和视野,而且能够更新人文研究的范式和路径。在数字时代,对数字人文的重视需要上升到文化发展战略的高度来看待。数字人文是工程性项目,需要合作,需要大量的人力与财力的投入,期待通过此次讲座,能有更多人关注数字人文。当然,更重要的是期待能够有更多的人投入到数字人文相关研究中,共同为中国的数字人文发展作出贡献。
孙茂松提出,追求相关知识的完备性是数字人文的必要特征之一。怎样把人文原始材料提炼转化为适合计算机分析的对象,以及怎样利用计算机的分析结果来辅助解决人文问题,是数字人文所面临的挑战。数字人文技术主要用于帮助专家从难以驾驭的超大规模数字化人文材料中分析宏观趋势,具有较高的参考价值。
“数字人文的核心还是具有深刻性的人文研究,受囿于人工智能技术的局限性,要达到这个目标,依然任重道远。数字人文更重要的是解决学术研究的痛点问题,数字人文与人工智能技术的结合将在促进文化思想传播方面发挥巨大作用。”孙茂松指出。
事实上,深度学习技术在数字人文领域内可以有多种应用。较早进入公众视野的是人工智能写诗,其基本过程是循环神经网络对大量已有诗歌数据进行自动分析,通过其内置的注意力机制算出已生成上文中每个字的重要性,对产生下一个字的概率进行预测。依此逐字向前推进,写出诗歌。深度学习在数字人文的其他应用还有很多,例如生成绘画作品、根据句子生成图像、机器人绘画、AI作曲等等。
中华书局执行董事周绚隆指出,文献研究当前已经借用了数字人文的技术和成果。虽然数字技术基于历史数据,不能完全解决语义问题,但人文创作却需要不断寻求创新。从出版角度看,目前学者可用资料更多了,研究的内容自然也多了,但如果仅把数据库和分析工具的结果直接拿来应用到研究成果上并不可取。基于数据库的分析结果要基于人的研究和需求,剔除无用和垃圾信息,寻求和使用有针对性的数据和材料。
(责任编辑:韩梦晨)