古籍数字化迈入新阶段 智能技术助力传统文化保护创新发展

长期以来,古籍整理面临“资料浩繁、人员稀缺、周期漫长”的突出矛盾。

一方面,我国古籍数量庞大、版本复杂、传抄刊刻异文众多,整理工作要求严谨、校勘细密;另一方面,能够胜任整理编纂的专业队伍培养周期长、投入高,传统模式多依赖少数专家以手工方式完成,导致不少古籍整理进度与社会需求之间存在落差。

如何在保证学术规范与质量底线的前提下,提高整理效率、扩大覆盖范围,成为业界共同关切。

此次在北京举行的“数智时代古籍数字化前沿论坛暨‘我用AI校古籍’(2025年)总结会”,对上述问题给出了阶段性实践答案。

论坛由全国高等院校古籍整理研究委员会主办,北京大学中文系古典文献教研室、北京大学数字人文研究中心与字节跳动公益联合承办。

会议梳理了过去一年古籍保护与数字化整理方面的探索成果,并围绕数智时代古籍研究的转型与创新展开研讨。

从原因看,古籍整理提速扩面,既来自技术进步带来的工具变革,也来自组织方式的重构。

一方面,智能整理平台在文字识别、版本比对、标点断句、校勘提示等环节提供辅助,使大量“可规范化、可流程化”的基础工作得到有效分担;另一方面,平台化协作让高校师生、志愿者与专业编委形成分工链条:基础粗校依托规模化参与快速推进,关键环节由专业力量把关,逐步形成“人机协同、分层校核”的工作机制。

与会专家指出,这种机制不是用工具替代学术判断,而是通过提高基础环节效率,把更多时间和能力投入到辨伪存真、学术阐释与体系化整理之中。

会议期间,《儒藏》50部正式上线“识典古籍”平台,成为论坛关注的一个样本。

相关负责人介绍,自2024年底项目启动以来,在平台支持下,由12名编委参与,用较短时间完成50种书稿的整理编纂。

对照既往经验,《儒藏》精华编(中国部分)510种书稿整理曾动员400余位专家、历时18年完成,年均整理约28种。

两者对比折射出:在坚持编纂规范与学术流程的前提下,数智工具与协作机制有望显著提升生产效率,并为大型典籍工程的持续推进提供新的组织路径。

影响层面,数智化实践正在带来多重外溢效应:其一,降低古籍整理的参与门槛,扩大社会动员能力。

在“我用AI校古籍”(2025年)总结会上,主办方介绍,该活动自2024年启动以来,吸引全国1450余所高校的3.7万名大学生及志愿者参与,累计完成15亿字粗校,覆盖约2万部古籍。

通过任务拆分与流程化训练,参与者在实践中接触典籍、掌握基础校读方法,形成“以学促研、以研促传”的公共文化参与模式。

其二,推动古籍资源开放共享,助力教学科研。

数据显示,“识典古籍”平台已向社会免费开放超4.7万部古籍,为4000多个团队提供整理支持,并支撑多所高校开展教学实践、推进科研项目、培育专业人才。

这为文史研究的数据化、可计算化奠定了基础,也为跨学科合作打开空间。

其三,促进学科转型与人才培养结构调整。

全国高等院校古籍整理研究委员会副秘书长吴国武介绍,高校系统正在逐步打破“依赖专家学者人工整理”的传统模式,越来越多将智能工具深度融入学科建设与人才培养,推动古典文献学与数字人文等方向融合发展。

北京大学中文系教授杨海峥结合古典文献学发展脉络指出,数智技术正在重塑研究范式与方法结构,为古籍研究的现代化升级提供新的学术坐标。

对策方面,业内普遍认为,数智赋能要走得更稳、更远,需要在“效率”与“质量”之间建立可验证的制度化平衡。

首先,完善分层校勘与质量控制体系,明确粗校、复校、精校、定稿等环节标准与责任边界,形成可追溯的版本管理与审校记录,避免“快而不准”。

其次,强化专业把关与学术规范,将智能工具定位为辅助性基础设施,在异文判断、义理阐释、版本源流等核心环节坚持专家审定,防止概念混淆与误用。

再次,推进高校课程与实践项目联动,形成“教学—训练—项目—成果”闭环,在真实任务中培养既懂文献又懂工具的新型人才。

最后,推动资源共建共享,鼓励更多整理成果以开放、可复用的方式服务公共文化,形成“多方参与、共同受益”的良性生态。

前景判断上,数智技术将进一步推动古籍整理从“单点工程”迈向“平台工程”。

随着工具能力提升、数据积累增加与规范体系完善,古籍整理有望实现更广覆盖、更高效率与更强协同,但同时也对学术共同体提出更高要求:既要拥抱新工具带来的生产力提升,也要守住学术底线与文化价值导向。

未来,围绕高质量文本、可靠版本谱系、可核验校勘链条以及跨学科研究方法的建设,将成为古籍数字化从“量的扩张”走向“质的提升”的关键。

当智能技术遇见千年典籍,这场跨越时空的对话正在重新定义文化传承的边界。

从皓首穷经到人机协同,古籍数字化不仅是一场技术革命,更是一次对传统文化生命力的深度激活。

在数智浪潮中守护文明根脉,需要既保持对历史的敬畏,又葆有面向未来的创新勇气——这正是新时代古籍整理工作留给我们的双重命题。