古籍数字化迈向新阶段 智能技术助力传统文化保护创新发展

随着古籍保护与利用需求持续增长,传统整理方式面临效率与覆盖面的双重压力。

一方面,古籍数量庞大、版本复杂、异体字与讹误并存,单靠专家逐字校勘周期长、成本高;另一方面,公众对中华优秀传统文化的学习需求不断提升,数字化传播要求更快形成可检索、可比对、可引用的高质量文本资源。

如何在保证学术规范与质量底线的同时,提高整理效率、扩大供给能力,成为古籍整理与研究领域的现实课题。

问题的形成,与长期以来古籍整理高度依赖稀缺专家资源密切相关。

古籍整理需要目录学、版本学、校勘学等综合能力,培养周期长、参与门槛高,致使不少重要典籍的整理出版与开放共享速度难以匹配社会需求。

同时,数字时代对文本结构化、可计算化提出新要求:不仅要“看得见”,更要“用得上”。

在这一背景下,学术机构与技术平台的协同探索,成为推动古籍整理现代化的重要路径。

此次论坛由全国高等院校古籍整理研究委员会主办,北京大学中文系古典文献教研室、北京大学数字人文研究中心与相关公益力量联合承办,集中呈现了“平台化支撑+高校体系参与”的阶段性成果。

会上,《儒藏》50部正式上线“识典古籍”平台。

相关负责人介绍,自2024年底项目启动以来,在平台支持下,由12名编委参与,不到一年即完成50种书稿的整理编纂。

对比来看,《儒藏》精华编(中国部分)510种书稿的整理曾动员400余位专家历时18年完成,年均整理约28种。

对照数据表明,新型工具在流程提速、协作组织、文本比对等环节对生产效率产生明显带动作用,但“提速”并不等同于“替代”,学术规范仍需由专家体系把关。

从影响看,这一实践至少带来三方面变化。

其一,古籍整理的“供给能力”得到提升。

平台让文本获取、切分、比对、标注、版本参照等环节更加标准化,减少重复性劳动,为专家把更多精力投入关键疑难与学术判断创造条件。

其二,古籍整理的“参与结构”出现拓展。

总结会环节介绍,“我用智能工具校古籍”活动自2024年启动以来,吸引全国1450余所高校3.7万名大学生及志愿者参与,累计完成15亿字粗校,约覆盖2万部古籍。

通过把粗校、标点纠错、字符核对等基础任务拆分并规范化,专业门槛有所降低,传统文化传播与社会教育的联动效应更为显著。

其三,古籍资源的“开放共享”持续推进。

截至目前,“识典古籍”平台向社会免费开放超4.7万部古籍,为4000多个团队提供整理支持,并支撑多所高校开展教学实践、推进科研项目、培育专业人才。

资源开放不仅方便学术研究,也有助于形成更广泛的公共文化服务。

同时也要看到,数智化推进古籍整理并非一蹴而就,质量控制与标准体系建设尤为关键。

粗校覆盖面扩大后,如何在后续精校、校勘记撰写、版本依据说明、引文出处核对等环节持续闭环,决定最终学术成果的可信度。

论坛讨论中,全国高等院校古籍整理研究委员会副秘书长吴国武介绍了高校系统在古籍整理研究方面的数智化实践,强调高校正逐步突破单纯依赖专家人工整理的传统模式,将智能工具深度融入学科建设与人才培养。

北京大学中文系教授杨海峥则从古典文献学发展脉络出发,分析数智技术驱动下学科转型的趋势与核心方向,为古籍研究的现代化升级提供参考。

学界观点指向一个共识:工具可以重塑方法,但学术标准、价值判断与历史语境理解仍是古典文献整理的根本。

面向下一步,对策建议可聚焦“标准、人才、治理”三条主线:一是完善统一规范,推动字形规范、版本标识、校勘规则、元数据结构等标准化,提升跨团队协作与成果互认能力;二是以高校为枢纽强化人才培养,将平台化整理纳入课程与科研训练,通过真实项目锻炼学生的文献意识与学术规范;三是健全质量治理机制,形成“任务分层—过程留痕—抽检复核—专家终审”的闭环,确保效率提升不以牺牲严谨性为代价。

展望未来,古籍数字化将从“资源上线”迈向“深度可用”。

随着更多典籍完成高质量整理并开放,面向检索、对读、引用、知识关联的深加工能力有望提升,进一步服务学术研究、基础教育与文化传播。

同时,公众参与在扩大文化影响力的同时,也将倒逼更清晰的工作流程与质量标准,让古籍整理从单一出版目标,转向兼顾学术研究与公共文化服务的综合体系。

古籍数字化不仅是技术革新,更是文化传承方式的深刻变革。

当智能技术遇上千年典籍,不仅焕发出传统文化的新活力,也为文化自信建设提供了有力支撑。

在科技与人文的交汇处,我们正见证一场静默而深刻的文明传承革命,这既是传统文化的当代重生,也是数字中国的文化表达。