北京那边最近有个挺有意思的论坛,叫“数智时代古籍数字化前沿论坛暨‘我用AI校古籍’(2025年)总结会”,把一堆最新成果都给亮出来了。这事儿吧,就说咱们那些老书,以前整理起来特别费劲,现在AI技术掺和进来,感觉整个行业都在变。大家伙儿凑一块,靠着“识典古籍”这种平台,硬是把1450多所高校的2万名大学生和1.7万名社会上的志愿者都给发动起来了。这就相当于给古籍整理建了个超级大的网络,现在已经把大概15亿字的粗活儿给干完了,覆盖了2万部书。这就跟以前那种光靠专家单打独斗不一样了,现在变成了大家伙儿一起干的社会化模式。 全国高等院校古籍整理研究工作委员会的秘书长卢伟说了,AI不光是让干活儿快了点,更关键的是把人力搞不定的海量文献给补上了,弄出了个“人机协同”的新路子。北京大学中文系的杨海峥老师也讲了不少门道。以前光是搞文字识别、标点断句这些就得靠人一点一点抠,现在光学字符识别(OCR)技术算是把这事儿给包办了,准确率特高。更厉害的是AI在自动标点、专名识别上的本事。以前比对不同版本得费老半天劲,现在AI自己就能把不同的版本对齐了,还能帮忙筛掉那些看着像但实际不对的字,直接生成结构化的校勘记录。这样一来,学者就不用在那些最累最没意思的基础性活计上死磕了,有更多精力去琢磨那些重要的异文、版本源流这些核心问题。 这种变化还把门槛给拉低了。本来干这个挺难的是个专业活计,现在变成了老百姓也能玩的东西。首都师范大学敦煌学的方晓辰博士在平台上弄《永乐大典》和《康熙字典》的时候就觉得挺爽。那些复杂的字她以前得一个一个查字典现在直接在电脑上一扫就出来了。她觉得科技把活儿干得又快又有意思,还让她真真切切感受到了技术的力量。等看到自己整的书上线后被别人引用讨论的时候那种成就感特别强。 不只是学生啊,各行各业的人都在掺和这事儿。在机场上班的张晓波利用业余时间跟团队里的老师学生一起弄《永乐大典》的精校。他说这项目让“古籍”从那种看不着摸不着的符号变成了可以亲手修的鲜活存在。这就叫技术连着传统跟现代。 这么大规模的数字化实践意义可大了去了。它加速了珍贵资料的保存和开放获取,也让更多人参与进来保护文化遗产。大家一块儿努力不光是为了干活儿更是为了传承。3.7万名志愿者一块儿奋斗了15亿字的古籍初步整理工作这不光是一组数字更是技术人文结合的最好证明。