
编者按
《国务院关于深入实施“人工智能+”行动的意见》提出,推动哲学社会科学研究方法向人机协同模式转变,探索建立适应人工智能时代的新型哲学社会科学研究组织形式,拓展研究视野和观察视域。
此前,《光明日报》曾推出专题报道《人工智能:来自科学,改变科学》,探讨了人工智能给自然科学研究带来的变化。本期走进哲学社会科学领域,邀请到北京师范大学文学院教授王立军谈谈在日常研究工作中使用AI的探索和思考。
古籍整理与研究有了得力“助手”
一部未经整理的古籍,其字形认同、句读标点、词义考辨、典故溯源,每一项工作都对研究者的专业学养和时间投入提出极高要求。传统的人工整理模式不仅周期长、成本高,也因专业人才的稀缺,使得大量古籍文献难以得到及时有效的整理和利用。我们一直在思考,能否借助现代科技,为这项古老而崇高的事业注入新的能量?
人工智能技术的快速发展,为我们提供了解决这一难题的新思路。2022年,在国家文化数字化战略的指引下,我们团队获批承担国家语委重大项目,致力于利用人工智能前沿技术,攻克古籍整理数字化和智能化中的关键难题。
这条道路充满挑战。通用大语言模型在标引或释读古汉语文本时,容易出现内容篡改和事实性错误等“幻觉”现象,无法做到对古汉语专业领域知识的准确理解。因此,我们选择从头训练垂直领域模型,利用大规模、高质量的专业古籍语料来应对通用大语言模型的这一弊端。为致敬近代国学大师章太炎先生,我们将该模型命名为“AI太炎”。过去,一位学者整理一部典籍的初稿可能需要数月乃至数年;如今,“AI太炎”能在短时间内完成一部古籍文本的自动标点、注释生成、文白翻译、典故提取等基础性工作。
然而,这并不意味着AI将取代学者。恰恰相反,它将我们从大量烦琐、重复的基础劳动中解放出来,使我们能够聚焦于更具深度和创造性的学术探究。譬如,在汉语词义的演变研究中,我们利用“AI太炎”的智能释义技术,对近2亿字语料进行全量标注。当古今汉语词汇的意义流变轨迹,以系统性数据的形式清晰呈现时,我们得以用一种全新的、数据驱动的方式,去观察和分析语言演变的宏观规律。这在过去是难以想象的。
学术成果的生命力在于其社会价值。我们积极推动“AI太炎”在多元场景中落地应用:与出版机构合作,将AI融入古籍数字化整理的工作流程;研发多语种翻译功能,支持将文言文翻译为英、法、俄、日等语言;建设文言文知识库和分级阅读语料库,研发学习难点自动识别、知识点自动关联等教学辅助技术,服务一线语文教学需求……
当然,我们对AI的应用边界和潜在风险保持高度的审慎。首先,AI并非全知全能,对于知识盲区和复杂情境可能输出不准确内容,因此其结果应作为“参考”而非“定论”,专业人士的审核把关不可或缺。其次,要警惕因技术依赖导致的思维惰性,尤其在人才培养中,原典阅读和句读训练等传统方法仍十分必要。此外,人文学科更应坚守人文关怀和对文史知识的深刻洞察——AI虽能高效处理信息,却难以触及文字背后的复杂情感和深邃思想。人文学者的创造力与洞察力,始终是古籍整理与研究中不可替代的核心。
作为新时代人文学科的研究者,我们既要积极拥抱技术变革,也要坚定守护人文学科的核心价值与学术精神。我们相信,通过人机协同的创新实践,那些沉睡在典籍中的古老智慧,必将得到更有效的活化与传承,在新时代绽放出更加璀璨的光芒。
原文刊发于《光明日报》2026年3月25日,作者王立军,系北京师范大学文学院教授、汉字汉语研究与社会应用实验室主任。
原文链接:https://app.gmdaily.cn/as/opened/n/b22e555350844511856c5a39acf8277a