(通讯员:田益宁)为推动人工智能与人文社会科学深度交叉融合,助力领域自主知识体系数字化、模型化建设,2026年6月11日,由大数据科学研究院与管理学院主办的“人文社会科学学术大语言模型构建研究”专题讲座在兴文楼B区111学术会议室举行。讲座特邀南京理工大学教授、管理科学与工程博士生导师、计算机科学与技术硕士生导师沈思教授担任主讲人。大数据科学研究院院长王曰芬教授主持,来自管理学院、政治与行政学院、新闻传播学院等师生参加了此次讲座。

讲座中,沈思教授以团队最新研发成果——国内首个人文社会科学领域学术大语言模型“兰章”为依托,围绕项目背景、开发经验、实践落地等内容进行学术分享。首先,沈教授介绍“兰章”依托百亿词元的坚实数据基础以及两阶段深度优化训练,较好地解决了当前通用AI工具在人文社科全文本挖掘、复杂概念和论证逻辑理解方面的“盲域”和“幻觉”问题。该模型不仅可以辅助用户系统地获取和梳理海量学术资源,还能够帮助人文社会科学领域学者总体评价既有成果并敏锐发现新的学术研究契机;其次,“兰章”研发团队历时五年,构建了总规模116亿词元的人文社会科学学术语料库,保证了学科的均衡覆盖以及期刊与著作的深度集成。经过深度优化训练,“兰章”表现显著优于多款通用模型,已上线魔搭社区试运行,15697条训练指令数据已全部开源共享;最后,沈教授表示,“大模型不是代替学者思考,而是立足实际学术研究,把自主知识体系的构建延伸到模型化和计算化的层面,从工具层面为人文社会科学学术创新提供持续支持。”期望大家能在技能互补的团队中工作,坚持以问题而非技术为导向,尝试以领域知识界定技术。报告后,沈教授就相关问题与在场师生展开深入交流,详细解答了大家提出的问题。
报告结束,王曰芬教授作总结发言并致感谢词。王曰芬教授表示:大数据和人工智能时代,人文社科与计算机学科交叉让信息资源的获取、处理、检索、推理和内容生成更智慧,沈教授的分享为我们打开了这扇思维之门,其研究经验充实且深有启发,亦可以迁移到文化传承创新、产学研协同创新、数字政府建设等情境中。” 通过此次活动,参会师生受益良多,一方面加深了对人工智能赋能人文社科研究的认知;另一方面,强化了跨学科开展科学研究和技术实践的意识。