北京科技大学赵秋荣教授讲座一:从数据驱动到智能生成——大语言模型时代语料库翻译学的转向与发展

作者:阐释学研究院        时间:2025-10-17


20251013日下午,应广东外语外贸大学阐释与国际传播研究院邀请,北京科技大学教授,博导,翻译学科带头人国家翻译协同创新中心”(中国海洋大学)兼职研究员赵秋荣教授在科研楼一楼演播厅举办了一场题为“从数据驱动到智能生成——大语言模型时代语料库翻译学的转向与发展”的学术讲座。讲座由阐释与国际传播研究院院长陈开举教授主持,吸引了来自英文学院、高级翻译学院及其他多个院系的教师代表和博士、硕士研究生的积极参与。

 

赵秋荣教授在讲座中

讲座伊始,赵教授指出语料库近年来发展迅速并备受重视,其中一个重要方向便是语料库翻译学。无论是基于语料库的研究,还是以翻译为本的探讨,所培养的人才在就业市场上往往备受青睐。随后赵教授回顾了语料库翻译学的发展历程,进一步梳理了其演进脉络。自1995Baker教授建立世界上第一个翻译英语语料库(TEC)以来,语料库方法逐渐成为翻译研究的重要工具。语料库不仅用于研究翻译共性,还广泛应用于译者风格、翻译规范、翻译过程等方面的研究。赵教授介绍了常用的语料库工具,包括在线平台(如CQP webSketch Engine)和离线工具(如AntConcLancsBox),并强调掌握这些工具对推动翻译学研究的重要性。

讲座的核心部分,赵教授结合自身研究,展示了语料库方法在翻译研究中的具体应用:在《虚义动词“做”的变迁》研究中发现,“做”在翻译汉语中的使用频率显著高于原创汉语,体现了源语渗透效应与目标语规范的共同作用。基于鲁迅作品英译的对比分析发现,译出文本在句法上更简化、显化,而译入文本则更倾向于复杂名词结构,体现了翻译方向对语言特征的影响。以《传习录》英译为例,研究发现译者多重身份对译本生成具有系统性影响,并构建了“译者多重身份差异影响路径”模型。赵教授重点探讨了大语言模型对翻译研究的冲击与推动。她通过三个案例展示了LLM译文与人工译文的对比分析:案例一:《春蚕》人机译本依存句法比较。研究发现,LLM译文在主语、宾语等功能词上的句法复杂度高于人工译文,但在补语、状语等结构上则低于人工译文,反映出LLM译文作为“受限语言”的句法特征。案例二:机器翻译语言特征研究。通过随机森林分类器分析,研究发现翻译文本与原创文本在词汇多样性、句法结构等方面存在显著差异,而不同机器翻译系统之间风格接近,存在“机器翻译腔”。案例三:可选连词“that”的使用研究。研究发现,翻译英语中“that”的使用频率显著高于原创英语,体现了翻译过程中的显化现象。LLM译文在“that”使用上表现出更高的频率和一致性,反映了其训练数据的泛化倾向。最后,赵教授指出,语料库翻译学正面临从“数据驱动”向“智能生成”的转型。她呼吁学者拓展研究视野,关注社交媒体、众包翻译、译后编辑等新兴语料,并加强语料库翻译与口译研究的融合。同时,她强调研究方法应更加透明、可复现,推动该领域走向成熟。

讲座现场 

田璐博士总结道,赵教授的讲座首先从行业发展的现实维度切入,揭示了语料库在翻译实践中的不可或缺性,成功引发了大家的浓厚兴趣。进而,她上升到理论层面,系统梳理了领域内权威的翻译能力模型,并带领我们重温了从早期开创性研究到她本人前沿工作的学术谱系。这一过程生动地向我们展示:如何站在前人的肩膀上,逐步寻找到自己的研究突破口,从而实现学术创新。随后,师生们就讲座主题进行了热烈的讨论,赵教授都一一耐心解答。期盼未来有更多这样深刻的学术交流,为人类文明进步贡献更多智慧。

 

 

广东外语外贸大学阐释学研究院  地址:广东省广州市白云大道北2号广外科研楼5楼
邮编:510420