首页 | 官方网站   微博 | 高级检索  
     

融合特定语言适配模块的多语言神经机器翻译
引用本文:刘俊鹏,苏劲松,黄德根.融合特定语言适配模块的多语言神经机器翻译[J].计算机科学,2022,49(1):17-23.
作者姓名:刘俊鹏  苏劲松  黄德根
作者单位:大连理工大学计算机科学与技术学院 辽宁 大连 116024,厦门大学信息学院 福建 厦门 361005
基金项目:国家重点研发计划(2020AAA0108004)。
摘    要:多语言神经机器翻译利用单一的编码器-解码器模型对多种语言之间的翻译同时进行建模。多语言神经机器翻译不仅能够促进关联语言之间的知识迁移,提高低资源语言的翻译质量,并且能够实现未见语言对之间的翻译。现有多语言神经机器翻译仍然存在语言多样性建模能力不足和未见语言对翻译质量不佳的问题。为此,首先在现有的适配器模型基础上提出变维双语适配器模型,在Transformer模型的每个子层之间加入双语适配器以抽取每个语言对的独特特征,并通过改变适配器隐层维度调整编码器和解码器两端的特定语言表达空间;其次,提出一种共享单语适配器模型,对每种语言的独特特征进行建模。在IWSLT多语言翻译数据集上的实验结果表明,变维双语适配器模型能够显著提升多语言翻译的性能,而单语适配器模型能够在不影响多语言翻译性能的条件下提高未见语言对的翻译质量。

关 键 词:多语言神经机器翻译  特定语言建模  双语适配器  单语适配器

Incorporating Language-specific Adapter into Multilingual Neural Machine Translation
LIU Jun-peng,SU Jin-song,HUANG De-gen.Incorporating Language-specific Adapter into Multilingual Neural Machine Translation[J].Computer Science,2022,49(1):17-23.
Authors:LIU Jun-peng  SU Jin-song  HUANG De-gen
Affiliation:(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China;School of Informatics,Xiamen University,Xiamen,Fujian 361005,China)
Abstract:
Keywords:Multilingual neural machine translation  Language-specific modeling  Bilingual adapter  Monolingual adapter
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号