面向平行语料库和多层次语言特征的英语翻译系统研究 |
| |
引用本文: | 晏芳,罗刚峰,司海峰.面向平行语料库和多层次语言特征的英语翻译系统研究[J].自动化与仪器仪表,2023(3):213-217. |
| |
作者姓名: | 晏芳 罗刚峰 司海峰 |
| |
作者单位: | 西安思源学院 |
| |
摘 要: | 针对传统英语翻译系统对于平行语料库和多层次语言特征的提取准确率低、翻译效果不佳的问题,提出基于深度可分离卷积的英语神经机器翻译方法。此方法根据英语的语言特征,将英语切分为词、音节、字符、子词四种不同层次的语言粒度,以此降低英语低频词数量;然后通过深度可分离卷积对基于注意力机制的神经机器翻译模型进行改进,得到深度可分离卷积的英语神经机器翻译模型。实验结果表明,在对汉语~汉语翻译的切分结果中,本模型的在英汉翻译的切分语粒度BLEU分数均保持在21%及以上,均高于传统的CNN模型和Transformer机器翻译模型。且对平行语料和多层次语言特征进行测试发现,本模型的训练时间仅为16 h, CNN模型和Transformer机器翻译模型的训练时间分别为18 h和24 h,训练时长比本模型高出11%左右。由此可知,本模型可提升英语翻译系统计算效率,模型训练和学习能力明显增强,计算量减少,特征提取效果显著提升。
|
关 键 词: | 平行语料库 多层次语言 英语翻译 深度可分离卷积 特征提取 |
|
|