首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 95 毫秒
1.
神经机器翻译在资源丰富的语种上取得了良好的翻译效果,但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳。目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据。考虑到单语数据的可利用性,在回译方法的基础上,首先将利用大量单语数据训练的语言模型与神经机器翻译模型进行融合,然后在回译过程中通过语言模型融入语言特性,以此生成更规范质量更优的伪平行数据,最后将生成的语料添加到原始小规模语料中训练最终翻译模型。在汉越翻译任务上的实验结果表明,与普通的回译方法相比,通过融合语言模型生成的伪平行数据使汉越神经机器翻译的BLEU值提升了1.41个百分点。  相似文献   

2.
大规模平行语料库的缺乏是低资源神经机器翻译面临的关键问题之一。提出语言模型蒸馏的神经机器翻译方法,通过单语语言模型对神经机器翻译训练进行正则化,引入语言模型包含的先验知识以提升翻译效果。具体地,借鉴知识蒸馏思想,使用丰富单语数据训练的目标端语言模型(教师模型)构造低资源神经机器翻译模型(学生模型)的正则化因子,让翻译模型学习到语言模型中高度泛化的先验知识。与传统单语语言模型融合参与解码过程不同的是,本文方法中的语言模型只在训练阶段使用,不参与推断阶段,因此能够有效提升解码速度。在第十七届全国机器翻译大会CCMT2021维吾尔语-汉语和藏语-汉语2种民汉低资源翻译数据集上的实验结果表明,相比目前最先进的语言模型融合方法,BLEU提高了1.42%(藏汉方向)~2.11%(汉维方向)。  相似文献   

3.
近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注.然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息.此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题.针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和...  相似文献   

4.
随着“一带一路”倡议的深入推进,沿线国家和地区之间的跨语言沟通需求日渐增长,机器翻译技术逐渐成为各国之间深入交流的重要手段。然而,这些国家存在大量低资源语言,语料的稀缺性导致其机器翻译研究进展较为缓慢。针对该问题,提出一种基于NLLB模型改进的低资源语言机器翻译训练方法。首先基于多语言预训练模型提出一种改进的训练策略,该策略在数据增强的前提下,对损失函数进行优化,从而在机器翻译任务中有效提高低资源语言的翻译性能;然后使用ChatGPT以及ChatGLM模型分别评估老挝语-汉语以及越南语-汉语的翻译能力,大语言模型(LLM)已具备一定的翻译低资源语言的能力,而且ChatGPT模型在越南语-汉语翻译任务上已经大幅超越传统的神经机器翻译(NMT)模型,但是在老挝语上的翻译性能还有待进一步提高。实验结果表明,在4种低资源语言到汉语的翻译任务上,相比NLLB-600M基线模型,平均提升了1.33个双语替换测评(BLEU)值以及0.82个chrF++值,从而充分证明了该方法在低资源语言机器翻译任务上的有效性。此外,该方法使用ChatGPT和ChatGLM模型分别对老挝语-汉语以及越南语-汉语进行了...  相似文献   

5.
针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。  相似文献   

6.
稀缺资源语言神经网络机器翻译研究综述   总被引:1,自引:0,他引:1  
李洪政  冯冲  黄河燕 《自动化学报》2021,47(6):1217-1231
作为目前主流翻译方法的神经网络机器翻译已经取得了很大突破, 在很多具有丰富数据资源的语言上的翻译质量也不断得到改善, 但对于稀缺资源语言的翻译效果却仍然并不理想. 稀缺资源语言机器翻译是目前机器翻译领域的重要研究热点之一, 近几年来吸引了国内外的广泛关注. 本文对稀缺资源语言机器翻译的研究进行比较全面的回顾, 首先简要介绍了与稀缺资源语言翻译相关的学术活动和数据集, 然后重点梳理了目前主要的研究方法和一些研究结论, 总结了每类方法的特点, 在此基础上总结了不同方法之间的关系并分析了目前的研究现状. 最后, 对稀缺资源语言机器翻译未来可能的研究趋势和发展方向进行了展望,并给出了相关建议.  相似文献   

7.
译文质量估计是机器翻译领域中一个重要的子任务,该任务旨在不依靠参考译文的情况下对机器译文进行质量分析.当前,译文质量估计任务在汉英、英德机器翻译上有较好的表现,技术相对成熟.但是将模型应用到汉-越神经机器翻译中面临较多问题.尤其是译文质量估计模型在汉越平行数据中提取到的语言特征不能够充分地体现汉语与越南语之间的语言特点,加之汉语与越南语之间语序与句法结构也存在明显的差异.针对上述问题,本文采用统计对齐的方法对汉越之间结构差异进行建模,提取汉语与越南语之间的语言差异化特征,以提升汉越译文质量估计的效果.实验结果表明,融入语言差异化特征在汉-越和越-汉两个方向上较基线模型分别提升了0.52个百分点和0.35个百分点.  相似文献   

8.
针对传统英语翻译系统对于平行语料库和多层次语言特征的提取准确率低、翻译效果不佳的问题,提出基于深度可分离卷积的英语神经机器翻译方法。此方法根据英语的语言特征,将英语切分为词、音节、字符、子词四种不同层次的语言粒度,以此降低英语低频词数量;然后通过深度可分离卷积对基于注意力机制的神经机器翻译模型进行改进,得到深度可分离卷积的英语神经机器翻译模型。实验结果表明,在对汉语~汉语翻译的切分结果中,本模型的在英汉翻译的切分语粒度BLEU分数均保持在21%及以上,均高于传统的CNN模型和Transformer机器翻译模型。且对平行语料和多层次语言特征进行测试发现,本模型的训练时间仅为16 h, CNN模型和Transformer机器翻译模型的训练时间分别为18 h和24 h,训练时长比本模型高出11%左右。由此可知,本模型可提升英语翻译系统计算效率,模型训练和学习能力明显增强,计算量减少,特征提取效果显著提升。  相似文献   

9.
依赖于大规模的平行语料库,神经机器翻译在某些语言对上已经取得了巨大的成功.无监督神经机器翻译U N MT又在一定程度上解决了高质量平行语料库难以获取的问题.最近的研究表明,跨语言模型预训练能够显著提高U N MT的翻译性能,其使用大规模的单语语料库在跨语言场景中对深层次上下文信息进行建模,获得了显著的效果.进一步探究基...  相似文献   

10.
神经机器翻译是目前主流的机器翻译方法,但在汉-越这类低资源的机器翻译任务中,由于双语平行语料规模小,神经机器翻译的效果并不理想。考虑到预训练语言模型中包含丰富的语言信息,将预训练语言模型表征融入神经机器翻译系统可能对低资源的机器翻译有积极作用,提出一种融合BERT预训练语言模型与词嵌入双重表征的低资源神经机器翻译方法。首先,使用预训练语言模型和词嵌入分别对源语言序列进行表示学习,通过注意力机制建立2种表征之间的联系后,使用拼接操作得到双重表征向量;然后,经过线性变换和自注意力机制,使词嵌入表征和预训练语言模型表征完全自适应融合在一起,得到对输入文本的充分表征,以此提高神经机器翻译模型性能。在汉越语言对上的翻译结果表明,相比基准系统,在包含127 000个平行句对的汉越训练数据中,该方法的BLEU值提升了1.99,在包含70 000个平行句对的汉越训练数据中,该方法的BLEU值提升了4.34,表明融合BERT预训练语言模型和词嵌入双重表征的方法能够有效提升汉越机器翻译的性能。  相似文献   

11.
基于VSM的分布仿真软件适配器研究   总被引:1,自引:0,他引:1  
为满足针对航空、航天领域的大规模虚拟实验的要求,在认真研究适配器技术和基于以太网的VSM(虚拟共享内存)中间件的基础上,提出构造一种基于VSM机制的分布式仿真软件适配器和实时网VSM中间件来扩展已有的以太网VSM中间件的技术.根据松耦合系统与紧耦合系统的不同仿真需求,采用松耦合适配器和紧耦合适配器两种适配器对以太网VSM中间件进行浅层和深层两个层次的扩充.其中松耦合适配器已经在实际中得到应用,并取得了良好的效果.  相似文献   

12.
用Dytran建立具有过盈配合的弹性箱弹发射模型,并通过计算获得导弹发射安全性的量化指标、导弹离轨扰动规律及适配器与导弹的初步分离特性.研究结果表明,合理采用适配器发射方式可减小发射箱质量,降低发射箱生产安装精度.  相似文献   

13.
基于Internet的测控网络设计   总被引:1,自引:1,他引:0  
祁昶  黄天戍 《微计算机信息》2005,21(3):10-11,22
本文提出了一种新的基于Internet工业测控网络结构--"M&C网络节点".在该结构的基础上一个规模较大、结构复杂的企业测控网络中的一个厂房或车间的所有测控设备可看作是一个具有强大的通信和控制能力的测控节点--"M&C网络节点".通过采用具有通用性、开放性和可靠性的LonWorks现场总线可以非常方便地将安装在一个工业现场安装在一个相对集中区域的所有现场测控单元都集成成为一个节点.通过使用LonWorks串口适配器,"M&C网络节点"具有对工业现场的各种异型PLC设备的兼容性.同时LonWorks以太网适配器被作为"M&C网络节点"的Internet接口."M&C网络节点"的结构设计及两个通信接口(LonWorks串口适配器和LonWorks以太网适配器)的设计在本文中都有详细论述.  相似文献   

14.
随着因特网迅速发展,作为因特网的重要组成部分,局域网有着不可替代的地位。怎样安全高效维护局域网,怎样排除局域网经常出现的故障,怎样优化局域网,本文将对局域网容易出现的故障作了分析,并对局域网优化作了详细说明。  相似文献   

15.
针对企业间异构数据交换的研究和对不同数据交换标准的比较,选用BizTalk技术,设计实现基于BizTalk(的以XML为标准格式的企业之间异构数据交换系统模型。该模型对能够直接提供XML文件的系统,向BizTalk交换中心递交XMLSchema后实现与其它企业的交互:对于不提供XML格式文件的系统设计了直接与数据库(以实时数据库为例)进行交互的适配器,并给出数据转换算法。  相似文献   

16.
在嵌入式系统领域,低速同步串行总线广泛使用,PC无法直接访问这些总线;介绍了一种USB到同步串行协议转换的通用适配器用于访问串行同步总线接口的设备,讨论了通用适配器的硬件电路、相关传输协议、时序分析、CPLD程序设计,描述了如何编写程序控制该通用适配器的通用步骤,以及实现USB到JTAG、SPI协议转换的一般方法;最后,使用该通用适配器实现了对一种SPI接口4线触摸屏控制器的访问;该通用适配器为嵌入式开发提供了一种灵活、便捷、强大的工具。  相似文献   

17.
HomePNA是最近发展起来的宽带接入技术,它可以利用现有用户电话线路为用户提供宽带上网服务。本文首先对HomePNA技术进行了简要的介绍,随后着重讲述了具有以太网接口的HomePNA适配器的工作原理和具体设计实现。  相似文献   

18.
自动测试系统(ATS)已广泛应用于各种武器装备的维护和保障领域,其体系结构也得到越来越广泛而深入的研究。在已有研究成果的基础上,通过一种基于信息的ATS模型,详细分析各组成部分的信息构成,给出了信息模型下的ATS结构。  相似文献   

19.
针对企业间异构数据交换的研究和对不同数据交换标准的比较,选用BizTalk技术,设计实现基于BizTalk的以XML为标准格式的企业之间异构数据交换系统模型。该模型对能够直接提供XML文件的系统,向BizTalk交换中心递交XML Schema后实现与其它企业的交互;对于不提供XML格式文件的系统设计了直接与数据库(以实时数据库为例)进行交互的适配器,并给出数据转换算法。  相似文献   

20.
基于适配器的软件总线体系结构在软件复用中起着核心作用,它提高了构件组装的透明性和可行性。软件总线体系结构对构件接口一致性的要求非常高,而适配器作为构件与总线的交互媒介起到了协调包装的重要作用。本文从适配器的结构出发,对其内部功能元进行分解及语义描述,并列举了适配器包装及功能实现两个例子。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号