共查询到20条相似文献,搜索用时 484 毫秒
1.
2.
Toshiaki Nakazaw Manabu Yaguchi Kiyotaka Uchimoto Masao Utiyam Eiichiro Sumit Sadao Kurohashi Hitoshi Isahar 何彦青 刘建辉 《情报工程》2017,3(3):040-046
本文详细介绍了ASPEC(亚洲科学论文摘录语料库)。作为首个大规模的科学论文领域内的平行语料库,ASPEC 是由日- 中机器翻译项目于 2006 年至2010 年间利用科技促进专用协作基金构建起来的。它包含约300 万条平行语句的日- 英科学论文摘要语料库(ASPEC-JE)和约68万条平行语句的中- 日科学论文摘录语料库(ASPEC-JC)。ASPEC 被用作机器翻译评测研讨会WAT(亚洲翻译研讨会)的官方数据集。 相似文献
3.
近两年来,神经机器翻译(Neural Machine Translation, NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation, SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。 相似文献
4.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。 相似文献
5.
平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成本高效率的平行语料构建方法,利用枢轴语言作为桥梁,借助已有的机器翻译技术并融合主动学习方法构建目标语言对的大规模高质量平行语料库。本文通过以英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,描述了基于译文自动评测的良好译文选择方法、基于主动学习的语料选取方法、以及翻译系统的更新迭代和评价实验。实验结果表明,本文提出的方法能够快速构建日汉平行语料,并有效提高日汉翻译系统的性能。 相似文献
6.
毛军 《图书情报工作动态》2005,(9):21-22
2005年9月14日至15日,“日中意见交流会——为日中科学技术信息交流的加强与合作”在日本东京召开,本次会议主题是“对于电子期刊、文献数据库、查新、研究开发等所需数据库的现状和相互合作的可能性”,会议由日本科学技术振兴机构(以下简称JST)主办,来自中国科技信息所(ISTIC)、日本国立情报学研究所(Nii)、日本国会图书馆(NDL)等共40余家中日图书文献情报机构的近60名代表参加了为期2天的会议。 相似文献
7.
李 颖乔晓东 杨兴兵Soichi Kubota Noriko Arakawa Yoshiko ShirokizawaSanho Lee Tae-sul Seo 《中国科技资源导刊 (中国信息导报)》2012,(6):81-85
为促进亚洲各国之间的科技信息资源共享和科研合作,在这些区域内,通过一站式服务获取相关信息至
关重要。3 年前,基于谅解备忘录(MOU),中国科学技术信息研究所(ISTIC)、日本科学技术振兴机构(JST)及韩国
科学技术信息研究院(KISTI)建立了基于现有DOI 系统的长期合作机制。首先概要介绍分别由三机构运行管理的各自
国家的DOI 系统,以及三国之间的国际合作进展。然后,通过引入云服务平台的概念,提出未来的合作框架,以进一
步促进资源共享。 相似文献
8.
目前统计语言模型在语音识别、机器翻译和自动文摘等领域得到了广泛的应用.准确判别通过语言模型所得到的句子是否连贯、通顺,对于语言模型的评测和改进是个很重要的问题.本文采用基于词频统计的一组特征项,利用决策树算法自动对生成句的语义连贯性进行评测,在需要生成或识别连贯句的各自然语言处理领域具有广泛的实用价值. 相似文献
9.
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题.常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合.在对不同级别的系统融合技术进行分析的基础上,本文提出基于词和短语的多机器翻译系统融合方法.首先,采用词级的系统融合技术构建混淆网络,将混淆网络转化为短语表.然后,基于该短语表利用短语级的系统融合技术中的再解码方法进行混淆网络解码生成融合结果.该方法既保证了融合系统所构建的混淆网络的最大可能性,又可以利用更多的特征进行混淆网络解码.我们将基于词和短语的多机器翻译系统融合方法在两个测试集上分别实验并进行比较,获得了较为满意的翻译效果. 相似文献
10.
跨语言检索中机器翻译技术的应用和进展 总被引:2,自引:0,他引:2
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展.文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点,特别是近年来统计机器翻译的发展.本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析.最后对机器翻译在跨语言检索中的应用前景做出了展望. 相似文献
11.
12.
13.
跨语言信息检索方法概述 总被引:4,自引:0,他引:4
本文介绍了跨语言信息检索问题的由来与发展,通过对单语言信息检索技术的介绍引入了跨语言检索的关键问题,并分别介绍了跨语言信息检索中基于词典、基于语料和基于机器翻译模块这三种主流方法,最后对跨语言检索的一体化方法等较新的思想和跨语言检索评测等做了简要说明. 相似文献
14.
机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。 相似文献
15.
16.
《中国科技资源导刊 (中国信息导报)》1999,(4)
本刊讯1999年3月23-26日,万方数据(集团)公司参加了由信息产业部、科学技术部和中国贸促会在中国国际展览中心主办的“’99世界计算机博览会(中国)”(Comdex/China'99)。这是万方数据(集团)公司首次以参展商的身份参加国际性信息产... 相似文献
17.
18.
本文探讨了网上机器翻译的分类、可用性、国际国内的市场应用状况和在中国开发网上机器翻译的紧迫性 ,最后提出了目前存在的主要问题 ,并展望了网上机器翻译的发展新趋势 相似文献
19.