首页 | 官方网站   微博 | 高级检索  
     

融合格框架的基于语块的依存树到串日汉统计机器翻译模型
引用本文:吴培昊,徐金安,谢 军,张玉洁.融合格框架的基于语块的依存树到串日汉统计机器翻译模型[J].中文信息学报,2014,28(5):133-140.
作者姓名:吴培昊  徐金安  谢 军  张玉洁
作者单位:1. 北京交通大学 计算机与信息技术学院,北京 100044;
2. 三星中国通信研究院,北京 100028
基金项目:国家自然科学基金(61370130),国家国际科技合作专项资助(No. 2014DFA11350),北京交通大学人才基金(2011RC034)。
摘    要:该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,实现格框架与日汉依存树到串模型的融合。实验结果表明,该文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,同时,还可有效提高日汉统计机器翻译的译文质量。

关 键 词:日汉机器翻译  格框架  依存树到串模型  句法结构  

Chunk-based Dependency-to-String Model Using Case Frame for Japanese-Chinese Statistical Machine Translation
WU Peihao,XU Jinan,XIE Jun,ZHANG Yujie.Chunk-based Dependency-to-String Model Using Case Frame for Japanese-Chinese Statistical Machine Translation[J].Journal of Chinese Information Processing,2014,28(5):133-140.
Authors:WU Peihao  XU Jinan  XIE Jun  ZHANG Yujie
Affiliation:1. School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China;
2. Beijing Samsung Telecom R&D Center, Beijing 100028, China
Abstract:This paper proposes a method to integrate case frame into Japanese to Chinese chunk-based dependency-to-string model. Firstly, case frames are acquired from Japanese chunk-based dependency analysis results. Secondly, case frames are used to constrain the rule extraction and the decoding in chunk-based dependency-to-string model. Experimental results show that the proposed method performs well on long structural reordering and lexical translation, and achieves better performance than hierarchical phrase-based model and word-based dependency-to-string model on Japanese to Chinese test sets.
Keywords:Japanese to Chinese SMT  case frame  dependency-to-string model  syntax structure  
本文献已被 CNKI 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号