基于分析和生成的复述与SMT语料扩展 |
| |
引用本文: | 和为,刘挺.基于分析和生成的复述与SMT语料扩展[J].哈尔滨工业大学学报,2013,45(5):45-50. |
| |
作者姓名: | 和为 刘挺 |
| |
作者单位: | 哈尔滨工业大学 计算机科学与技术学院, 150001 哈尔滨
;哈尔滨工业大学 计算机科学与技术学院, 150001 哈尔滨
|
| |
基金项目: | 国家自然科学基金面上资助项目(6,2);国家高技术研究发展计划重大资助项目(2011AA01A207). |
| |
摘 要: | 为了解决统计机器翻译语料对调序现象覆盖不足的问题,采用复述方法对语料进行扩展.提出了一种基于依存分析和句子生成的复述方法.对句子进行依存分析得到依存树,然后从依存树生成多个自然语言句子.生成的句子与原句相比没有词汇上的改变,但可以在词序方面进行变换.实验表明方法在不引入额外资源的前提下,有效缓解了语料覆盖不足的问题,提高了机器翻译质量.
|
关 键 词: | 复述 统计机器翻译 依存分析 句子生成 |
Parse-realize based paraphrasing and SMT corpus enriching |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《哈尔滨工业大学学报》浏览原始摘要信息 |
|
点击此处可从《哈尔滨工业大学学报》下载全文 |
|