期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑伟侯宏旭班志杰《计算机工程与应用》2020,56(13):194-198

专家发现是实体检索领域的一个研究热点，针对经典专家发现模型存在索引术语独立性假设与检索性能低的缺陷，提出一种基于贝叶斯网络模型的专家发现方法。该方法模型采用四层网络结构，能够实现图形化的概率推理，同时运用词向量技术能够实现查询术语的语义扩展。实验结果显示该模型在多个评价指标上均优于经典专家发现模型，能够有效实现查询术语语义扩展，提高专家检索性能。相似文献

2.

基于实例的汉蒙机器翻译

侯宏旭刘群那顺乌日图《中文信息学报》2007,21(4):65-72

本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配,并根据匹配词数和长度计算相似度,选取最好的实例。通过对齐信息,确定片段组合的策略,生成翻译结果。通过对方法的实现和实验,完成了一个基于实例的汉蒙机器翻译系统。相似文献

3.

融合先验信息的蒙汉神经网络机器翻译模型

樊文婷侯宏旭王洪彬武静李金廷《中文信息学报》2018,32(6):36-43

神经网络机器翻译模型在蒙古文到汉文的翻译任务上取得了很好的效果。神经网络翻译模型仅利用双语语料获得词向量,而有限的双语语料规模却限制了词向量的表示。该文将先验信息融合到神经网络机器翻译中,首先将大规模单语语料训练得到的词向量作为翻译模型的初始词向量,同时在词向量中加入词性特征,从而缓解单词的语法歧义问题。其次,为了降低翻译模型解码器的计算复杂度以及模型的训练时间,通常会限制目标词典大小,这导致大量未登录词的出现。该文利用加入词性特征的词向量计算单词之间的相似度,将未登录词用目标词典中与之最相近的单词替换,以缓解未登录词问题。最终实验显示在蒙古文到汉文的翻译任务上将译文的BLEU值提高了2.68个BLEU点。相似文献

4.

蒙汉神经机器翻译研究综述

侯宏旭孙硕乌尼尔《计算机科学》2022,49(1):31-40

机器翻译是利用计算机将一种语言转换成另一种语言的过程,凭借着对语义的深度理解能力,神经机器翻译已经成为目前主流的机器翻译方法,在众多拥有大规模对齐语料的翻译任务上取得了令人瞩目的成就,然而对于一些低资源语言的翻译任务效果仍不理想.蒙汉机器翻译是目前国内主要的低资源机器翻译研究之一,蒙汉两种语言的翻译并不简单地是两种语言... 相似文献

5.

“短彩连连发”稽核技术研究

辛强侯宏旭姜鑫明玉《计算机应用与软件》2012,29(5):207-208

"短彩连连发"稽核系统利用信息化技术手段加强业务稽核工作,改变以前完全依靠人工稽核的工作模式。该系统用特定算法生成测试例,模拟用户短信转发行为,以确定"短彩连连发"平台短信转发量计数是否正确。经实验表明,"短彩连连发"稽核技术能够取得较好的稽核效果,可以用于实际系统进行稽核操作。相似文献

6.

2005年度863机器翻译评测方法研究与实施 总被引：3，自引：2，他引：3

侯宏旭刘群张玉洁井佐原均《中文信息学报》2006,20(Z1):7-18

为了能够全面了解国内外机器翻译技术的现状,促进机器翻译技术的研究,2005年度863计划机器翻译评测于2005年9月举行.本次评测进行了汉英、英汉、汉日、日汉、日英、英日6个语言方向,两种类型的评测以及汉英词语对齐的评测.本次评测采用了网上评测的形式,利用基于N-gram的NIST、BLEU以及人工评测方法对各系统的结果进行评测.本文给出了此次评测的组织、准备、过程、结果及分析.为国内外研究单位在机器翻译方面的进一步研究提供了数据. 相似文献

7.

一种基于短语的汉蒙统计机器翻译与调序模型 总被引：2，自引：0，他引：2

侯宏旭刘群李锦涛《高技术通讯》2009,19(5)

根据蒙古语的一些特点,为基于短语的汉蒙统计机器翻译提出了一种适合于汉蒙统计机器翻译的调序模型,并给出了相应的训练和解码算法以及初步实验的结果.汉蒙双语语料库规模很小,数据稀疏问题严重,而在汉蒙翻译中,词序变化又非常明显,在汉英等机器翻译中使用的调序方法难于应用到汉蒙统计机器翻译中.通过对汉蒙翻译过程中词语顺序变化的正态分布假设,建立了一种概率调序模型.实验表明,这种概率调序模型好于Moses系统中采用的调序方法. 相似文献

8.

基于统计翻译框架的蒙古文自动拼写校对方法

苏传捷侯宏旭杨萍员华瑞《中文信息学报》2013,27(6):175-180

在以国际标准编码存储的传统蒙古文电子文本中,拼写错误十分普遍。人工校对这些错误不仅速度慢而且成本高。该文提出了一种基于统计翻译框架的传统蒙古文自动拼写校对方法,将拼写校对看作是从错误词到正确词的翻译。该文使用改进的基于短语的统计机器翻译模型来构建拼写校对模型,然后对测试文本进行校对。实验结果表明,该方法可以快速、有效地校对拼写错误,而且不依赖于特定语言的语法知识。使用该方法对包含1 026个正确词、1 102个错误词的测试集进行拼写校对,校对后文本中的正确词所占比例最高可达97.55%。相似文献

9.

2005统计机器翻译研讨班研究报告 总被引：4，自引：1，他引：4

徐波史晓东刘群宗成庆庞薇陈振标杨振东魏玮杜金华陈毅东刘洋熊德意侯宏旭何中军《中文信息学报》2006,20(5):3-11

2005年7月13日至15日,中国科学院自动化研究所、计算技术研究所和厦门大学计算机系联合举办了我国首届统计机器翻译研讨班。本文主要介绍本次研讨班参加单位的测试系统和实验结果,并给出相应的分析。测试结果表明,我国的统计机器翻译研究起步虽晚,但已有快速进展,参评系统在短期内得到了较好的翻译质量,与往年参加863评测的基于规则方法的系统相比性能虽还有差距,但差距已经不大。从目前国际统计机器翻译研究的现状和发展趋势来看,随着数据资源规模的不断扩大和计算机性能的迅速提高,统计机器翻译还有很大的发展空间。在未来几年内,在基于短语的主流统计翻译方法中融入句法、语义信息,必将成为机器翻译发展的趋势。相似文献

10.

子字粒度切分在蒙汉神经机器翻译中的应用

任众侯宏旭吉亚图武子玉白天罡雷颖《中文信息学报》2019,33(1):85-92

在蒙汉神经机器翻译任务中,由于语料稀少使得数据稀疏问题严重,极大影响了模型的翻译效果。该文对子字粒度切分技术在蒙汉神经机器翻译模型中的应用进行了研究。通过BPE算法将切分粒度控制在字符和词之间的子字粒度大小,将低频词切分成相对高频的子字片段,来缓解数据稀疏问题,从而在有限的数据和硬件资源条件下,更高效地提升模型的鲁棒性。实验表明,在两种网络模型中使用子字粒度切分技术,BLEU值分别提升了4.81和2.96,且随着语料的扩大,训练周期缩短效果也更加显著,说明子字粒度切分技术有助于提高蒙汉神经机器翻译效果。相似文献