期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

冯元勇孙乐董静李文波《中文信息学报》2007,21(6):22-28

共指消解是自然语言处理的核心问题之一。本文针对分步消解中分类器全局信息的不足,依据分类信心对全体提及配对进行排序,优先根据可靠的分类结果对提及进行聚集或分离。实验表明,该算法在多个学习框架下显著地改善了系统的整体性能。相似文献

2.

基于单字提示特征的中文命名实体识别快速算法 总被引：3，自引：1，他引：2

冯元勇孙乐李文波张大鲲《中文信息学报》2008,22(1):104-110

近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。相似文献

3.

基于小规模尾字特征的中文命名实体识别研究 总被引：4，自引：0，他引：4

下载免费PDF全文

冯元勇孙乐张大鲲李文波《电子学报》2008,36(9):1833-1838

本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征.实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度.该系统在我国863简体命名实体识别评测语料上专名(人名、地名和机构名)总体F1值达88.76%,超过当年最佳系统8.63个百分点.在SIGHAN 2006命名实体识别语料上的结果也居于前列. 相似文献

4.

基于非连续短语的统计翻译模型研究 总被引：1，自引：1，他引：1

张大鲲张玮冯元勇孙乐《中文信息学报》2007,21(1):101-108

目前统计机器翻译的主流方法仍然是基于短语的翻译模型。然而,该模型并没有考虑对非连续短语的处理。本文提出了一种基于非连续短语的统计翻译模型,利用该模型可以使翻译的基本单元从连续短语扩展到带有间隔的非连续短语,以更好地解决词语翻译时的上下文依赖问题。同时,由于该方法抽取的短语数量较少,也使得解码的效率得到了提高。实验表明,在效率提高的情况下,非连续短语模型可以取得与层次型短语模型相当的翻译结果。相似文献

5.

一种基于通信时间延迟的流量分配/路由选择算法

冯元勇《计算技术与自动化》2000,19(3):96-99

本文在分析传统流量拥塞控制算法机理及特点的基础上,提出了一种新的流量分配算法,该算法将两节点间链路时延作为线路物理特性、网络流量状况及节点处理能力等网络状态的概括,作为流量分配控制的动态因素,参与加权排队模型。链路状态的发布是在节点空闲时进行的,邻近节点可通过记录最近通信时间间隔（时延）作为衡量线路质量好坏的依据。最后,本文对该算法作了简单的性能分析。相似文献

6.

词汇搭配和用户模型在拼音输入法中的应用 总被引：1，自引：0，他引：1

张玮孙乐冯元勇李文波黄瑞红《中文信息学报》2007,21(4):105-110

中文输入法是中文信息处理的难题之一。随着互联网上中文用户的不断增加,中文输入法的重要性也变得日益突出。本文在对句子中长距离词汇依赖现象观察的基础上,抽取出语料库中的词汇搭配来获取长距离特征,并以此构建基于词汇搭配关系的拼音输入法系统;同时将词汇搭配的思想应用到拼音输入法的用户模型中,从而使我们的输入法系统能够辅助用户更加有效的输入。实验表明基于词汇搭配关系的改进方法对提高输入法的准确率有积极的作用。相似文献

7.

基于概念的文档评价模型 总被引：3，自引：0，他引：3

罗三定冯元勇沈德耀贾维嘉《计算机工程》2002,28(8):79-80,283

理解文档的内容和查询的真实意图是提高搜索引擎智能水平的一种有效途径。提出了一种以分析概念及其关系为基础来理解文档、揣摩查询意图的模型。在该模型中，结合用户背景知识构造一个用户概念库，将文档及查询要求转化为概念集，并适当扩充查询要求概念集，最后将两概念集转化为特征向量，计算其相似度，作为文档的评价值。文中详细给出了概念库及必需的概念运算的数学模型。相似文献

8.

基于业务对象模型的业务规则语言的设计及实现

徐黎糜宏斌冯元勇孙玉芳《计算机应用研究》2005,22(1):36-37,75

面向业务人员设计了一套类自然语言的业务规则语言，并根据其语法设计了规则语句编辑的在线提示算法，该算法能迅速提供与语法语义相容的词选项列表，引导用户完成规则录入。相似文献

9.

基于核方法的中文实体关系抽取研究 总被引：4，自引：1，他引：3

黄瑞红孙乐冯元勇黄云平《中文信息学报》2008,22(5):102-108

命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。相似文献

10.

基于业务对象模型的业务规则语言的设计及实现*

徐黎糜宏斌冯元勇孙玉芳 《计算机应用研究》2005,22(1):36-37

面向业务人员设计了一套类自然语言的业务规则语言,并根据其语法设计了规则语句编辑的在线提示算法,该算法能迅速提供与语法语义相容的词选项列表,引导用户完成规则录入。相似文献