首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   32篇
  免费   5篇
  国内免费   8篇
工业技术   45篇
  2012年   1篇
  2011年   1篇
  2009年   5篇
  2008年   3篇
  2007年   4篇
  2006年   4篇
  2005年   5篇
  2004年   9篇
  2003年   3篇
  2002年   4篇
  2001年   4篇
  2000年   1篇
  1992年   1篇
排序方式: 共有45条查询结果,搜索用时 15 毫秒
1.
郑家恒  张辉 《计算机应用》2002,22(11):1-2,25
以2000年11-12月《人民日报》网页中涉及社会,经济、法律等内容的50万汉字语料为基础,利用基于隐马尔可夫模型并结合概念估值公式来评价在真实广西中构成组织机构名的能力,实现了中国组织机构名自动识别系统,实验研究表明准确率达89%,召回率为94.5%。  相似文献   
2.
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一.在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法.与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量.  相似文献   
3.
基于遗传算法和隐马尔可夫模型的Web信息抽取的改进   总被引:1,自引:0,他引:1  
直觉模糊蕴涵是直觉模糊推理的重要基础,为直觉模糊集在不确定信息系统下推理和决策中的应用提供了理论基础。对直觉模糊蕴涵进行了研究。首先回顾了直觉模糊的有关基础知识,在此基础上构造了一种新的广义的直觉模糊蕴涵,证明了其单调性、边界性等系列重要性质,最后证明了该蕴涵可构成直觉模糊剩余格。  相似文献   
4.
语料库词性标注一致性检查方法研究   总被引:4,自引:0,他引:4  
在对大规模语料库进行深加工时,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法,该方法避开了以前一贯采用的规则或统计的方法,利用聚类和分类的思想,对范例进行聚类并求出阈值,对测试数据分类来确定其标注的正误,进而得出每篇文章的词性标注一致性情况,进一步保证大规模语料库标注的正确性。  相似文献   
5.
基于粗糙集的文本分类方法研究   总被引:8,自引:3,他引:8  
本文旨在利用粗糙集优越的约简理论对文本进行分类。主要完成了以下几个方面的任务:对文本进行了预处理;改进了Okapi 权重计算公式,并对权值进行了离散化;实现了属性约简和规则抽取,首先利用区分矩阵对特征向量维数进行了初次压缩,然后通过相对约简计算再次压缩了特征向量维数,并生成了决策规则;采取了规则合成的策略,生成最终的决策规则;设计了一种文本与规则的匹配算法,使匹配过程尽可能简单有序。试验结果表明该方法是行之有效的。  相似文献   
6.
基于加权类轴的Web文本分类方法研究   总被引:1,自引:0,他引:1  
为了更有效的组织Intemet上丰富的信息资源,通过分析传统的近邻文本分类方法技术以及web文本的特点,提出了一种新的简单有效的网页分类方法。该方法充分利用了web文本的结构信息进行特征词加权,以类轴向量为核心构建分类器。实验表明,此方法具有较高的准确率和召回率。  相似文献   
7.
提出了一种从正确标注的训练语料中自动获取兼类词词性较对规则的方法 ,并设计和实现了相应的词性自动校对系统。通过对中文文本进行自动校对 ,进一步提高其词性标注质量  相似文献   
8.
中文文本语料库分词一致性检验技术的初探   总被引:5,自引:0,他引:5  
对大规模语料库中的分词不一致现象进行分析,提出了语料库分词一致性检查和校对的新方法。该方法提取词与词之间语法、语义搭配信息,利用支持向量机的理论对候选序列进行判断,给出一个切分结果,进而提高汉语语料库切分的准确率。  相似文献   
9.
制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,对兼类词语境进行向量分类,判定兼类词词性标注是否一致,得出每篇文章的词性标注的一致性情况,并测试了北京大学的150万语料。  相似文献   
10.
分词及词性标注一致性校对系统的设计与实现   总被引:9,自引:0,他引:9  
针对真实语料中分词、词性标注结果前后不一致的现象提出了基于规则库的校对方法与策略 ,设计了一致性校对系统 ,进一步提高分词、词性标注的正确率。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号