期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	5篇
免费	0篇

学科分类

工业技术

5篇

出版年

2010年	1篇
2007年	1篇
2004年	1篇
2002年	1篇
2001年	1篇

排序方式： 共有5条查询结果，搜索用时 15 毫秒

通过全局核降低高斯核的局部风险与基于遗传算法的两阶段模型选择

常群王晓龙林沂蒙陈清才《计算机研究与发展》2007,44(3):439-444

支持向量分类时,由于样本分布的不均匀性,单宽度的高斯核会在空间的稠密区域产生过学习现象,在稀疏区域产生欠学习现象,即存在局部风险.针对于此,构造了一个全局性次核来降低高斯核产生的局部风险.形成的混合核称为主次核.利用幂级数构造性地给出并证明了主次核的正定性条件,进一步提出了基于遗传算法的两阶段模型选择算法来优化主次核的参数.实验验证了主次核和模型选择法的优越性. 相似文献

Word sense disambiguation based on rough set

陈清才王晓龙赵健陈滨王长风《哈尔滨工业大学学报(英文版)》2002,9(2)

0　ＩＮＴＲＯＤＵＣＴＩＯＮＴｈｅｔａｓｋｏｆｗｏｒｄｓｅｎｓｅｄｉｓａｍｂｉｇｕａｔｉｏｎｉｓｔｏａｓｓｉｇｎａｓｅｎｓｅｏｆａｐｏｌｙｓｅｍｏｕｓｗｏｒｄｔｏａｓｐｅｃｉｆｉｃｃｏｎｔｅｘｔ.Ｉｔｉｓｊｕｓｔａｐｉｅｃｅｏｆｃａｋｅｆｏｒｍｏｓｔｏｆｕｓ .Ｂｕｔｅｖｅｎｎｏｗａｄａｙｓ,ｔｈｉｓｔａｓｋｉｓｔｏｏｈａｒｄｆｏｒａｃｏｍｐｕｔｅｒｔｏｆｉｎｄａｎａｐｐｌｉｅｄｍｅｔｈｏｄｆｏｒｒｅａｌａｐｐｌｉｃａｔｉｏｎｓ.Ｉｔｉｓｎｏｗａｎｄｅｒｔｈａｔｓｏｍｅｒｅｓｅａｒｃｈｅｒｓｎａｍｅｄ… 相似文献

一种基于词矢量的汉语语义量化模型 总被引：6，自引：0，他引：6

陈清才王晓龙《计算机研究与发展》2001,38(2):207-212

通过建立基于词矢量的汉语语义量化模型来解决语义信息的自动获取及量化问题,描述了模型的建立方法及其在汉语词义排歧中的应用,最后通过构造伪词的方法对模型的语义辨识能力进行了评测。实验表明该语义量化模型具有很好的语义表示能力,并且由于模型的建立是通过对大规模生语料库的统计来完成的,避免了人工对词语语义进行量化时所需的庞大工作量,从而可以运用于许多与语义相关的自然语言处理任务中。相似文献

一种基于粗糙集的大规模语料库语言学知识发现模型

陈清才王晓龙赵健《计算机工程与科学》2004,26(5):56-61

文中首先通过语言学特征表来对文本信息进行结构化处理，同时实现了对远距离约束的表示；然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息，并利用规则抽取算法过滤特征表中不一致的部分，从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后，本文研究了模型在汉语词义排歧以及音字转换中的应用，在采用了动态规则平滑算法后，分别获得了0．93和0．95的判别精度以及0．92和0．89的覆盖率，这一结果显示模型具有很高的实用性。相似文献

基于最大频繁项集的搜索引擎查询结果聚类算法

苏冲陈清才王晓龙孟宪军《中文信息学报》2010,24(2):58-68

现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类,由于网页摘要篇幅较短,质量良莠不齐,聚类效果难以有较大的提高(比如后缀树算法,Lingo算法);而传统的基于全文的聚类算法运算复杂度较高,且难以生成高质量的类别标签,无法满足在线聚类的需求(比如KMeans算法)。该文提出一种基于全文最大频繁项集的网页在线聚类算法MFIC (Maximal Frequent Itemset Clustering)。算法首先基于全文挖掘最大频繁项集,然后依据网页集合之间最大频繁项集的共享关系进行聚类,最后依据类别包含的频繁项生成类别标签。实验结果表明MFIC算法降低了基于网页全文聚类的时间,聚类精度提高15%左右,且能生成可读性较好的类别标签。相似文献