首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
RSKNN算法是K近邻算法的一种改进算法,该算法基于变精度粗糙集理论,能在保证一定分类精度的前提下,有效地降低分类样本的计算量,并且提高计算效率和分类精度.由于RSKNN算法对属性的依赖度较高,在分类时容易受到伪近邻的影响,导致RSKNN算法的分类精度受到一定程度的影响.针对存在问题,本文提出一种新颖的基于RSKNN算法的改进算法SMwRSKNN,该算法在RSKNN算法的基础上引入类别子空间的思想,以降低冗余属性和伪近邻对分类的影响.在UCI公共数据集上的实验结果表明,SMwRSKNN算法比RSKNN算法具有更高的分类精度.  相似文献   

2.
传统的KNN算法存在分类效率低等缺点.针对这些缺点,本文提出一种高效的结合多代表点思想的加权KNN算法,利用变精度粗糙集上下近似区域的概念,结合聚类算法生成代表点集合构造分类模型,再运用结构风险最小化理论优化分类模型并对影响分类模型的因素进行分析.分类过程中根据测试样本与各代表点的相似度,得到测试样本的相对位置.其中属于样本点下近似区域的测试样本可直接判断其类别.若测试样本在其他区域,则根据测试样本与各代表点的相对位置对各代表点覆盖范围内的样本进行加权后判断测试样本的类别.在文本分类领域的数据集上进行实验,结果表明该算法能有效的提高分类模型的性能.  相似文献   

3.
最近邻分类的多代表点学习算法   总被引:4,自引:0,他引:4  
经典的k-最近邻算法存在参数k难以确定和分类效率低的缺点.基于模型的kNN算法使用代表点集合构造训练样本的分类模型,克服上述缺点,但需要较高的计算时间代价.文中提出一种高效的多代表点学习算法,用于最近邻分类.运用结构风险最小化理论对影响分类模型期望风险的因素进行分析.在此基础上,使用无监督的局部聚类算法学习优化的代表点集合.在实际应用数据集上的实验结果表明,该算法可对复杂类别结构数据进行有效分类,并大幅度提高分类效率.  相似文献   

4.
多代表点的子空间分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
多代表点近邻分类克服了传统近邻分类算法的缺点,使用以代表点为中心的模型簇构造分类模型并自动确定近邻数目.此类算法在不同类别的样本存在大量重叠时将导致模型簇数量增大,造成预测精度下降.提出了一种多代表点的子空间分类算法,将不同类别的训练样本投影到多个不同的子空间,使用子空间模型簇构造分类模型,有效分隔了不同类别样本在全空...  相似文献   

5.
6.
借助于论域子集的布尔列矩阵表示的思想,引入等价关系矩阵的诱导矩阵和矩阵的λ-截矩阵等概念,提出Pawlak粗糙集模型中概念上、下近似计算的矩阵方法,即利用论域子集的布尔列矩阵、论域上的等价关系矩阵和诱导矩阵三个矩阵间的运算来计算该子集的上、下近似集,并从理论上证明该方法的正确性.然后给出运用该方法计算论域子集上、下近似...  相似文献   

7.
通过在经典粗糙集模型中引入函数,得到了一个广义的变精度粗糙集模型和一个广义的概率粗糙集模型。将这两个广义的模型进行比较研究,又得到了一个更广义的粗糙集模型,这个模型既是变精度粗糙集模型的推广也是概率粗糙集模型的推广,对推广模型的性质做了相应的研究。  相似文献   

8.
粗糙集理论和概念格理论均为研究知识发现与不确定性决策问题的重要方法,二者之间紧密相关。在提出概念格上的变精度粗糙集的β-上、下近似定义的基础上,一方面,对于任意给定的变精度β,讨论了概念格上变精度粗糙集β-上、下近似的性质;另一方面,针对不可定义对象集,分别提出了概念格上的变精度粗糙集β-上、下近似算法;最后,实例验证了新给出的算法可以满足用户对不同近似精度的要求,使近似结果有弹性的变化,较Yao和Monhanty给出的算法有一定的优势。  相似文献   

9.
针对决策树构造中存在的最优属性选择困难、抗噪声能力差等问题,提出了一种新的基于变精度粗糙集模型的决策树构造算法.该算法采用近似分类精度作为节点选择属性的启发函数,与传统基于粗糙集的决策树构造算法相比,该算法构造的决策树结构简单,提高了决策树的泛化能力,同时对噪声也有一定的抑制能力.  相似文献   

10.
将变精度粗糙集的思想引入相容粗糙集,提出了两种变精度相容粗糙集模型,在模型I中,目标概念的下近似和边界域的交集非空;在模型II中,目标概念的下近似和边界域的交集为空。研究了两种模型中上、下近似算子的基本性质、两种模型之间的关系,以及与其他粗糙集模型之间的关系。  相似文献   

11.
属性约简中一种新的求核算法   总被引:1,自引:1,他引:0  
属性约简是粗糙集理论中的一个重要内容,其核心任务是得到属性集的核。本文提出了一种基于二进制运算的属性核求解算法,该算法简单直观且易于实现。我们通过设计C语言程序验证了算法的有效性。  相似文献   

12.
为了从矩阵的视角探讨信息系统动态知识更新的有效方法和途径, 提出了信息系统的属性值发生变化时变精度粗糙集模型中概念上、下近似集增量式更新的矩阵方法并构造出相应的算法; 随后在MATLAB平台上开发出近似集增量式更新和非增量式更新的两类矩阵算法的程序; 最后在UCI数据集上进行两种矩阵算法的性能测试。测试结果表明, 概念近似集增量式更新矩阵算法的可行、简洁和高效。  相似文献   

13.
变精度覆盖粗糙集   总被引:4,自引:0,他引:4       下载免费PDF全文
介绍了Ziarko变精度粗糙集模型和覆盖粗糙集模型;定义了多数包含关系;借助引入的误差参数β(0≤β<0.5),给出了基于对象邻域的变精度覆盖粗糙集模型中β上近似、β下近似、β边界和β负域的定义以及β近似质量和β粗糙性测度定义;详细讨论了β上、下近似算子的性质、集合的相对可辨别性、该模型与Ziarko变精度粗糙集模型和覆盖粗糙集模型的关系;最后探讨了变精度覆盖粗糙集模型中的约简问题并在所给模型的基础上举例说明了它们在信息处理中的应用。  相似文献   

14.
Text classification techniques mostly rely on single term analysis of the document data set, while more concepts, especially the specific ones, are usually conveyed by set of terms. To achieve more accurate text classifier, more informative feature including frequent co-occurring words in the same sentence and their weights are particularly important in such scenarios. In this paper, we propose a novel approach using sentential frequent itemset, a concept comes from association rule mining, for text classification, which views a sentence rather than a document as a transaction, and uses a variable precision rough set based method to evaluate each sentential frequent itemset's contribution to the classification. Experiments over the Reuters and newsgroup corpus are carried out, which validate the practicability of the proposed system.  相似文献   

15.
一种属性与值约简及规则提取算法   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出了一种属性与值约简及规则提取算法。该算法无需求出分明矩阵,而是从决策表中直接提出关于属性值分明的属性构造分明函数,并且可以同时求出属性约简和属性值约简。在此基础上提取规则不仅节约了空间,而且提高了效率,并通过实例进行了验证。  相似文献   

16.
变精度粗糙集模型及其应用研究   总被引:1,自引:0,他引:1       下载免费PDF全文
介绍了广义粗糙集模型和Ziarko变精度粗糙集模型,找出了它们的不足;借助引入的误差参数β(0≤β<0.5),给出了基于后继邻域的一般二元关系下变精度粗糙集模型的β上近似、β下近似、3边界和β负域的定义以及β近似质量和β粗糙性测度定义;详细讨论了β上、下近似算子的性质、该模型与其他粗糙集模型的关系以及一般二元关系下两种变精度粗糙集模型的关系;最后,举例说明了该模型在信息处理中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号