共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
Rough Set中基于聚类的连续属性离散化方法 总被引:3,自引:0,他引:3
分析了一些RoughSet中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法,对当前的论域中的例子根据相似性进行聚类,对每个聚类在各属性轴上的投影的边界设离 散断点。该方法考虑了各属性之间的相关性,能得到比较合理的离散结果。 相似文献
3.
4.
5.
连续属性离散化是数据分析中重要的预处理过程,而基于粗糙集理论的数据分析要求离散化的结果能够最大程度地保持原信息系统的分辨关系。论文提出了一种新的离散化算法,此算法以决策信息系统中决策属性对条件属性集合的依赖度作为评价函数动态调整DBSCAN聚类算法的参数,直至离散化决策属性对条件属性集合的依赖度达到预先指定的阈值为止。算法分析和实验证明,算法是切实可行的。 相似文献
6.
7.
8.
介绍了一种基于统计分析的数据离散化方法——谱系聚类法,以胶合板缺陷检测数据为应用对象进行了基于谱系聚类的数据离散化研究,并与其它离散化方法进行了对比分析,对比结果表明经谱系聚类方法离散化后的数据,再进行粗糙集约简时,会有更多的冗余属性和记录被约掉,从而可以降低模型的复杂程度,加快获取知识的进程,提高分类的准确率。工程实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,结合粗糙集算法可以获取满意的数据挖掘结果。 相似文献
9.
10.
11.
传统粗糙集分类方法过于严格,对噪音过分敏感。针对带不确定因子决策系统,提出一种基于属性依赖度的约简算法,使含不确定信息及数据噪音的系统中的属性得以简化,找到一种具有广泛表达能力的数据隐含格式,删去冗余的规则,并保持系统的原有用途和性能。通过一个例子实现了该算法。 相似文献
12.
13.
面对日益复杂的网络环境,传统入侵检测方法误报率高、检测效率低,且存在优化过程中准确性和可解释性相互矛盾等问题,因此提出一种结合改进粗糙集属性约简和K-means聚类的网络入侵检测(IRSAR-KCANID)方法。首先基于模糊粗糙集属性约简对数据集进行预处理,优化异常的入侵检测特征;再利用改进K-means聚类算法估计入侵范围阈值,并对网络特征进行分类;然后根据用于特征优化的线性规范相关性,从所选择的最优特征探索特征关联影响尺度以形成特征关联影响量表,完成对异常网络入侵的检测。实验结果表明,特征优化聚类后的最小化测量特征关联影响量表能在保证最大预测精度的前提下,最小化入侵检测过程的复杂度并缩短完成时间。 相似文献
14.
通过抽象信息系统,阐明了经典粗糙集模型分类质量、相对正域、决策类下近似具有非单调递减性;变精度粗糙集模型在约简过程中分类质量和相对正域会出现跳跃现象,约简过程具有不稳定性。需要针对三者分别建立模型,使属性约简变得多样化。 相似文献
15.
在系统熵的基础上,定义了一种新的属性重要度并提出了一种基于改进系统熵的粗糙集属性约简算法,实验分析表明,该属性重要度为启发式信息进行的属性约简,取得了理想效果。 相似文献
16.
从粗糙集理论出发,在可分辨关系和对象差异矩阵概念的基础上构造出基于粗糙集理论的并行约简算法。算法首先将原系统划分为多个子系统,然后利用评价指数对划分得到的子系统并行求解,最后以子系统的局部约简结果为基础,求得原系统的约简。算法的时空性能较好,适于处理大规模数据集。 相似文献
17.
18.
19.
粗糙集理论知识库的属性重要度,体现的是去掉某个或某些属性前后的知识库分类变化的程度。对现有粗糙集理论的属性重要度确立方法的不足,充分考虑条件属性对决策的直接和间接的影响,提出一种新的基于粗糙集属性依赖度的属性重要度确定方法。此外,针对原有属性重要度与改进重要度的差别,讨论改进的属性重要度的意义,并证明改进的属性重要度更加可信。最后,利用改进的方法对机械故障属性重要度进行仿真;对比原有属性重要度的数据,改进方法获得的数据不但更符合属性约简结果,并且具有更大区分度,十分有利于决策者快速做出判断。 相似文献
20.
蒋瑜 《计算机工程与应用》2013,49(11):101-104
为了寻找一种有效的最小属性约简方法,给出了条件属性集上的属性重要度序关系,基于此序关系构建了属性集上的集合枚举树,提出了一种快速的最小属性约简算法,该算法采用至上而下、层次优先策略搜索集合枚举树寻找属性最小约简。为了提高算法性能,该算法采用核和父集剪枝策略减少搜索空间,采用优化计算来确保同一集合的正域只计算一次。基于UCI数据的实验结果表明,该算法是有效的。 相似文献