首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
核属性蚁群算法的规则获取   总被引:1,自引:0,他引:1  
蚁群算法是一种新型的模拟进化算法,研究已经表明该算法具有许多优良的性质,并且在优化计算中已得到了很多应用.粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.本文从规则获取和优化两方面研究基于粗糙集理论和蚁群算法的分类规则挖掘方法.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识理论,将粗糙集理论与蚁群算法融合,采用粗糙集理论进行属性约简,利用蚁群算法获取最优分类规则,优势互补.实验结果比较表明,算法获取的分类规则,具有良好的预测能力和更为简洁的表示形式.  相似文献   

2.
李抒音  刘洋 《计算机工程》2019,45(9):211-215
针对粗糙集分类规则挖掘算法LEM2剪枝条件过于严格的问题,提出一种权重模糊粗糙集的改进规则挖掘算法。在用例带权重的模糊粗糙集理论框架上分析面向混合数据的分类规则挖掘算法,引入粗糙集模型的近似覆盖参数作为挖掘算法的泛化度量参数,实现对规则集数量和规则形式复杂程度的调节。实验结果表明,与LEM2算法和DataSqueezer算法相比,该算法的平均精度和平均召回率更优,分别为81%和80%,且生成规则的平均长度最短。  相似文献   

3.
一种基于粗糙集理论的最简规则挖掘方法   总被引:4,自引:0,他引:4  
赛煜  王海洋 《计算机工程》2003,29(20):77-79
提出了一种基于粗糙集理论的最简规则挖掘方法,它是一个采用基于分类正确度的粗糙集模型进行多概念分类规则挖掘的新方法,能有效处理决策表的不一致性,采用启发式算法,挖掘出满足给定精确度的最简产生式规则知识。用多个UCI数据集对算法进行了测试,并且与著名的Rosetta软件进行实验对比,结果说明此方法大大提高了总的数据约简量,可以有效地简化最终得到的规则知识。  相似文献   

4.
领域文本具有结构复杂、相似性高以及动态变化等特点,且存在着连续型与离散型并存的混合数据,这在一定程度上限制了知识发现方法对文本规则的挖掘效率。针对这一问题,该文提出了基于GMM与粗糙集的文本规则挖掘方法。该方法首先根据目标数据的属性类型构造信息表;然后利用高斯混合模型(GMM,Gaussian Mixture Model)聚类算法对连续数据进行聚类划分,依此对数据进行离散化及状态约简,并生成决策表;最后利用粗糙集理论对决策表进行属性约简,通过约简表对决策规则进行提取。实验结果表明: 相比于传统的方法,该文方法拥有更高的抽取精度以及较强的属性约简能力,其信息抽取的平均准确率与F1值能够达到95.0%和95.7%。  相似文献   

5.
关联规则挖掘是数据挖掘的重要领域之一,利用粗糙集理论来挖掘关联规则的方法已经得到广泛关注.针对不完备信息系统,提出了基于粗糙集理论的快速ORD关联规则挖掘算法.该算法首先采用基于粗糙集理论的属性约简算法进行属性约简,然后采用快速、高效的冗余项集和冗余规则修剪算法--ORD算法获取关联规则.将该算法与其它同类流行的算法在4个UCI数据集上进行实验比较,结果表明该算法性能良好.  相似文献   

6.
基于粗糙集理论的关联规则挖掘研究及应用   总被引:2,自引:0,他引:2  
提出了一种基于粗糙集理论的关联规则算法,使用粗糙集理论对数据进行预处理,同时使用属性限制避免挖掘无用的关联规则,挖掘出来的关联规则是分类规则,可以对未知数据进行分类;使用规则过滤去除冗余规则,只保留本质的、一般的规则。通过对网络安全审计数据的分析的试验表明,该方法是行之有效的。  相似文献   

7.
传统的基于粗糙集与支持向量机的故障诊断方法在用支持向量机分类前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐含知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该方法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐舍知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该 法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集  相似文献   

8.
CBA算法是将关联规则挖掘与分类技术相结合的一种分类算法,在许多领域中得到了广泛应用.针对CBA处理海量数据效率低的缺点,提出了一个改进的CBA算法.该算法将粗糙集理论应用到CBA算法中,对决策表进行属性约简,提高了分类关联规则的生成效率;并应用PEP(pessimistic error pruning)方法对候选规则进行剪裁.实验结果表明,该算法比CBA具有更高的分类效率和准确度.  相似文献   

9.
王旅  彭宏  胡劲松 《微计算机信息》2006,22(15):147-149
Pawlak粗糙集理论在分类挖掘中得到了广泛应用,基于相似粗糙集的分类挖掘算法是传统粗糙分类方法的拓展,可以用于在数值型决策表中发现分类规则。客户分类管理是CRM的核心内容之一,科学有效的客户分类管理对于一个企业具有重要的意义。本文阐述了基于相似粗糙集的分类算法及其客户分类应用实例,分类结果表明了该分类方法的有效性。  相似文献   

10.
关联规则挖掘算法在分类中的应用研究   总被引:1,自引:0,他引:1  
提出了一个基于关联规则挖掘算法的医疗数据分类方法。介绍了关联规则的理论基础、关联规则挖掘算法及其在医疗数据挖掘中的应用方法,并利用介绍的算法对乳腺癌数据进行挖掘。获得了分类的实验结果,该模型系统达到了较高的分类准确率,证明了数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

11.
In this paper we study an evolutionary machine learning approach to data mining and knowledge discovery based on the induction of classification rules. A method for automatic rules induction called AREX using evolutionary induction of decision trees and automatic programming is introduced. The proposed algorithm is applied to a cardiovascular dataset consisting of different groups of attributes which should possibly reveal the presence of some specific cardiovascular problems in young patients. A case study is presented that shows the use of AREX for the classification of patients and for discovering possible new medical knowledge from the dataset. The defined knowledge discovery loop comprises a medical expert's assessment of induced rules to drive the evolution of rule sets towards more appropriate solutions. The final result is the discovery of a possible new medical knowledge in the field of pediatric cardiology.  相似文献   

12.
A hybrid coevolutionary algorithm for designing fuzzy classifiers   总被引:1,自引:0,他引:1  
Rule learning is one of the most common tasks in knowledge discovery. In this paper, we investigate the induction of fuzzy classification rules for data mining purposes, and propose a hybrid genetic algorithm for learning approximate fuzzy rules. A novel niching method is employed to promote coevolution within the population, which enables the algorithm to discover multiple rules by means of a coevolutionary scheme in a single run. In order to improve the quality of the learned rules, a local search method was devised to perform fine-tuning on the offspring generated by genetic operators in each generation. After the GA terminates, a fuzzy classifier is built by extracting a rule set from the final population. The proposed algorithm was tested on datasets from the UCI repository, and the experimental results verify its validity in learning rule sets and comparative advantage over conventional methods.  相似文献   

13.
一种基于有序属性决策系统分类规则提取策略   总被引:1,自引:0,他引:1       下载免费PDF全文
分类规则的精度取决于分类算法的构造,论文在综合分析基本粗糙集合概念及其约简算法的基础上,阐述了一种基于准则的有序属性决策系统的数据挖掘算法.为此首先介绍了基于有序属性决策系统的集合表达,然后利用有序属性决策系统中准则集与属性集的基本特征构造上下近似扩展模型,得到准则集决策系统的四个相关参数.并进一步提出相应的数据约简与分类规则提取算法。最后给出了用此算法约简有序属性决策系统的算例,实验结果表明此方法挖掘出的规则简练,更具合理性和可靠性。  相似文献   

14.
现有的混合信息系统知识发现模型涵盖的数据类型大多为符号型、数值型条件属性及符号型决策属性,且大多数模型的关注点是属性约简或特征选择,针对规则提取的研究相对较少。针对涵盖更多数据类型的混合信息系统构建一个动态规则提取模型。首先修正了现有的属性值距离的计算公式,对错层型属性值的距离给出了一种定义形式,从而定义了一个新的混合距离。其次提出了针对数值型决策属性诱导决策类的3种方法。其后构造了广义邻域粗糙集模型,提出了动态粒度下的上下近似及规则提取算法,构建了基于邻域粒化的动态规则提取模型。该模型可用于具有以下特点的信息系统的规则提取: (1)条件属性集可包括单层符号型、错层符号型、数值型、区间型、集值型、未知型等; (2)决策属性集可包括符号型、数值型。利用UCI数据库中的数据集进行了对比实验,分类精度表明了规则提取算法的有效性。  相似文献   

15.
阐述了粗糙集理论、遗传约简算法和粒子群约简算法。属性约简是知识发现的关键问题之一。传统的属性约简算法都是串行搜索的,算法效率低且收敛速度慢。将计算智能和粗糙集相结合,提出了一种基于遗传粒子群和粗糙集的最小属性约简算法。该算法利用属性依赖度计算属性核,并在种群初始化时引入属性核作为限制条件,动态调整适应度函数,以达到求得最小属性约简的目的。实验表明,对于数据量大、属性维度高的属性约简问题,该算法具有高效的处理能力。  相似文献   

16.
We present a data mining method which integrates discretization, generalization and rough set feature selection. Our method reduces the data horizontally and vertically. In the first phase, discretization and generalization are integrated. Numeric attributes are discretized into a few intervals. The primitive values of symbolic attributes are replaced by high level concepts and some obvious superfluous or irrelevant symbolic attributes are also eliminated. The horizontal reduction is done by merging identical tuples after substituting an attribute value by its higher level value in a pre- defined concept hierarchy for symbolic attributes, or the discretization of continuous (or numeric) attributes. This phase greatly decreases the number of tuples we consider further in the database(s). In the second phase, a novel context- sensitive feature merit measure is used to rank features, a subset of relevant attributes is chosen, based on rough set theory and the merit values of the features. A reduced table is obtained by removing those attributes which are not in the relevant attributes subset and the data set is further reduced vertically without changing the interdependence relationships between the classes and the attributes. Finally, the tuples in the reduced relation are transformed into different knowledge rules based on different knowledge discovery algorithms. Based on these principles, a prototype knowledge discovery system DBROUGH-II has been constructed by integrating discretization, generalization, rough set feature selection and a variety of data mining algorithms. Tests on a telecommunication customer data warehouse demonstrates that different kinds of knowledge rules, such as characteristic rules, discriminant rules, maximal generalized classification rules, and data evolution regularities, can be discovered efficiently and effectively.  相似文献   

17.
A novel multi-objective genetic algorithm (GA)-based rule-mining method for affective product design is proposed to discover a set of rules relating design attributes with customer evaluation based on survey data. The proposed method can generate approximate rules to consider the ambiguity of customer assessments. The generated rules can be used to determine the lower and upper limits of the affective effect of design patterns. For a rule-mining problem, the proposed multi-objective GA approach could simultaneously consider the accuracy, comprehensibility, and definability of approximate rules. In addition, the proposed approach can deal with categorical attributes and quantitative attributes, and determine the interval of quantitative attributes. Categorical and quantitative attributes in affective product design should be considered because they are commonly used to define the design profile of a product. In this paper, a two-stage rule-mining approach is proposed to generate rules with a simple chromosome design in the first stage of rule mining. In the second stage of rule mining, entire rule sets are refined to determine solutions considering rule interaction. A case study on mobile phones is used to demonstrate and validate the performance of the proposed rule-mining method. The method can discover rule sets with good support and coverage rates from the survey data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号