共查询到10条相似文献,搜索用时 15 毫秒
1.
连续属性离散化是数据分析中重要的预处理过程,而基于粗糙集理论的数据分析要求离散化的结果能够最大程度地保持原信息系统的分辨关系。论文提出了一种新的离散化算法,此算法以决策信息系统中决策属性对条件属性集合的依赖度作为评价函数动态调整DBSCAN聚类算法的参数,直至离散化决策属性对条件属性集合的依赖度达到预先指定的阈值为止。算法分析和实验证明,算法是切实可行的。 相似文献
2.
决策系统中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值,对后继阶段的机器学习具有重要的意义。首先研究了满足决策系统最优划分的一种计算候选断点集合的算法,然后在基于条件属性重要度和贪心算法的基础上提出了一种确定结果断点子集的新启发式算法。所提出的属性离散算法考虑并体现了粗糙集理论的基本特点和优点,并能取得较理想的连续属性离散化结果。 相似文献
3.
一种改进的启发式离散化算法及应用 总被引:1,自引:0,他引:1
Nguyen S.H提出的布尔逻辑和粗糙集理论相结合的离散化算法是粗糙集理论中的离散化算法在思想上的重大突破。通过定义分界点来区分Nguyen S.H离散化算法中定义的断点对决策系统的分辨关系是否有贡献,并仅取分界点集作为初始断点集,使得初始断点数目较大幅度地降低,提出了一种改进的启发式离散化算法并应用于一个实际的决策系统的连续属性离散化。应用实例表明改进算法较大程度地减小了算法空间复杂性和时间复杂性,具有正确性和实用性。 相似文献
4.
5.
将粗糙集理论同神经网络结合起来,提出了一种新的粗糙神经网络的构造算法。该算法针对含有连续属性的不一致决策表,采用整体离散化方法,对连续属性离散化,并用离散后的结果作为输入向量;然后利用粗糙集理论对不一致性决策表进行属性约简,减少神经网络的输入向量;最后使用经典数据对该神经网络进行训练。结果表明本神经网络提高了网络的收敛速度和泛化能力,改善了网络的预测性能。 相似文献
6.
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样性和寻找全局最优解的能力。利用粗糙集理论中决策属性对条件属性的依赖度来衡量决策表的一致性,从而达到连续属性离散化的目的,最后采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验,实验结果表明此算法是有效的。 相似文献
7.
汪凌 《计算机工程与应用》2013,49(21):29-32
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。 相似文献
8.
一种改进的快速数据离散化算法 总被引:1,自引:0,他引:1
提出一种新的基于粗糙集理论的快速数据离散化算法FRSBD(Fast Rough Set based Discretization Algorithm),文章定义了属性决策关系矩阵等概念.证明了一组基于属性决策关系矩阵的断点判定规则的有效性,并基于该新的断点判定规则,实现了决策表中连续属性值的快速离散化.理论分析说明了FRSBD的正确性和有效性,仿真结果表明该算法优于文献报道的同类算法. 相似文献
9.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。 相似文献
10.
针对不完备信息系统提出了一种新的粗糙集离散化算法。通过分析候选断点与决策类之间的影响关系,定义了候选断点对决策类的区分能力,并以此作为断点重要性的度量,实现不完备信息系统中连续属性的离散化。仿真实验验证了该算法的有效性。 相似文献