排序方式: 共有24条查询结果,搜索用时 62 毫秒
21.
LEM2算法是一种有效的规则提取算法,但是效率有待提高.针对效率问题,文章对LEM2算法作了一些改进:在计算属性值对的同时获取单条件属性的确定规则,并且可以去掉某些冗余属性;定义了决策分配势矩阵作为启发信息,简化了LEM2算法内部的多重循环.最后给出了两种算法的复杂度分析和仿真对比试验,结果表明改进算法能获取更为简洁的规则,并能有效的提高算法的效率. 相似文献
22.
不完备信息系统中基于集对相似度的粗集模型 总被引:1,自引:0,他引:1
讨论了已有粗集扩充模型处理不完备信息的局限,分析了空值相等与确定值相等在概率上的明显差异.依据集对分析理论,提出了集对相似度和相似度容差关系,进而给出一种基于集对相似度的粗集拓展模型.该模型的方法是:通过引入差异度系数体现空值相等与确定值相等之间的差别,利用相似度容差关系及差异度系数确定数据对象的邻域,再利用该邻域得到上下近似集,同时在求上近似时忽略空值的差异性,在求下近似时强调空值的差异性.实验表明,该模型在相同阈值参数的情况下,结果更加合理,精度更高. 相似文献
23.
分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展.文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统.实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值. 相似文献
24.
为了得到更多的用户兴趣信息,提出了一种新的高效的用户兴趣模式获取方法,面向层次结构的信息网站,提供动态的多层次用户兴趣模式。该方法根据网站和用户兴趣所具有的层次性特征,利用蚁群算法,将用户对网站结点的一次浏览过程,对应于蚂蚁的一次觅食活动周期,从各个层次求出相应路径的信息素浓度和支持度,从而得到用户对该结点的偏好函数值,再依据此值求得用户兴趣模式。实验表明了该方法的有效性。 相似文献