共查询到20条相似文献,搜索用时 0 毫秒
1.
安秋生 《计算机工程与应用》2010,46(10):14-16
利用粒计算方法对粗糙关系数据库(Rough Relational Database,RRDB)的粗糙函数依赖进行研究。首先提出了两种类型的粗糙函数依赖及粗糙相似关系的概念,分析了如何利用位模式表示粗糙关系的属性值,在此基础上给出了利用粒计算方法对粗糙关系的属性间的依赖关系的进行判定的算法,实验验证算法是有效可行的。 相似文献
2.
3.
针对标准鱼群算法易受到初始鱼群随机性的影响,后期收敛速度减慢,处理边界数据能力低,聚类精度低等缺点,提出了基于粒计算与粗糙集的人工鱼群聚类算法。算法引入粒计算理论,并依据粒密度和最大最小距离积法选择初始化人工鱼群避免算法易受随机性的影响;通过结合粗糙集的决策系统和属性约简,提高算法解决边界数据的能力;采用类内紧致性和类间分离度的原则设计适应度函数,并将其作为算法的终止判断条件。实验结果表明:该算法提高了聚类精度,增强了获取全局极值的能力,具有良好的聚类效果。 相似文献
4.
5.
6.
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法,不相容决策表是粗糙集理论研究的一个重点。利用粗糙集中的等价关系来构建粒子,给出了决策表系统的粒子分解方法及在粒表示下以属性重要性作为启发信息的属性约简算法。实验结果表明该算法不仅具有高效性,而且能处理大型决策表。 相似文献
7.
针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低、聚类精度低等问题, 提出了一种新的K-means聚类算法。算法引入粒计算理论, 并依据密度和最大最小距离法选择初始聚类中心, 避免初始聚类中心在同一个类中, 结合粗糙集, 通过动态调整上近似集和边界集的权重因子, 以解决边界数据的聚类问题; 最后采用类间距和类内距均衡化准则函数作为算法终止判断条件, 来得到更好的聚类效果。实验结果表明:该算法具有较高的准确率, 迭代次数较少, 并降低了对噪声的敏感程度。 相似文献
8.
基于粒计算的数据分片算法 总被引:1,自引:0,他引:1
提出了一种基于粒计算的数据分片模型及算法,该算法在优先考虑数据本地化的基础上,可动态调整全集划分的粗细,将全集划分的数据分片的数量调整到一个比较合理的状态,既能减少网络流量、降低整个分布式系统开销,同时又控制了数据分片数量,减少了数据连接工作量,从而提高系统效率。 相似文献
9.
提出了一种基于粒计算Web文档聚类(WDCGrc)方法。该方法通过TF-IDF法则计算文档词条的权值,采取设定文档阈值和平均权值相结合的方法实行降维,抽取出每篇文档的主干词;建立了文档的主干词和二进制粒之间的转换,提出了基于粒计算提取文档间的关联规则算法来获取文档间的频繁项集,由频繁项集形成初始聚类,使用优化算法对初始聚类进行优化,得到最终聚类结果。实验结果表明,该方法切实有效,聚类质量较好。 相似文献
10.
11.
讨论基于三支决策的自适应粗糙集近似方法,给出自适应粗糙集近似属性评价函数的算法。为清楚表达在粗糙集近似过程中对象和属性之间的关系,引入描述集的概念,在描述集的意义下根据属性评价函数对目标概念进行自适应粗糙集近似。最后,把自适应粗糙集近似过程与认知过程进行比较,并分析它们的相似性,借助该近似过程的思想,在一定程度上提高人们的认知效率。 相似文献
12.
基于粒计算的决策树并行算法的应用 总被引:1,自引:0,他引:1
针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型M apReduce ,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;基于二进制信息粒关联矩阵,提出属性的信息增益的计算方法,设计基于M apReduce的粒计算决策树并行分类算法。通过使用标准数据集和实际气象领域的雷电真实数据集进行测试,验证了该算法的有效性。 相似文献
13.
提出了一种基于信息系统优势类的多目标排序算法。在信息系统优劣关系的基础上,通过求取个体的优势类形成优势粒,利用Pareto解之间的不可比较特性以及优势粒的特性,采用优势粒粒度作为衡量个体优劣性的标准,并提出了基于优势粒粒度的快速排序算法。实验结果表明该算法的效率高,而且能体现对象的优势度,能显著提高多目标优化算法的效率。 相似文献
14.
基于粒计算的K-medoids聚类算法 总被引:1,自引:0,他引:1
传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位于同一类簇。为克服传统K-medoids聚类算法和快速K-medoids聚类算法的缺陷,提出一种基于粒计算的K-medoids聚类算法。算法引入粒度概念,定义新的样本相似度函数,基于等价关系产生粒子,根据粒子包含样本多少定义粒子密度,选择密度较大的前K个粒子的中心样本点作为K-medoids聚类算法的初始聚类中心,实现K-medoids聚类。UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明了基于粒计算的K-medoids聚类算法能得到更好的初始聚类中心,聚类准确率和聚类误差平方和优于传统K-medoids和快速K-medoids聚类算法,具有更稳定的聚类结果,且适用于大规模数据集。 相似文献
15.
针对现有频繁闭项目集挖掘算法存在的不足,提出了一种基于粒度计算的频繁闭项目集挖掘算法。通过混合进制数的变化来生成候选项目集,避免使用了复杂的数据结构,减少了内存和CPU的开销;利用粒度计算的分而治之思想来计算频繁闭项目集的支持度,避免了多次重复扫描数据库,减少了计算复杂度和I/O开销。实验结果表明该算法比经典的频繁闭项目集挖掘算法快速而有效。 相似文献
16.
不完备有序信息处理是现实生活中的常见问题. 多种拓展优势关系及其粗糙集模型被提出并用于解决不完全的偏好决策问题, 但均未考虑序关系特性, 与现实语义存在矛盾. 对此, 提出一种置信优势关系及其粗糙集近似模型, 讨论了基于置信优势关系的粗糙集模型与已有模型的关系. 与现有的拓展关系相比, 该置信优势关系满足序关系特性, 避免了语义上的矛盾. 定理证明和实例分析表明, 置信优势关系粗糙集近似模型的近似精度和分类精度更优.
相似文献17.
18.
典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数d(di,dj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。 相似文献
19.
多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角度分析,实现一次挖掘,多次应用。首先,介绍粒计算相关知识;然后,提出多尺度聚类尺度上推算法UAMC(Upscaling Algorithm of Multi-scale Clustering),以簇为粒子,簇心为粒子特征进行尺度转换,利用斑块模型得到大尺度知识,避免二次挖掘带来的资源浪费;最后,利用UCI公用数据集和H省全员人口真实数据集对算法性能进行实验验证,结果表明算法在准确性上优于K-Means等基准算法,是有效可行的。 相似文献
20.
为从决策表中获取最简决策规则,在研究粒计算理论的基础上,提出了一种基于粒计算的决策规则提取算法。该算法通过引入λ阶粒库的概念,利用粒计算的方法对由同一决策表所生成的粒库,从不同的角度和多个层次进行研究,尝试从较低阶的粒库中提取出尽可能多的具有一定规则覆盖度与置信度的简洁规则。最后通过实例验证了该算法的有效性。 相似文献