首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
为解决混合属性中数值属性与分类属性相似性度量的差异造成的聚类效果不佳问题,分析混合属性聚类相似性度量的问题,提出基于熵的混合属性聚类算法.引入熵离散化技术将数值属性离散化,仅使用二元化距离度量混合属性对象之间的相似性,在聚类过程中随机选取k个初始簇中心,将其它对象按照距离k个簇中心的最小距离划分到相应的簇中,选择每个簇中每个数据属性中频率最高的属性值形成新的簇中心继续划分对象,迭代此步当满足目标条件时停止,形成最终聚类.在UCI数据集上的实验结果验证了该算法的有效性.  相似文献   

2.
决策树是数据挖掘的一种重要方法,通常用来形成分类器和预测模型。ID3算法作为决策树的核心算法,由于它的简单与高效而得到了广泛的应用,然而它倾向于选择属性值较多的属性作为分支属性,从而可能错过分类能力强的属性。对ID3算法的分支策略进行改进,增加了对属性的类区分度的考量。经实验比较,新方法能提高决策树的精度,简化决策树。  相似文献   

3.
决策树是数据挖掘的一种重要方法,通常用来形成分类器和预测模型。ID3算法作为决策树的核心算法,由于它的简单与高效而得到了广泛的应用,然而它倾向于选择属性值较多的属性作为分支属性,从而可能错过分类能力强的属性。对ID3算法的分支策略进行改进,增加了对属性的类区分度的考量。经实验比较,新方法能提高决策树的精度,简化决策树。  相似文献   

4.
基于优势关系的多属性决策问题研究   总被引:2,自引:0,他引:2  
刘健  冯启磊 《控制与决策》2010,25(7):1079-1083
针对属性权重未知的多属性决策问题,指出决策对象与理想对象之间的优势度与其属性值的概率测度及属性值大小之间有等价关系;借鉴博弈决策中的极大极小算法,提出用属性值的优势关系确定属性权重,并利用优势关系对决策对象进行排序并择优:最后,对属性值为区间数的多属性决策实例进行了分析,同时将该算法与离差最大化算法的异同点进行了对比,表明了算法的有效性.  相似文献   

5.
为对象代理数据库的虚属性查询提出两种优化方法---表达式提升和虚属性合并。表达式提升将虚属性查询转换为对源类中实属性的查询;虚属性合并是对查询涉及的属于相同源对象的多个虚属性,一次性获取相应源对象的属性值用于虚属性值的计算,避免多次访问同一源对象。通过实验分析了这两种方案对虚属性查询的性能影响,实验结果表明,对于虚属性和代理层数较多的查询,表达式提升和虚属性合并的方法极大提升了查询效率。  相似文献   

6.
把模糊集和粗糙集结合起来,对连续域决策表属性约简算法进行研究。使用三角隶属度函数将连续属性值转化为模糊值。定义两模糊对象间的相似度、模糊对象的相似类以及连续属性在对象集上划分所形成的相似类集组成的特征向量。给出连续型属性的数字特征向量,以此为基础建立连续型属性间的相似矩阵。提出一个新的属性约简算法,并用一个实例加以验证。  相似文献   

7.
吴玲玉  白尘 《计算机应用研究》2013,30(11):3283-3286
传统属性空间的密度聚类算法仅考虑对象属性取值相似度, 网络空间密度聚类算法仅关注对象间关系紧密度。针对两类算法的不足, 提出一种兼顾属性距离及关系强度的密度聚类算法。在构建兼顾属性距离及关系强度的网络之后, 完善了近邻对象及核心对象的概念, 并给出了相应的聚类策略。理论分析和实验结果表明, 由于综合考虑了属性、关系及关系强度信息, 算法规避了对象属性值分布对聚类过程的影响, 改善了聚类效果, 并能有效识别枢纽点和孤立点。  相似文献   

8.
一种连续条件属性值的决策表的归纳学习方法   总被引:1,自引:0,他引:1  
对由连续条件属性值和离散决策属性值组成的决策表,提出了一种归纳学习方法。把决策表中的连续条件属性值看作一矩阵,进行矩阵的奇异值分解,以确定决策表条件属性的数目。用模糊C均值聚类的方法对连续条件属性值进行不同聚类数目的聚类,得到不同聚类数目下的离散决策表,对这些决策表进行条件属性简化,从而得到不同的条件属性数目。比较矩阵奇异值分解后决策表条件属性的数目和上述不同聚类数目下的离散决策表简化后的条件属性的数目,并考虑决策属性的数目,确定最终的聚类数目。在此基础上,给出了由连续条件属性值和离散决策属性值组成的决策表的归纳学习方法,并验证了其有效性。  相似文献   

9.
双聚类是一种理想的概念聚类方法。对范畴类数据而言,双聚类可以给出相关联的数据对象和属性值的簇集(包括重叠的情况)。该文提出了一种通用的双聚类框架,由局部模式群集计算双划分。该局部模式反映了数据对象和属性之间的强关联。  相似文献   

10.
现有的大多数隐私保护技术往往忽略了敏感属性不同取值和准标识符属性之间存在的特殊关联,并且各领域对数据隐私保护的多方面要求,使得发布的匿名数据需要满足复合隐私约束。对近似敏感属性值和复合隐私约束进行分析,提出了基于大数据模式分解和聚类分析的隐私保护算法。给出了聚类敏感属性值保护相似值方法,设置不同权重的敏感属性,保留重要的属性。使用三维不规则结构矩阵的效用矩阵,来获取精度较高的匿名数据,实现匿名数据的模式分解。在真实数据集上的大量实验结果表明,该算法的数据精确率、数据纠错率都有明显提升,近似攻击率降低。  相似文献   

11.
基于新型协调量化容差关系的不完备数据填补方法   总被引:1,自引:0,他引:1  
提出一种基于新型协调量化容差关系的不完备数据补齐算法。首先求出属性值不完备对象的容差类,结合属性的重要度,将容差类里面的对象容差关系量化,再根据决策规则独立原则,在尽可能保持系统协调性的前提下对缺失属性值进行补齐。大量实验证明了本算法的有效性。  相似文献   

12.
为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。  相似文献   

13.
提出了一种基于新相异度量的模糊K-Modes算法。该算法假定不同属性对聚类结果有不同程度的影响,定义了新的属性值函数,以基于划分相似度的聚类精确度作为聚类结果的评价准则。通过真实数据的实验结果表明,新的基于相异度量的模糊K-Modes算法比传统的模糊K-Modes算法有更好的聚类效果。  相似文献   

14.
林姿琼 《福建电脑》2010,26(2):115-115,118
针对空间对象的多属性特点,将对象的地理空间位置属性和非空间属性结合纳入相似度衡量,使聚类结果更具有客观性。  相似文献   

15.
一种具有区间数信息的多属性大群体决策方法   总被引:2,自引:0,他引:2  
针对属性值为区间数的多属性多方案大群体决策问题,提出一种区间数聚类算法.通过该聚类算法将方案的属性值聚类,得到方案的群体偏好矩阵,再利用诱导有序加权平均算子集结确定属性的权重,根据方案的综合评价值给出方案排序,进而提出大群体决策方法.该方法较好地避免聚类阈值选取的经验性,提高决策结果的可信度.实例分析验证了方法的有效性和实用性.  相似文献   

16.
本文介绍一种利用.NET框架技术及其PropertyGrid控件,实现对象动态属性配置的软件方法。该方法的优点在于能够直观的显示对象属性的动态增加、删除和改变,而不仅仅局限在其属性值的修改上。  相似文献   

17.
社交网络中积累的海量信息构成一类图大数据,为防范隐私泄露,一般在发布此类数据时需要做匿名化处理.针对现有匿名方案难以防范同时以结构和属性信息为背景知识的攻击的不足,研究一种基于节点连接结构和属性值的属性图聚类匿名化方法,利用属性图表示社交网络数据,综合根据节点间的结构和属性相似度,将图中所有节点聚类成一些包含节点个数不小于k的超点,特别针对各超点进行匿名化处理.该方法中,超点的子图隐匿和属性概化可以分别防范一切基于结构和属性背景知识的识别攻击.另外,聚类过程平衡了节点间的连接紧密性和属性值相近性,有利于减小结构和属性的总体信息损失值,较好地维持数据的可用性.实验结果表明了该方法在实现算法功能和减少信息损失方面的有效性.  相似文献   

18.
该文提出了一种结合属性分布特征的Web模式匹配算法,属性分布特征包括属性对互斥特征和属性对共现特征。属性对互斥特征由属性对的互斥性和出现次数计算得出,这个特征隐含了属性对的语义相似程度。为了充分利用传统的属性名、属性值相似性特征,该文通过机器学习方法结合属性对互斥特征与相似性特征进行属性匹配。并以潜在的匹配属性对为基础,引入有约束的属性聚类方法进行Web模式匹配,聚类方法的约束条件来自属性对共现特征。实验结果表明,相对于仅使用相似性特征的方法,在不同的实验设置下,结合属性分布特征的Web模式匹配算法将F值提高了0.13到0.55。  相似文献   

19.
实体属性值抽取是信息抽取的重要组成部分.针对数量型属性类型多样以及取值易变的问题,设计实现了一种基于元性质的数量型属性值自动抽取系统.对系统的结构、功能框架以及相关核心技术,包括提取文本的选择、候选值的提取及评估、结果的自动验证等进行了详细讨论.通过对百度百科的五大类9个子类实体数量型属性值的抽取,平均准确率和召回率分别达到71%和89%,高于基于简单搜索的方法和传统的基于词汇-句模的方法.该方法适用于开放领域的数量型属性值获取,易于获取单值属性的精确取值.  相似文献   

20.
基于图元的嵌入式组态软件的设计与实现   总被引:1,自引:1,他引:0  
为解决传统的自动控制软件设计中出现的开发周期长,代码复用率低等缺点,图形化的组态软件应运而生,它是模块的任意组合,用户可以根据自己的控制对象和控制目的任意组态.介绍了基于Linux的嵌入式图形组态软件的体系结构,阐述了基于图元的组态软件的设计思想、方法,强调了图元库的管理,以及根据图元属性再生图形和具体实现,最后给出了该软件平台的一个应用实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号