首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
一种增量式属性约简算法   总被引:1,自引:1,他引:0  
文章基于粗糙集理论提出了一种新的增量式属性约简算法。当信息系统的对象和决策属性不变而不断增加条件属性时,通过该算法可动态地实现属性约简,由该算法得到的属性约简具有一定的实用价值。通过实例验证了该算法的正确性和有效性。  相似文献   

2.
数据标签是一种提高增量数据聚类效率的简单而有效的方法.数据标签就是分配每个新增数据点到与之最相似的簇的过程.符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性.为此,将簇代表定义为簇中所有属性的属性值及其在簇中的频率构成的列表,用信息熵的变化来定义“点-簇”不相似性.基于此不相似性度量,设计了一个符号型增量数据标签算法来分配无标记数据到恰当的簇.在公开数据集和文本语料上的对比实验表明,该数据标签算法不但数据标记精度高、时间开销小,而且有较好的可伸缩性.  相似文献   

3.
基于绝对信息量的覆盖增量约简算法   总被引:1,自引:0,他引:1  
在保持覆盖上下近似算子不变的情况下,探讨覆盖约简算法。通过定义绝对信息量和信息量,引入相邻矩阵等概念,提出基于绝对信息量的覆盖增量约简算法。实例表明,该方法是一种能够去除覆盖中绝对冗余知识的有效方法。  相似文献   

4.
传感器技术发展促进各行各业产生了大量多源数据,且这些数据还在不断发生变化.当多源数据(分布信息系统)增加了一些属性后,传统约简算法需要重复计算数据且不能有效实现多源数据融合,导致计算动态多源数据约简花费时间较多,计算效率不高.为了克服传统约简算法的缺陷,设计了基于多源数据矩阵增量约简算法.介绍了一些分布信息系统的相关理...  相似文献   

5.
针对在线学习中的算法效率问题,提出了一种增量式类内局部保持降维算法.该算法综合考虑了基于QR分解的降维算法与保类内Fisher判别分析法的优点,根据训练过程中新增的样本进行投影矩阵在线更新,克服了传统的批量式训练方法在线学习时计算量过分冗余的缺陷.同时,通过兼顾输入样本的局部结构和全局分布状态,使得该算法能够有效地应用于多簇、重叠的数据形态.在ORL人脸库和COIL20图像库上的实验表明,该增量式算法不仅在降维效果上基本与批量式算法保持一致,而且具有较大的效率优势.  相似文献   

6.
庄越  庄浩 《计算机时代》2009,(7):9-10,14
针对小变化量数据的传输提出一种转置矩阵位压缩算法,将变化位和非变化位清晰地分开,并对变化位以位为单位进行压缩。实验结果表明:该算法的对小变化量数据的压缩效果很好,即使使用极为简单的行程编码压缩算法也可以取得极高的压缩率;该算法用于处理类似于工业控制系统状态参数等数据时,可缓解系统的网络负荷压力,提高网络的传输效率。  相似文献   

7.
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

8.
实际应用中,信息系统的数据常常是动态变化的,当对象增加时,原始的属性约简集不一定有效。针对不完备决策系统对象增加的情况,提出基于条件熵的增量式属性约简算法。首先定义不完备决策系统中的条件熵,然后分析对象增加时条件熵的变化机制以及对约简集的影响,提出增量式属性约简算法,当对象增加时,该算法能够更高效地进行属性约简。最后,实验验证本文算法的有效性和高效性。  相似文献   

9.
In recent years data grids have been deployed and grown in many scientific experiments and data centers. The deployment of such environments has allowed grid users to gain access to a large number of distributed data. Data replication is a key issue in a data grid and should be applied intelligently because it reduces data access time and bandwidth consumption for each grid site. Therefore this area will be very challenging as well as providing much scope for improvement. In this paper, we introduce a new dynamic data replication algorithm named Popular File Group Replication, PFGR which is based on three assumptions: first, users in a grid site (Virtual Organization) have similar interests in files and second, they have the temporal locality of file accesses and third, all files are read-only. Based on file access history and first assumption, PFGR builds a connectivity graph for a group of dependent files in each grid site and replicates the most popular group files to the requester grid site. After that, when a user of that grid site needs some files, they are available locally. The simulation results show that our algorithm increases performance by minimizing the mean job execution time and bandwidth consumption and avoids unnecessary replication.  相似文献   

10.
基于二进制区分矩阵的增量式属性约简算法   总被引:1,自引:0,他引:1  
《计算机工程》2017,(1):201-206
增量式属性约简算法是动态数据挖掘技术的重要研究内容。为降低区分矩阵的存储空间,结合二进制区分矩阵便于计算以及形象直观的优点,给出一种压缩二进制区分矩阵的方法。将二进制区分矩阵的存储空间从|C|+1列简化成3列。通过动态更新二进制区分矩阵实现增量式求核,并以核为出发点,提出一种的增量式属性约简算法。通过实例计算及仿真实验验证了该算法的有效性。  相似文献   

11.
1引言 近年来,作为一种新生的处理不确定性知识的数学工具,由于其独特的计算优势[1],及其在机器学习、数据库知识发现、决策分析、专家系统和决策支持系统等方面的成功应用,粗糙集数据分析(RSDA)逐渐被公认为人工智能领域最具潜力的五大新兴技术(粗糙集理论、神经网络、演化计算、模糊系统及混沌系统)之一[2].  相似文献   

12.
粗糙集是一种处理不确定、不完全知识的数学工具,属性约简是粗糙集理论的重要研究内容之一。提出了一种基于条件熵的快速增量约简方法,主要分析了在对象动态增加情况下信息熵的变化机制。该算法通过判断更新前决策表的约简属性对新增对象的区分情况来计算新的条件熵值,就可以快速求解出更新后的决策表的属性约简结果。实验结果也进一步验证了该方法的有效性。  相似文献   

13.
提出一种数据约简算法.该算法从决策表中条件属性的等价类族考虑,分析决策值的等价类族,在约简过程中,可同时进行属性约简与属性值约简.与基于分析法或区分矩阵的传统约简等算法相比,本文算法可省略属性值约简中繁琐的比较过程,减少比较次数,提高约简效率.  相似文献   

14.
现如今生活当中的数据大多都是动态变化的,并且在数据动态增加的过程中,许多特征中包含有缺失数据。如何处理动态变化的含有缺失数据的数据集的特征选择成为一个亟需解决的问题。为此,基于粗糙集理论,通过更新互补信息熵在含有缺失数据的数据集维数增加时的更新机制,进而提出一种缺失数据维数增量式特征选择算法,并通过实验进一步验证了算法的可行性与高效性。  相似文献   

15.
实际应用中获取到的数据集通常是动态增加的,且随着数据获取工具的迅速发展,新数据通常会一组一组地增加。为此,针对含有缺失数据的动态数据集,基于粗糙集理论,提出了一种组增量式的粗糙特征选择算法。首先分析、证明了信息熵的组增量计算公式,并以信息熵作为特征重要度的度量,在此基础上设计了基于信息熵的可有效处理含有缺失数据的动态数据集的组增量式特征选择算法。实验结果进一步证明了新算法的可行性和高效性。  相似文献   

16.
When hypervolume is used as part of the selection or archiving process in a multiobjective evolutionary algorithm, it is necessary to determine which solutions contribute the least hypervolume to a front. Little focus has been placed on algorithms that quickly determine these solutions and there are no fast algorithms designed specifically for this purpose. We describe an algorithm, IHSO, that quickly determines a solution's contribution. Furthermore, we describe and analyse heuristics that reorder objectives to minimize the work required for IHSO to calculate a solution's contribution. Lastly, we describe and analyze search techniques that reduce the amount of work required for solutions other than the least contributing one. Combined, these techniques allow multiobjective evolutionary algorithms to calculate hypervolume inline in increasingly complex and large fronts in many objectives.   相似文献   

17.
图划分是分布式图计算中的一项基础工作, 其作用是将大规模图进行划分并分配到集群中的不同机器上. 图划分的质量对分布式图计算的性能有很大的影响, 其目标是降低负载平衡和最小化边割. 如今, 现实中的图数据通常呈动态增长态势, 这就需要一种能够处理动态增量图的划分方法, 在图数据动态增长的过程中确保划分的质量不受影响. 目前虽然有一些动态图划分算法被提出, 但它们不能同时专注于实时处理动态变化和获得高质量的划分结果. 提出基于顶点组重分配的动态增量图划分算法(ED-IDGP)来解决大规模动态增量图的划分问题. 在ED-IDGP算法中, 设计实时处理4种不同单元更新类型的动态处理器, 并在每次处理完单元更新后通过在分区发生动态变化的附近执行局部优化器进一步提高图划分的质量. 在ED-IDGP的局部优化器中, 利用基于改进标签传播算法的顶点组搜索策略搜索顶点组, 并利用提出的顶点组移动增益公式衡量最有益的顶点组, 将该顶点组移动到目标分区中做优化. 在真实数据集上从不同的角度和度量指标评估了ED-IDGP算法的性能和效率.  相似文献   

18.
针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心的策略相结合,即将先前数据块的聚类中心附近的几个样本点添加到下一个数据块进行聚类,以避免FCM对噪声的敏感性。此外,所提出的聚类算法使用一种新的改进后的距离度量的同时,使用修正后的约束条件和目标函数。通过以上改进,可以有效区分已知类和未知类在算法中的不同影响程度,并加强类之间的相互影响程度。实验结果表明,该算法对高维噪声数据具有很好的聚类效果和鲁棒性。  相似文献   

19.
一种基于投影的散乱数据表面增量重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对3维散乱数据场提出了一种表面重建算法.根据空间曲面的局平特性和平面三角化的基本原则,在参考点的切平面上对邻域点按角度排序,应用可见性准则删除不可见点后,相邻邻域点和参考点形成三角网格.将平面上的网格关系对应到空间,以增量方式重建反映散乱数据场拓扑关系的空间曲面.设定角度阈值优化网格,判断空间曲面的边界和孔洞.对多个数据场进行重建并对结果进行分析.对多个数据场进行重建并对结果进行分析表明,算法具有原理简单,重建速度快,重建效果好的特点.  相似文献   

20.
花小朋  皋军  田明  刘其明 《计算机工程》2009,35(22):210-211
通过对SVDD增量学习中原样本和新增样本的特性分析,提出一种改进的SVDD增量学习算法。在增量学习过程中,该算法选取原样本的支持向量集和非支持向量中可能转为支持向量的样本集以及新增样本中违反KKT条件的样本作为训练样本集,舍弃对最终分类无用的样本。实验结果表明,该算法在保证分类精度的同时减少了训练时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号