排序方式: 共有36条查询结果,搜索用时 15 毫秒
1.
改进的差别矩阵及其求核方法 总被引:48,自引:0,他引:48
粗糙集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具.属性约简是粗糙集理论的重要研究内容之一,而现有的很多属性约简算法都是从信息系统(或决策表)的核开始.针对HU利用差别矩阵求解粗糙集中的核方法的错误,叶东毅提出了新的差别矩阵及其求核方法,但计算代价高.为此,给出了改进的差别矩阵定义和求核方法,该方法纠正HU方法的错误,且可有效地降低计算代价. 相似文献
2.
3.
基于nested-loop的大数据集快速离群点检测算法 总被引:1,自引:0,他引:1
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题. 相似文献
4.
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性. 相似文献
5.
孙志挥 《东南大学学报(自然科学版)》1980,(3)
DSK—1系统绘图软件对源程序进行信息处理,生成积分机数据代码。本文叙述了该系统绘图语言的定史、结构及其实现,并给出了程序图形的实例。 相似文献
6.
针对现有k-匿名隐私保护方法的缺点,提出了3种基于敏感元组的隐私数据发布方法.首先,通过定义敏感元组,设计了只保护隐私信息的朴素敏感元组匿名方法(NSTAM).然后,在引入敏感元组密度的基础上,提出了一种扩展的敏感元组保护方法(e-STAM);该方法通过对敏感元组进行mk-匿名运算,引入(1-m)k个非敏感元组,并同等概化引入的非敏感元组,使得匿名后每个分组中的敏感元组密度满足用户设定的阈值m.最后,针对实际应用中发布数据的敏感度差异,引入了加权敏感元组密度概念,并设计了加权的敏感元组数据保护方法(WSTAM);该方法通过对敏感值和敏感元组赋予不同的权重,实现对敏感元组的区别保护.理论分析和实验结果表明,这3种算法能够提高发布数据的精度,保证敏感数据的安全度,因此是有效可行的. 相似文献
7.
从网络数据传输量和响应时间这两个性能因素出发,分析了联邦数据库管理系统原型系统SU-FDBS的运行性能,给出代价分析模型和数据测试的结论。 相似文献
8.
建立了一个考虑更新代价的Web视图置换测度模型,并以此为基础,提出一种物化Web视图在线选择算法DCR.该算法在简单的缓存算法基础上引入了选择置换机制, 通过监测提交的用户查询, 决定是否将其结果予以保存, 必要时依据置换测度值的大小进行置换, 实现Web视图物化总量的控制, 防止视图过分物化, 以降低动态缓存管理、索引和检索的开销.同时可结合适当的维护方式, 提高更新效率, 避免频繁的更新对查询性能产生太大的影响, 使整个算法更具适用性. 实验表明, 在查询集较大、数据源更新比较频繁的场合, DCR算法可以降低视图检索开销, 并可通过机会更新有效减少了失效视图的数量,使算法在用户查询响应性能方面显示出较大的优势. 相似文献
9.
GDLOF:基于网格和稠密单元的快速局部离群点探测算法 总被引:1,自引:0,他引:1
为了适应高维大规模数据集的稀疏性,解决现有离群点探测算法在运用于高维大规模数据集时计算量以及时间效率均无法令人满意的现状,区别于以往文献中以点的数量作为判断稠密的阈值,在基于密度的局部异常检测算法LOF的基础上,以通过数据集中每一点周围的邻近点的状况作为判别依据,提出了稠密单元和稠密区域的概念以及基于网格和稠密单元的快速局部离群点探测算法.通过证明稠密单元和稠密区域中的点不可能成为离群点,使得算法减少了LOF值的计算量并显著提高效率.实验表明,该算法对于高维大规模数据集具有良好的适用性和有效性. 相似文献
10.
在处理不确定信息的概率关系模型PRM(Probabilistic Relational Model)的基础上,为了弱化关系中元组间互斥的约束条件,从事件发生条件概率和谓词的角度出发,进一步论述了概率关系数据库模式的语义、定义及相关操作,给出了更为合理的概率型数据库结构的形式化描述,并对关键字的定义、性质以及概率数据库更新、查询等应用方面做了深入研究。 相似文献