排序方式: 共有25条查询结果,搜索用时 0 毫秒
1.
2.
为聚类非线性相关的数据对象,引入广义信息论中二次互信息作为相似性度量,利用矩阵理论降低了二次互信息的计算量,并结合滑动窗口技术,建立了一种时序数据非线性相关模型.在此基础上提出了适用于时序基因表达数据的确定性联合聚类算法MI-TSB.该算法将时序数据转化为抽象字符序列,然后插入到MI-泛化后缀树中,避免了穷举各种组合,从而快速索引全部聚类结果.实验结果显示MI-TSB算法具有良好的运行性能,成功聚类出非线性相关的对象;利用Gene Ontology对聚类结果进行基因注释,也验证了聚类结果的生物学意义. 相似文献
3.
数据挖掘技术在能量管理系统中的应用 总被引:3,自引:0,他引:3
长期运行的电力系统能量管理系统数据库积聚了大量的时态数据,有效地利用这些丰富的数据资源,并采用适当的数据挖掘技术进行处理,可以发现潜在的运行规律和知识,将有助于系统更高效更安全的运行。 相似文献
4.
目前Web代理服务器中的缓存机制普遍都以提高缓存命中率为目标,来设计相应的页面置换算法,一般并不考虑命中页面因过期失效而需要额外的验证及更新这一因素。为此,提出了改进的页面缓存效益模型,对包括页面验证更新在内的各种相关因素进行了综合考虑,以缓存效益系统最优为目标提出Web代理服务器中缓存置换算法——PCR;并基于合理的假设证明了该算法的最优性。最后,通过与LRU-K、Hybrid等算法的比较实验,验证了PCR算法的有效性。 相似文献
5.
不确定图最可靠最大流算法研究 总被引:1,自引:0,他引:1
文中首先基于可能世界模型提出了不确定图的最可靠最大流问题和可靠性计算模型,这对于构建可靠性网络、可靠传输路径选择以及系统薄弱环节分析等一系列实际问题具有重要意义;然后基于简单路径组合思想提出了一种求解最可靠最大流的算法SPCA,通过简单路径流量的组合,在无需求得所有最大流分布的情况下获得最可靠最大流,并在组合过程中引入概率剪枝与约束剪枝策略,对无效组合进行过滤,从而显著地提高了算法效率;接着文中针对SPCA算法易受路径数量及瓶颈容量影响的问题,又提出一种基于状态空间划分的最可靠最大流算法SDBA,该算法的主要思想是将不确定图所蕴含的子图空间划分为互不相交且满足最大流值的闭合区间集合,进而寻找所有闭合区间中概率最大的下界状态,经证明这个下界状态对应子图中的最大流分布为最可靠最大流;最后通过实验,比较了两种算法的性能.实验结果表明SDBA算法相对于SPCA算法其空间复杂度有一定的增加,但时间复杂度方面具有较大的优势,能够很好地解决SPCA算法性能受制于容量的问题,具有更好的性能与适用性. 相似文献
6.
高维数据流子空间聚类发现及维护算法 总被引:3,自引:2,他引:3
近年来由于数据流应用的大量涌现,基于数据流模型的数据挖掘算法研究已成为重要的应用前沿课题.提出一种基于Hoeffding界的高维数据流的子空间聚类发现及维护算法--SHStream.算法将数据流分段(分段长度由Hoeffding界确定),在数据分段上进行子空间聚类,通过迭代逐步得到满足聚类精度要求的聚类结果,同时针对数据流的动态性,算法对聚类结果进行调整和维护.算法可以有效地处理高雏数据流和对任意形状分布数据的聚类问题.基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性. 相似文献
7.
最可靠最大流是不确定图中可靠性最高的最大流,它是传统最大流问题在不确定图上的自然延伸.现有的最可靠最大流算法SDBA时间复杂性较高,无法满足实际中不同应用的需求,为此,文中提出一种具有普遍适用性的最可靠最大流解决方案.该方案包含面向不同需求的3种算法:基于负权群落消去的NWCE算法、基于时间约束优先单环消去的SPEA-t算法和基于概率阈值约束优先单环消去的SPEA-p算法.其中,NWCE算法借鉴最小费用最大流的"流平移"思想并基于文中提出的负权群落概念,在辅助剩余图中不断地消去可使可靠性增加而流量不变的负权群落,可证当消去所有负权群落时对应的最大流即为最可靠最大流.根据负权群落中由单环组成的群落占很高比例且相对于多环组成的群落更易查找和消去的性质,同时考虑到NWCE算法为了获得最优解,往往为了消去最后少数几个对概率提高贡献很小的负权群落却花费了很长时间的现象,提出SPEA-t和SPEA-p两种快速近似算法,前者是以规定时间内尽可能逼近最优解为目标,后者是以最少时间达到预设的概率阈值为目标,它们都采用了优先消去概率-时间效益较好的单环群落的策略,加快对最优解的逼近速度,减少或放弃时间开销较大的多环群落的消去,以满足那些对算法时间性能要求很高而结果以近似最优即可的应用需求.实验表明,相对于SDBA算法,NWCE算法结合概率剪枝策略在时间性能上有了数量级的提高,而SPEA-t算法和SPEA-p算法则具有更高的性能和更好的适用性. 相似文献
8.
高维数据流聚类及其演化分析研究 总被引:5,自引:0,他引:5
基于数据流数据的聚类分析算法已成为研究的热点.提出一种基于子空间的高维数据流聚类及演化分析算法CAStream,该算法对数据空间进行网格化,采用近似的方法记录网格单元的统计信息,并将潜在密集网格单元快照以改进的金字塔时间结构进行存储,最后采用深度优先搜索方法进行聚类及其演化分析.CAStream能够有效处理高雏数据流,并能发现任意形状分布的聚类.基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性. 相似文献
9.
关于实视图维护问题的研究 总被引:1,自引:0,他引:1
随着数据仓库技术的迅速发展,实视图作为其中一项可以提供数据存储方式和提高查询响应性能的关键技术得到了充分的重视。但是如何对实视图集进行及时更新,以充分发挥其加快决策查询速度的作用,并满足用户对数据一致性和时新性的要求,却是一个迫切需要解决的关键性技术问题。本文在对实视图维护问题进行了深入研究的基础上,就目前的研究现状作详细的分析和总结。 相似文献
10.
数据仓库在线条件下,物化视图的维护是一项非常具有挑战性的工作.从减少不必要的更新和选择适当的更新时机入手进行较为深入的研究,提出机会更新的维护方法OUMV,并将它与延迟更新进行结合,而获得一种更为有效的在线维护算法ODUA,以克服延迟更新算法存在的不足,实现在线条件下物化视图的高效维护. 相似文献