首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 388 毫秒
1.
立足于XML技术,以数据挖掘为应用背景,研究、探讨了面向XML数据库的挖掘技术。基本出发点是充分发挥传统数据挖掘中成熟丰富的技术优势,兼顾XML数据库的特点,实现二者的紧密结合,最终达到能够对以XML数据库为挖掘源进行简便、有效的挖掘这一目的。在全面介绍XML及其相关技术的基础上,针对提取关联规则这一数据挖掘目的,给出了基于XML数据库的关联规则挖掘方法,旨在探索出一种面向XML数据较好的挖掘方法,解决从XML这种半结构化数据中挖掘知识的问题。  相似文献   

2.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

3.
由于Web数据所具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘.基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘.文中综述了基于Web的数据挖掘技术,并且介绍了一种全新的技术XML.XML的推广和使用,对于推动Web挖掘和知识获取具有重要的意义.如何进一步的开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究.Web数据挖掘的研究具有极大的挑战性同时又具有极大的开发潜力.  相似文献   

4.
数据挖掘在XML的维修管理系统中的应用研究   总被引:1,自引:0,他引:1  
数据挖掘(Data Mining,DM)技术是当前研究热点之一。本文根据维修管理系统利用XML(可扩展标记语言)的格式标记交换数据的特点,建立了数据挖掘系统模型,对数据结构和数据取样处理进行分析,最后利用决策树ID3修正算法,给出了数据挖掘的具体实现,通过项目验证了该数据挖掘模型在系统中的可行性。  相似文献   

5.
煤矿系统数据挖掘模型的研究与设计   总被引:1,自引:0,他引:1  
随着煤矿生产系统信息化、集成化程度的提高,对矿山多源异构数据挖掘系统的研究已成为矿山生产、研究部门共同关注的问题。在分析数据挖掘通用模型以及煤矿数据特点的基础上,以XML作为一种异构数据挖掘的标准,提出了一种煤矿数据挖掘系统原型架构。整个系统模型包括数据获取模块、XML隧道、数据挖掘模块和基于XML的知识表达模块,对各个模块的功能以及XML文档与数据库之间互相转换的关键技术进行了深入的研究探讨。  相似文献   

6.
王斌 《计算机仿真》2005,22(10):1-3
随着大型数据库的不断涌现,如何从浩如烟海的数据中发现隐藏的有用知识,成为一个迫切需要研究的课题.因此,知识发现和数据挖掘应运而生.该文提出了数据挖掘的基本概念,数据挖掘是数据库技术、人工智能、机器学习、统计分析、模糊逻辑、模式识别和人工神经网络等多个学科相结合的产物,然后分析了数据挖掘一般算法的结构,并且对数据挖掘技术进行了详细分类,主要包括决策树技术、神经网络技术、粗集以及模糊集等十多项挖掘技术.最后讨论了数据挖掘在人工智能、电子商务应用和移动通信计算等方面的研究方向.  相似文献   

7.
基于SQL Server 2000下数据挖掘算法的研究   总被引:1,自引:0,他引:1  
微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法.决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识.SQL Server 2000/Analysis Service两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件.并讨论了通过使用像SQL Server 2000 Analysis Service这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据.  相似文献   

8.
基于数据挖掘的煤矿安全信息管理模型的研究   总被引:1,自引:0,他引:1  
基于对数据挖掘技术、粗糙集理论、模糊逻辑与神经网络算法的分析,文章提出了一种基于数据挖掘的煤矿安全信息管理模型的设计方案。该模型应用Web服务器注册技术和XML数据合成技术形成终端数据库,采用数据挖掘技术中的粗糙集理论和模糊逻辑与神经网络算法形成终端数据仓库,并对终端数据仓库进行统一分析、管理和维护,有效地提高了煤矿安全信息管理的效率。  相似文献   

9.
分类在数据挖掘中是一项非常重要的任务.分类的目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,从而用于数据分类或预测.决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型.主要研究了数据挖掘中的一种基于决策树的分类算法,以及在公交系统数据预测中的应用.在此基础上进一步讨论了ID3算法存在的一些问题并给出了解决方案和实现过程.其研究结果对开发交通规划决策支持系统具有重要的参考价值.  相似文献   

10.
基于Web的数据挖掘技术   总被引:7,自引:1,他引:7  
基于Web数据挖掘是一个结合了数据挖掘和WWW的热门研究主题.本文综述了基于Web的数据挖掘技术,介绍了Web数据挖掘目前最流行的分类:Web内容挖掘、Web结构挖掘和Web访问挖掘,根据Web数据挖掘的最近研究现状,小结了几个研究热点.由于Web数据所具有的半结构化特性,使得Web数据挖掘更为复杂,不同于传统的基于数据库的数据挖掘.最后介绍一种全新的技术XML,XML的出现为解决Web数据挖掘的难题带来了机会.Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力.  相似文献   

11.
In the past decade, XML has emerged as the standard language for information exchanging over the Internet. Due to its tree-structure paradigm, XML is superior for its capability of storing, querying, and manipulating complex data. Therefore, discovering frequent tree patterns over tree-structured data has become an interesting topic for XML data management. In this paper, we propose a tree mining algorithm, named BUXMiner, for finding a special class of frequent trees, called rooted unordered trees, from a tree-structured database. BUXMiner employs an efficient bottom-up approach to enumerate all candidate trees over a compact global tree guide and computes the frequent trees based on the tree guide. In addition to BUXMiner, we also propose a mining approach called BUMXMiner to discover the maximal frequent rooted unordered trees. We compare BUXMiner with previous tree-structure mining algorithms, namely XQPMinerTID and FastXMiner, which were also proposed to discover rooted unordered trees. The experimental results show that our algorithm outperforms XQPMinerTID and FastXMiner in terms of efficiency. The performance results from real-world applications also indicate the usefulness of our proposed tree mining algorithms in a variety of web applications, such as analysis of web page access patterns and mining frequent XML query patterns for caching.  相似文献   

12.
基于本体的XML关联规则挖掘方法   总被引:1,自引:0,他引:1  
刘造新 《计算机应用》2008,28(9):2318-2320
针对传统的数据挖掘技术不能直接应用到半结构化的XML数据挖掘问题,给出了基于本体的XML关联规则挖掘方法。该方法引入领域本体和哈希技术来改进产生频繁项目集的操作和生成关联规则的操作,并且使用哈希表存储相关的领域本体,从而将数据库操作转化为对XML内存树的操作,通过理论分析和实验验证了方法的挖掘效果,论述了该方法的优点。  相似文献   

13.
基于XML Schema的XML存储   总被引:6,自引:0,他引:6  
郝春辉  邹静 《计算机工程与应用》2006,42(11):173-175,204
文章介绍了一个在关系数据库中,基于XMLSchema的XML存储方案。描述了一个以树模型为模型,XMLSchema为模式的XML数据库的存储系统。首先给出了在关系数据库中存储XMLSchema的方法,在此基础上,又给出了存储XML文档的方法。与通常的XML分解存储方案不同之处在于,在该方案中,XMLSchema被保存到数据库中,未作模式映射,避免了模式映射通常会带来的数据丢失和数据要分散到多个关系表中的问题;对XML文档的存储和查询都是基于XMLSchema的;并且由于所有基于同一个模式的XML文档共享该模式的结构,不必对结构信息进行重复存储,减少了存储空间;最后,由于我们为每一个元素赋予了一个唯一ID值,在进行查询的时候,可以利用该ID值进行定位,具有和XPath表达式相同的作用,但是更为简便。  相似文献   

14.
将数据挖掘集成到关系数据库中,可以使数据挖掘技术直接利用关系数据库中的数据生成挖掘模型.以决策树技术为研究实例,通过把决策树算法重新设计为基于SQL的汇总和查询分析操作,提出一种新的基于SQL的决策树算法.同时,通过理论分析表明,在L/O性能方面,文中算法比SPRINT算法要好.  相似文献   

15.
基于XML数据的FP-growth算法挖掘研究   总被引:1,自引:0,他引:1  
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。  相似文献   

16.
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。  相似文献   

17.
传统XML数据库并发控制协议大多采用基于XML文档树的路径加锁方式,并发度不高。针对该问题,提出一种基于局部路径加锁模型的XML数据库并发控制协议。该协议基于XML的节点编码,利用查询函数对目标节点的祖先后裔加锁情况进行快速判断,并根据操作类型对目标节点或者其父节点进行加锁,从而减少对锁的频繁请求,提高事务并发度以及实现大规模XML数据的有效管理。  相似文献   

18.
为了消除数据冗余,基于关系数据模型的函数依赖理论已经被广泛接受并应用于关系数据库的设计中。XML数据库中同样存在数据冗余。为了设计没有冗余的XML数据库,需要用一种简洁、易于理解的方法来定义XML数据问依赖关系。在无序的结点标记树数据模型上定义了XML子树间的函数依赖,并且给出了一套公理系统用来推导函数依赖,以解决函数依赖的蕴涵问题,最后证明了该公理系统是合理的。  相似文献   

19.
本文提出了一种基于XML数据库的关联规则分析模型。在对XML数据库和XQuery查询语言作了简要介绍以后,提出了基于XML数据库的关联规则分析的研究思想,并描述了基于这个思想进行关联规则分析的模型。最后,通过一个例子说明了如何利用这个模型进行关联规则分析的具体过程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号