首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种基于XML的Web数据挖掘模型,该模型能很好地体现XML的优越性,并有效地实现Web数据挖掘。  相似文献   

2.
李环 《福建电脑》2008,24(4):37-38
Web数据挖掘是目前数据挖掘领域中一个很重要的研究领域,文章首先介绍了Web数据挖掘的几个分类,分析了Web数据挖掘所面临的问题,最后介绍了XML技术并对XML在Web数据挖掘的应用进行了研究。XML的推广和使用对于推动Web数据挖掘具有重要意义。  相似文献   

3.
讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

4.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

5.
基于XML数据模型及面向Web数据挖掘技术   总被引:2,自引:0,他引:2  
本文主要对Web上的数据结构特征及其数据挖掘技术进行分析,并就把XML作为一种半结构化的数据模型实施查询与模型抽取,从而完成面向Web数据挖掘的方法,且结合SQLSwrver2000的应用及实现智能查询应答的思想进行探讨。  相似文献   

6.
在经济全球化形势下,充分利用Web资源,从中挖掘出有决策意义的信息,对企业的自主发展有着不可估量的意义。本文在分析了Web数据挖掘技术的难点后,根据互联网技术的发展趋势,介绍了基于XML的Web数据挖掘技术并提出了一个基于XML的证券信息数据挖掘系统的实现框架。  相似文献   

7.
基于XML的Web数据挖掘关键技术的研究   总被引:8,自引:0,他引:8       下载免费PDF全文
由于存在着大量的在线信息,WWW成为数据挖掘的热点。该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨。  相似文献   

8.
一种基于XML的Web数据挖掘方法   总被引:8,自引:0,他引:8  
杨鲲  孟波 《计算机应用》2003,23(Z1):160-161
XML的出现为基于Web的数据挖掘带来了便利,但是目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难.介绍一种方法充分利用XML的优点对HTML描述的网站信息进行挖掘,并结合实例说明了这种方法.  相似文献   

9.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

10.
面向Web的数据挖掘是当今数据挖掘技术的热点。本文首先介绍数据库挖掘技术和Web挖掘技术的相关背景,然后详细阐述了XML语言的卓越特性及其在Web数据挖掘中的重要应用,最后文章描述了基于XML的Web挖掘的具体过程。  相似文献   

11.
基于XML的web文本挖掘方法与模型研究   总被引:2,自引:2,他引:0  
Internet的快速发展和大量非结构化数据的出现,给传统的数据挖掘工具带来了极大的挑战。XML(可扩展标记语言)技术一方面继承了HTML的灵活性和简单性,另一方面又具有强制结构的完整性和标签的自定义性,已经成为web挖掘的一个重要方向。本文在介绍XML语言基本特点的基础上,针对web上大量异构数据的特点,探讨了基于多叉树的HTML到XML的转换方法,实现web上文本的规范化,并将其用于提出的基于XML的web文本挖掘模型,提高web文本挖掘的有效性。  相似文献   

12.
基于XML的数据挖掘   总被引:11,自引:2,他引:11  
基于人工智能的数据挖掘,其结果受到人工智能研究的制约。XML技术的出现,为在数据组织中更好地体现数据本身的含义提供了很好的途径。对基于XML的数据挖掘基本过程进行了探讨研究,提出了在数据挖掘过程中,从数据源到发现知识全过程都基于XML进行描述处理的方法与过程。  相似文献   

13.
XML是W3C组织于1998年2月发布的一种标记语言标准,其具有易于扩展、结构性强、交互性好、语义丰富、基于内容的数据标识、可格式化、易于处理、与平台无关的特点,使得数据层在XML技术的支持下得到统一。通过对海洋温盐深数据进行结构分析,本文设计了温盐深数据XML Schema,定义了温盐深数据的XML数据结构。  相似文献   

14.
XML data mining     
With the spreading of XML sources, mining XML data can be an important objective in the near future. This paper presents a project focussed on designing a general‐purpose query language in support of mining XML data. In our framework, raw data, mining models and domain knowledge are represented by way of XML documents and stored inside native XML databases. Data mining (DM) tasks are expressed in an extension of XQuery. Special attention is given to the frequent pattern discovery problem, and a way of exploiting domain‐dependent optimizations and efficient data structures as deeper as possible in the extraction process is presented. We report the results of a first bunch of experiments, showing that a good trade‐off between expressiveness and efficiency in XML DM is not a chimera. Copyright © 2009 John Wiley & Sons, Ltd.  相似文献   

15.
Web数据挖掘中数据集成问题的研究   总被引:3,自引:0,他引:3  
在分析Web环境下数据源特点的基础上,对Web数据挖掘中的数据集成问题进行了深入的研究,给出了一个基于XML技术的集成方案.该方案采用Web数据存取方式将不同数据源集成起来,为Web数据挖掘提供了统一有效的数据集,解决了Web异构数据源集成的难题.通过一个具体实例介绍了Web数据集成的过程.  相似文献   

16.
基于XML数据的FP-growth算法挖掘研究   总被引:1,自引:0,他引:1  
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。  相似文献   

17.
对数据挖掘结果进行存储和维护能够提高数据挖掘效率并为共享挖掘结果提供更多的途径,为企业决策提供强有力的支持.对结构各异的结果模式进行存储首先需要一种表示半结构化信息的数据表示方法,而XML非常适合半结构化信息的描述.重点研究了以XML描述5种常见数据挖掘结果的方法,并提出了这5种数据挖掘结果的统一描述方法,为数据挖掘结果的集中存储、管理、利用以及共享奠定了基础.  相似文献   

18.
基于本体的XML关联规则挖掘方法   总被引:1,自引:0,他引:1  
刘造新 《计算机应用》2008,28(9):2318-2320
针对传统的数据挖掘技术不能直接应用到半结构化的XML数据挖掘问题,给出了基于本体的XML关联规则挖掘方法。该方法引入领域本体和哈希技术来改进产生频繁项目集的操作和生成关联规则的操作,并且使用哈希表存储相关的领域本体,从而将数据库操作转化为对XML内存树的操作,通过理论分析和实验验证了方法的挖掘效果,论述了该方法的优点。  相似文献   

19.
ABSTRACT

XML based attacks are executed in web applications through crafted XML document that forces XML parser to process un-validated documents. This leads to disclosure of sensitive information, malicious code execution and disruption of services. OWASP has included XML based attacks at number four in its top 10 list of vulnerabilities published in 2017. Most of the vulnerabilities reported using the XML document range from high to critical and require to be addressed immediately. As per the National Vulnerability Database, 152 vulnerabilities have already been reported in the first five months of the year 2019. A varied number of XML vulnerabilities and their classification exist but are limited to a specific vulnerability. In this paper, the authors have proposed a classification of XML based vulnerabilities based on exhaustive literature survey. The approach/strategies to mitigate these vulnerabilities are also presented. The work will help the web developers for proposing secure parsers that will thwart such attacks.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号