首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 86 毫秒
1.
基于XML的Web信息存储解决方案   总被引:4,自引:0,他引:4  
基于Internet数据的大量涌现,而且Internet上的数据不是一种规则的、有结构的数据。这种数据被称为半结构化数据。半结构化数据可能有以下特征: ·数据是不规则的,不符合严格的模式。半结构化数据是传统的数据库难以管理的。在关系模式中,处理非规则数据的方式是用空值代替。在面向对象数据库系统中,虽然复合类型、继承机制提供更多的灵活性,但设计出合适的面向对象模式来容纳非规则数据仍然是困难的;  相似文献   

2.
彭岩  涂序彦 《计算机科学》2003,30(6):101-102
The increasing stream of Web information available makes it ever more desirable of network users to retrieval interesting information efficiently.Obviously,AI can be made a good use in the information retrieval area.In this paper,the Intelligent Search Engine,Intelligent Browser,Intelligent Agent and Intelligent Information Push are introduced.Then the related key techniques are presented.At last,a framework of Intelligent Information Push System is discussed.  相似文献   

3.
基于示例的Web信息自动获取系统的设计与实现   总被引:1,自引:0,他引:1  
介绍了一个基于多层体系结构的个性化Web信息自动获取系统的设计与实现,提出了一种新的基于少量中文示例Web页面的兴趣特征抽取算法,并给出了系统的检全率和检准率测试结果.实验结果表明,较基于关键词的搜索引擎而言,该系统能充分考虑用户的兴趣偏好(示例),长期、主动地向用户提供更加准确的Web信息获取服务.  相似文献   

4.
基于Web服务的旅游信息交换平台的研究   总被引:1,自引:0,他引:1  
随着Internet的迅猛发展,旅游信息化在旅游业中扮演越来越重要的角色。信息的发展必然促进行业内大量信息和数据的交换。然而不同信息系统的互联互通问题,已经成为旅游行业信息化建设的瓶颈。在对现有各种信息系统调研和分析的基础上,依据上海旅游委制定的旅游信息交换规范,提出一种基于Web服务的旅游信息交换平台模型,能够有效地实现数据共享,并且投入成本低、对现有系统透明和易可扩展性。同时针对该模型实现了一个原型系统。  相似文献   

5.
基于Web的表格信息抽取研究   总被引:1,自引:0,他引:1  
如今,Web成为了网络信息的主要平台。根据研究发现,表格在Web文本中被经常使用。正因为表格形式简洁并且含有丰富的信息,自动理解表格在知识管理、信息检索、Web挖掘等应用中有着广泛的用途,所以研究Web表格信息抽取有着重要的现实意义。互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文首先将HTML文档转换为XML文档,结合本体形成启发式规则,对表格定位、表格结构识别两个关键技术进行了分析。在此基础上,利用HTML表格属性,将HTML表格标准化,从而适用于复杂表格的信息抽取。  相似文献   

6.
如今,Web成为了网络信息的主要平台。根据研究发现,表格在Web文本中被经常使用。正因为表格形式简洁并且含有丰富的信息,自动理解表格在知识管理、信息检索、Web挖掘等应用中有着广泛的用途,所以研究Web表格信息抽取有着重要的现实意义。互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文首先将HTML文档转换为XML文档,结合本体形成启发式规则,对表格定位、表格结构识别两个关键技术进行了分析。在此基础上,利用HTML表格属性,将HTML表格标准化,从而适用于复杂表格的信息抽取。  相似文献   

7.
基于Web的智能信息获取研究   总被引:5,自引:0,他引:5  
本文讨论了当前信息检索领域的先进搜索技术和Agent信息获取技术。从应用的角度提出一利新的智能信息获取方法,包括分词过程、止滤过程、词频计算过程和取舍过程。为进步满足Web信息检索提供一种个性化的高效信息检索二具。  相似文献   

8.
基于Web Services的供应链信息集成研究   总被引:3,自引:0,他引:3  
作为信息集成的有效解决方案,Web Services被用来集成异构应用与分布式对象模型。Web Services支持更为复杂的Web交互,并支持供应链企业之间的信息集成(B2Bi)与协作。在阐述了Web Services集成概念与理论的基础上,对供应链信息集成的方法与实例进行了较为深入的研究。  相似文献   

9.
基于Web的数据库技术与应用   总被引:4,自引:0,他引:4  
本介绍Web上的数据特征和数据库的集成方法,以及基于Web信息获取与知识发现技术,指出基于Web的信息系统研究的重要性。  相似文献   

10.
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询。  相似文献   

11.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

12.
研究Web信息提取技术,提出数据获取、规则定义和规则执行3个步骤的基于XML的半结构化Web信息提取方法,为进一步满足Web信息提取提供了一种高效的新方法.  相似文献   

13.
阐述了Web Service技术,提出了基于XML和Web Service实现野外试验站信息发布平台以及实现平台关键技术的研究。  相似文献   

14.
文章介绍了基于专门设计能上网浏览的网络电话机的信息服务系统(NetIS),通过普通电话线路实现对酒店客户的信息服务。以Java语言和XML技术为基础,利用专门设计的软件在服务器端完成对WAP网站资料的解析、消息处理、电子邮件收发、客户资料库的建立和与酒店其它信息管理系统的数据交换等工作,客户在客房可享受互联网和酒店内部两种服务。系统还可收集、统计、分析客户的各种习惯,为客户提供相应的个性化服务,具有使用简单方便、成本低的特点,具有较好的应用前景。  相似文献   

15.
科研管理内容繁多,流程复杂,必须借助信息化的网络平台才能有效地开展工作。分析了科研管理系统的需求,阐述了系统的流程及各功能模块的开发目标,提出了系统设计的关键要点。  相似文献   

16.
当今万维网已成为一个庞大的资源库,其中包含海量的信息,同时也充斥大量垃圾信息。所以,如何有效地采集Web信息是当前研究的热点问题。通过研究Web信息采集技术和NekoHTML,介绍如何使用NekoHTML进行Web信息采集的方法。  相似文献   

17.
本文论述了利用语义挖掘Web结构、Web使用挖掘进行了基于语义挖掘方法的探讨,并对PageRank算法进行了分析,针对该算法的不足之处进行了改进。  相似文献   

18.
本文论述了利用语义挖掘Web结构、Web使用挖掘进行了基于语义挖掘方法的探讨,并对PageRank算法进行了分析,针对该算法的不足之处进行了改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号