首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 109 毫秒
1.
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源。在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响。该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步。  相似文献   

2.
分析了现有异构数据源的数据集成的方式,为了保持各数据源的自治性和满足数据查询的实时性,提出使用中间件体系结构的集成方案。介绍Web Service分布式计算模型及其特点,提出了一种基于Web Service技术进行异构数据源集成的方法。通过Web Service能将连接在Internet上的异构数据泺构建成一个虚拟的全局数据库,为用户提供透明统一的接口,从而实现异构数据资源的共享和整合。  相似文献   

3.
基于Web2.0的数据集成系统的设计与实现   总被引:2,自引:0,他引:2  
为了丰富原有的语料库,以满足自然语言理解与处理研究所需,根据对基于Web 2.0的数据源的分析,设计并实现了一个可扩展的基于Web 2.0的数据发布与集成系统.该系统采用B/S模式,以用户参与发布的信息为数据来源,综合应用Ajax等先进的Web技术,集成了自然语言理解研究所需数据,具有良好的性能和应用价值,为相关领域的研究和应用提供了参考.  相似文献   

4.
数据库集成系统中数据语义和属性不一致问题的解决方法   总被引:2,自引:1,他引:1  
介绍了数据库集成时所需要的主要知识,提出了利用模糊集合理论解决数据库集成系统中数据语义和数据值不一致的方法,最后结合例子描述了数据库集成环境中的查询处理方法,该方法能适用于各种应用环境。  相似文献   

5.
多数据库集成环境下查询优化研究   总被引:5,自引:0,他引:5  
在多数据库集成系统中,用户查询由中介系统转换为对各局部数据库的内部操作及局部数据库之间的数据传递。搜索一条访问相互连接数据源的路径以获得综合开销最小的查询策略,是多数据库集成环境向查询优化提出的新的挑战。文章设计了一个新的中介系统,将查询优化问题分为两个阶段,并在此基础上通过化简策略空间、有效的代价估算和策略搜索算法,以提高多数据库环境下查询优化器的工作效率。  相似文献   

6.
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径,Deep Web爬虫是Deep Web数据源集成的关键组成部分,提出一种针对结构化Deep Web的聚焦爬虫爬行策略,通过对查询接口的特征分析来判断Deep Web数据源的主题相关性,同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息,实验证明该方法是有效的.  相似文献   

7.
基于XML和Web Service的数据集成中间件   总被引:3,自引:0,他引:3  
主要研究多源异构数据集成的方法,其目标是向具有访问异构数据源要求的用户提供一个统一的查询接口,而不必考虑各局部数据源之间的差异。目前,在多种异构数据源集成方法中,中间件法由于其成本低、容易实现,以及局部数据源加入方便灵活,自治性强等优点,已成为数据集成的主要方法。本文采用中间件法,利用XML技术和Web Service,对多源异构数据的集成问题进行了探讨。  相似文献   

8.
基于消息代理的数据集成框架研究   总被引:1,自引:0,他引:1  
介绍了数据集成的基本概念及集成方法,同时分析了异构数据源的共性。为此,笔者设计并实现了基于消息代理的数据集成框架。该框架借鉴了Web服务的体系结构.并利用消息中间件的消息传输机制改善Web了服务在数据集成方面的不足。  相似文献   

9.
提出的异构数据集成系统框架包括源模式层、局部模式层、全局模式层和用户模式层.利用Web service接口完成从源模式层到局部模式层的转换,利用模式融合和冲突解决实现从局部模式到全局模式的转换,并嵌入数据查询过程.用户模式层作为全局模式层的一个子集,可以动态调整,方便集成数据的查询处理,还定义了一个基于XML的统一数据模型以支持异构数据的集成中的查询处理,提出了一个相应的查询处理过程.  相似文献   

10.
《信息技术》2019,(3):37-39
针对当前科技资源共享性差的现状,文中提出一种基于SOA的科技资源共享平台建设方案。并在资源分类、数据集成共享、Web服务查找优化等关键问题上进行研究,根据实际开发情况,将科技资源分为六类,使用XML对分布式异构数据库数据进行集成,建立Web服务cache库提高Web服务查询效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号