首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 547 毫秒
1.
Deep Web指无法简单地通过搜索引擎或网络爬虫能够检索到的隐藏在后台数据库中,而往往这些内容具有丰富的信息和数据.获取Deep Web所蕴含的丰富信息的有效方法是构建Deep Web集成框架,而查询接口作为Deep Web的唯一访问接口,所以Deep Web集成系统的关键就是构建Deep Web集成接口.研究的目标是通过自动构建特定领域的本体来表示Deep Web接口信息,从而能够自动识别该领域Deep Web接口来建立索引,提取数据库中丰富的资源.在没有人为干预的情况下展开整个过程.本文的方法能完全自动地提取Deep Web接口信息并派生领域本体,并通过本体贝叶斯网络识别新Deep Web接口,进行匹配.在特定领域,通过一种新的自动从Deep Web接口中提取属性方法,通过WordNet构建成本体语义树,运用得到的领域语义本体树结合贝叶斯网络完成领域分类,并在分类后进行查询接口与集成接口的模式匹配.本文提出的方法通过对比人工提取属性构成的语义树在分类和模式匹配的结果进行对比,验证了该方法的可用性和适用性.  相似文献   

2.
一种Web数据库大小估算新方法   总被引:1,自引:0,他引:1  
为估算Web数据库大小,提出了一种基于属性相关度和样本独立特性的Web数据库大小估算方法.首先通过中科院分词系统ICTCLAS对通过提交查询获得文本属性值进行分词以便计算属性相关度,再通过属性的相关性获得属性近似独立样本,进而依据样本的独立性来估算Web数据库的大小.并通过实验验证,本方法能获得较高的准确性.  相似文献   

3.
Web中存在大量可以访问的在线数据库,如何快速准确地选择出与用户查询相关的数据库变得越来越重要。如果只是简单地把集成接口上的查询转换到对该领域每个数据库的查询,那么要访问该领域的每个数据库将花费大量的代价,并且一个领域中大部分的数据库之间存在着冗余的信息,这样查询结果也会产生大量的信息冗余。本文给出了基于TOP-N查询的数据库选择方法,并对其不相关度距离计算和数据库选择方法进行了改进,使得在数据库选择中减少了资源的浪费,提高了选择查询性能。  相似文献   

4.
基于查询接口特征的Deep Web数据源自动分类   总被引:3,自引:0,他引:3  
搜索引擎可以很好地搜索出大部分可索引页面,然而,Internet上有大量的页面是由后台数据库动态产生的.传统的搜索引擎搜索不出这部分页面,我们称之为Deep Web。其中大部分Deep Web是结构化的,它提供结构化的查询接口和结构化的结果。把这些结构化的Deep Web数据源按所属领域进行组织可以方便用户浏览这些有价值的资源.并且这也是大规模Deep Web集成搜索的一个关键步骤。提出了一种基于查询接口特征的Deep Web数据源自动分类方法.并通过实验验证该方法是非常有效的。  相似文献   

5.
DataView是ADO .NET对象群中一个重要的成员 ,它可以用于一般的Web数据库查询 ,也可以和其它控件结合起来实现高级的Web数据库查询以及查询结果的分页显示。本文通过实例介绍了DataView在Web数据库查询上的各种应用。这些实例在开发Web数据库应用系统中很有实用价值  相似文献   

6.
提出了一种面向对象的通用数据库访问接口泛化的方法。通过从数据库系统的数据目录中提取数据字典,将数据库访问请求基于数据字典进行编码来实现数据库访问接口参数的泛化,在数据库接口中通过对泛化后的数据库访问请求解码和查询结果的对象化实现对数据操纵语言和数据查询语言访问的泛化,解决了传统的面向对象的数据库访问接口与数据库结构深度耦和的问题,从而实现了数据库访问接口的标准化和通用化。  相似文献   

7.
《现代电子技术》2017,(16):50-52
传统DBA数据库控制方法对系统参数进行设置和配置时,存在控制效率低以及能耗高的问题。提出基于JADE的数据库自适应负载控制方法,设计以JADE平台为基础的数据库自适应负载控制系统。系统由搜索和查询两部分构成,通过Agent之间相互协作来完成总体系统的负载控制。通过数据库爬虫Agent在数据库中搜集信息,形成原始数据库;应用KNN算法对原始数据库进行分类,实现数据库负载控制。查询部分通过JSP页面中的用户接口Agent实现与用户的交互;采用JDBC桥技术实现查询Agent对数据库的访问。实验结果表明,采用所提方法控制数据库负载,可提高数据库的实现价值、吞吐率以及资源利用率。  相似文献   

8.
为有效解决Deep Web数据库中数据纠错、消重和整合问题,优化Deep Web数据库实体查询性能.提出一种基于智能语义自相关特征的Deep Web数据库优化识别查询模型.模型由文本匹配模型、语义自相关特征分析模型和分组统计模型构成,设计语义自相关特征提取算法,定义语义信息约束规则,优化逼近数据库实体识别结果,使用语义自相关特征建立表象关联知识库,实现数据查询过程中的纠错、消重、整合.最后用数学推导证明了算法的稳定性.仿真模拟实验表明,算法能综合考虑文本特征、语义自相关特征和约束规则,数据库查询识别结果不断精化,数据查询准确性和有效完备性提高显著.  相似文献   

9.
语义标注是Deep Web数据集成系统中一个非常重要的模块,它是实体识别和结果合并这两模块的基础,语义标注的效果直接影响着整个Deep Web数据集成系统的结果。本文提出了在图书领域,利用本体对Web数据库查询结果通过属性值进行语义标注,通过对不同网站的测试,该方法具有较高的准确率和召回率。  相似文献   

10.
Web数据库的访问技术   总被引:1,自引:1,他引:0  
李建廷 《现代电子技术》2004,27(14):43-44,46
介绍Web数据库的连接与访问技术,并对目前流行的方法做介绍与比较:一种是在Web服务器端提供中间件来连接Web服务器和数据库服务器(通过网关接口CGI和应用程序接口APD;另一种是把应用程序下载到客户端并在客户端直接访问数据库。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号