首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 465 毫秒
1.
孟庆鑫 《电子技术》2011,38(3):56-60
为了有效挖掘XML文档集中标签之间、结构之间的语义相似度,以便能够在检索时返回同义异构的XML数据,并对返回结果的质量进行语义级的评估,首先需要分析关键词之间的语义关系.为此,本课题首先研究如何通过分析XML文档集中结点内容的语义信息,抽取XML文档中关键词的语义类型以及关键词之间的语义关系;进而计算关键词间的语义相似...  相似文献   

2.
现有的多关键词的检索研究集中在支持关键词的精确匹配,文中提出一个支持语义扩展查询的多关键词密文检索方案,基于信息内容计算方法同时考虑到关键词与文档的关系引入TF-IDF技术实现语义扩展;采用平衡二叉树的索引结构,使用安全k近邻算法加密索引向量和语义扩展查询向量,确保计算出准确的相关性得分,实现多关键词排序搜索。通过进行索引和陷门的机密性、查询无关联性等安全性分析表明,本文实现的检索方案是安全的,可以防止内部威胁。  相似文献   

3.
XML作为互联网数据交换及数据表现的标准,其重要性日益凸显,如何从大量的XML中挖掘有效信息已成为目前亟待解决的问题。设计并实现一个基于BDB的XML检索引擎算法XObject,通过构造关键词结构查询路径、进行结构聚类,并最终在BDBXML执行Xquery查询实现本地XML的关键字检索,从而解决XML信息挖掘中的关键技术课题——xML信息检索。  相似文献   

4.
基于语义的领域知识检索系统的设计及实现   总被引:2,自引:1,他引:1  
传统的检索工具是基于关键词的,在领域知识检索方面局限性很大,语义网的出现使信息检索提升到语义的层次,它使得领域知识的获取更加高效和准确.提出了基于语义的领域知识检索模型,设计并实现了JADE平台下基于语义的领域知识检索原型系统.对原型系统的测试结果表明,该系统能够快速发现领域研究者构成的集群并获取领域研究者的相关信息.  相似文献   

5.
基于规则推理的语义检索若干关键技术研究   总被引:1,自引:0,他引:1       下载免费PDF全文
 针对专业领域复杂的检索需求,目前相关研究采用基于语义的方法来扩展检索范围并提高准确度.在语义推理方面,目前搜索引擎通常直接采用语义网中的推理算法,推理效率不高.在排序方面,基于关键字的搜索引擎的排序算法也不适合对语义检索结果进行排序.针对上述问题,本文给出了基于语义网的语义规则建立方法,并提出了一种基于闭合世界假设的反向链接推理算法,提高推理效率,同时给出了一种基于特征相似性排序算法,使检索结果排序方式更加符合语义检索的特点.基于本文提出的方法,构造了语义搜索引擎MaterialHub,实验表明该搜索引擎提高了检索的准确率和查全率,有较好的查询响应时间,并已经得到实际应用.  相似文献   

6.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.  相似文献   

7.
解决语义鸿沟必须建立图像低层特征到高层语义的映射,针对此问题,本文提出了一种基于词汇树层次语义模型的图像检索方法.首先提取图像包含颜色信息的SIFT特征来构造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇.并在此基础上利用Bayesian决策理论实现视觉词汇到语义主题信息的映射,进而构造了一个层次语义模型,并在此模型基础上完成了基于内容的语义图像检索算法.通过检索过程中用户的相关反馈,不仅可以加入正反馈图像扩展图像查询库,同时能够修正高层语义映射.实验结果表明,基于该模型的图像检索算法性能稳定,并且随着反馈次数的增加,检索效果明显提升.  相似文献   

8.
研究语义信息检索方法,提高检索的效率.差异化信息由于特征差异过大,在检索过程中存在较大排异现象,传统的语义信息检索模型针对大差异信息检索过程中,以多轮次检测为主,效率很低.为此,提出一种基于决策树算法的语义信息检索方法.根据多层次解析融合相关理论,计算窗口函数,并且根据窗口函数进行不同层次数据的融合,得到差异信息融合结果.根据上述结果,建立决策树,实现语义信息的检索.实验结果表明,利用改进算法进行语义信息检索,能够提高检索的效率.  相似文献   

9.
多Agent网络信息检索框架   总被引:1,自引:0,他引:1  
阐述了一种应用于网络检索的多Agent框架,该框架有3种Agent组成:管理Agent用于提取信息的语义和管理;接口Agent为用户和系统提供接口;搜索Agent用于在WWW上搜索信息。本工作的重点是使用XML技术在wwW上检索信息。在这个模型中,Agents间使用XMI。作为Agent通信语言,相互沟通执行检索任务。它们的知识,语义以及搜索结果都用XML格式来表示。用户不仅能更精确地从模型搜索结果的语义编码中获取信息,而且可以直接运用搜索结果,无需使用专用标签或专门的脚本来获得网页,从中提取内容。  相似文献   

10.
提出基于动态Keyword数据仓的不确定XML关键字查询算法PrList.算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的结点求解SLCA节点,不需要进出栈和字符串的比较.实验结果表明,PrList算法是一种高效的不确定XML关键字查询算法.  相似文献   

11.
基于Key的XML连续查询算法   总被引:1,自引:1,他引:0  
徐海渊  吴泉源  贾焰 《电子学报》2003,31(2):284-286
普遍认为,XML将会取代Html成为数据表示和数据交换的主流标准,由于在线信息变化频繁,XML文档变化检测成为Internet查询系统、搜索引擎以及连续查询系统的关键技术.先前的研究多着眼于有序模式的XML文档,而无需模式的通用比较已经被证明是NP问题,目前针对无需模式的最好算法复杂度为多项式时间.本文提出了基于Key的变化检测算法,能够高效地检测无序模式XML文档的变化,算法复杂度为O(nlogn),n为文档结点数.  相似文献   

12.
分析病案数据的特点,提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法.鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从语义级别解决该问题.  相似文献   

13.
苏勇  王燕 《信息技术》2011,(5):91-94,100
目前,使用XQuery语言实现的Apriori算法基本都是对单个XML文档进行挖掘,而对于现实中的XML文档,有些情况下相关联的数据是存放在多个文档中的,文档之间没有必然的联系,这时就要将多个文档同时考虑进来进行挖掘。针对如何对多个XML文档进行挖掘的问题,对基于XQuery语言的Apriori算法进行改进,引入了collection函数,使之能够对多个XML文档组成集合的节点进行访问,从而实现对多个XML文档的关联规则挖掘,最后通过实验验证其可行性及有效性,使其效果达到和对单个文档挖掘的相同效果。  相似文献   

14.
基于相容关系的XML索引机制   总被引:3,自引:0,他引:3  
徐海渊  吴泉源  王怀民  贾焰 《电子学报》2003,31(8):1155-1159
随着XML逐渐成为Internet数据表示与数据交换的标准,存储与查询XML数据变得日益重要.由于传统方法无法适应XML数据新的需求,使得XML索引成为一个挑战性的课题.到目前为止,已经出现了不少针对XML数据的索引方法.然而,在处理基于相对路径的查询上,缺少有效的解决办法.本文提出了一种基于相容关系的索引模式,结合XML文档拓扑结构的自身特点,能够有效地处理基于相对路径的查询.这种模式的主要特点包括:(1)利用XML数据的拓扑结构而不是XML文档的模式(DTD或XML Schema)来进行相对路径到绝对路径的转换;(2)对拓扑结构进行基于相容关系的数字方式编码,能够快速确定对应结点的依赖关系.实验证明这种方法在处理基于规则路径表示(尤其是相对路径)的XML查询时具有更高的效率.  相似文献   

15.
Semantic features are critical intelligence information for mobile ubiquitous multimedia, how to manage and retrieve the semantic information has been an important issue. In this paper, a novel semantic retrieval approach named Data Hiding based Semantic Retrieval (DHSR) for ubiquitous multimedia is proposed. This approach consists of the following features: (1) Every multimedia document has to be semantically annotated by several users before saved into multimedia database. (2) Semantic information described by object ontology will be hidden in the multimedia document data. (3) Semantic information will not be lost even if the multimedia document is copied, cut or leave the database. Our work provides a search engine with convenient user interfaces. The experimental results show that DHSR can search the multimedia documents reflecting users’ query intent more effectively compared with some traditional approaches.  相似文献   

16.
基于VSM的文本聚类忽略了文本关键词稀疏带来的相似度漂移问题和关键词之间的语义信息和各维度之间的关系,致使文本的相似度计算不精确,文中对相似度计算方法TF—IDF进行了改进,并提出一种新的聚类方法,利用分布式估计算法和禁忌搜索算法进行聚类,融合分布式估计算法的收敛速度快和禁忌搜索算法能跳出局部搜索的优点,首先对文本进行预处理,然后用分布式估计算法和禁忌搜索算法聚类,既能快速聚类又能防止聚类收敛到局部最优。测试结果表明这种算法行之有效。  相似文献   

17.
提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题,接着,利用基本变异操作得到的变异查询树对XML数据树完成精确嵌入,可将XML近似查询的问题转变为多棵变异查询树的精确查询问题,并给出了基于XML数据统计的相似度计算模型和Top-K问题求解的优化算法.最后,在汽车外形智能化设计的实验中表明该算法优于SSO算法.  相似文献   

18.
基于语义的高维数据聚类技术   总被引:2,自引:2,他引:0  
刘铭  王晓龙  刘远超 《电子学报》2009,37(5):925-929
本文提出一种有效处理高维数据的聚类算法,算法首先通过构造特征链将文档集合划分为多个类别,同时在相似度计算及权值调整时考虑相似特征的影响以凝聚语义相似的文档,并动态调整文档权重使分布不平衡的文档得到充分训练.实验表明:该算法在高维空间能够获得较好的聚类结果,类内相似度高,类间区分性好,迭代次数较少.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号