首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对当前的信息检索模型并不能提供语义信息的检索问题,提出了一个基于描述逻辑方法的语义检索模型,定义了文档的逻辑视图、查询的逻辑视图和两种视图之间的相似度计算方法,并给出了模型的存储结构.该模型将用户的检索请求和待查询的数据(文档)转化成基于描述逻辑知识库为基础的个体集合,不仅能够有效表示文档和查询的语义信息,而且有利于计算机自动推理的实现,可以有效提高检索的准确率和召回率.  相似文献   

2.
介绍了一种采用向量空间模型的网页过滤系统模型,以及该模型在应用中的一些关键技术和算法.  相似文献   

3.
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具忽视了很多文本中所隐含的语义信息,从而导致检索时效率低下,很难满足用户的查询要求.提出了一种基于向量空间模型改进的文本信息检索方法.把本体技术引入到传统的文本信息检索系统中,利用领域本体中概念相似度计算对向量空间模型进行改进,从而实现一个高效的文本检索系统,并简述了系统的模型.实例证明,该方法可以很好地提高文本信息检索的查全率和查准率.  相似文献   

4.
在采用VSM模型进行文本分类时,如果特征向量维数相差悬殊,会给分类结果产生很大负面影响。为了解决这一问题,本文引入了特征向量扩展的思想,同时定义了有效原始信息浓度的概念。特征向量扩展以HowNet语义词典为依据,对高维和低维特征向量采用不同的扩展策略,从而减小了不同类别语料间有效原始信息浓度的差值,进而改善复杂语料的分类结果。实验表明该方法在复杂语料情况下,通过对特征向量进行HowNet语义扩展,可以较好的改善分类结果。  相似文献   

5.
提出一种改进的基于潜在语义索引的文本聚类算法。算法引入潜在语义索引理论,改进传统的SOM算法。用潜在语义索引理论表示文本特征向量,挖掘文本中词与词之间隐藏的语义结构关系,从而消除词语之间的相关性,实现特征向量的降维。改进传统的SOM算法的局限性,准确给出聚类类别数目的值。实验结果表明,本算法的聚类效果更好,聚类时间更少。  相似文献   

6.
基于潜在语义分析的中文文本层次分类技术   总被引:9,自引:0,他引:9  
从网络文本自动分类的需求出发,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量,并在此基础上进行分类处理,在不损害分类精度的同时提高了分类及其后处理速度,并设计实现了一个原型系统。  相似文献   

7.
近年来,由于图神经网络(GNN)的结构信息在机器学习中的优势,人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用,这导致在数据生成部分出现语义信息的缺失。针对以上问题,提出了一种基于多层语义融合的结构化深度文本聚类模型(SDCMS)。该模型利用GNN将结构信息集成到解码器中,通过逐层语义补充增强了文本数据的表示,并通过三重自监督机制获得更好的网络参数。在Citeseer、Acm、Reutuers、Dblp、Abstract这5个真实数据集上进行实验的结果表明,与目前最优的注意力驱动的图形聚类网络(AGCN)模型相比,SDCMS在准确率、归一化互信息(NMI)和平均兰德指数(ARI)上分别最多提升了5.853%、9.922%和8.142%。  相似文献   

8.
赵正利  王国宇  籍芳 《微计算机信息》2007,23(24):291-292,287
本文介绍了一种新的语义模型-图像内在语义模型ⅡSM(image internal semantic model)。这种模型通过分析相关反馈的图像检索的结果来提取语义信息,然后对所有图像计算两两之间的互信息,利用互信息对图像进行语义聚类。实验结果表明这种语义模型利用图像之间的语义相关性能提高查询的效率,并且能较准确的将数据库中的图像按语义分类。  相似文献   

9.
从网络文本自动分类的需求出发,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量,并在此基础上进行分类处理,在不损害分类精度的同时提高了分类及其后处理速度,并设计实现了一个原型系统。  相似文献   

10.
根据各分布信息源信息单元实体类的语义相似度,对于信息单元实体类进行聚类,是半自动地进行本体映射、构建分布异构信息资源全局视图的重要步骤。本文面向分布信息资源统一信息视图构建需求,利用基于本体的元数据模型及语义相似度,在其基础上定义了语义聚类特征,基于语义聚类特征设计了一种基于语义特征树的混合层次聚类算法SCFBHCA。从理论和实验两个角度对SCFBHCA算法进行了分析,对比HCA和HCP,该算法具有增量式和扩展性且效率更高。  相似文献   

11.
如何准确地实现文本的有序组织,是自然语言处理的一个重要研究方向。本文首先介绍了文本分类的研究现状,讨论了基于向量空间模型的分类法的基本思想。在此基础上,通过对文本识别本质的研究,在向量空间模型的基础上,提出一种新的结合了信息相关性分析的文本分类模型ICFM(Information Correlation based Fast text categorization Model),并以实验验证了该模型的性能。  相似文献   

12.
讨论了范算子的使用方法和特点,提出了基于范算子的模糊逻辑和推理,讨论合取通过t-norm来计算,对等值、等价和模糊集合的语义也进行了研究讨论,同时利用等价关系理论对模糊环境进行说明,并给出了几个具体例子.  相似文献   

13.
重用已有模型构建新的仿真应用一直受到系统仿真领域的关注.基于模型数据库搜索、判断与应用需求相匹配的仿真模型资源是实现重用的关键问题.提出一个基于概念模型语义描述的仿真模型资源搜索框架,详细说明了该搜索框架的结构.框架建立了由实体、任务、交互等概念模型元素构成的仿真模型资源语义描述模型,采用本体语义和关键字匹配等搜索策略.模拟实验表明该框架可以很大程度上提高搜索判断的准确性.  相似文献   

14.
随着Web服务的大量涌现,如何正确定位合适的Web服务成为主要问题.UDDI上基于.为此,提出了一种新的层次匹配模型,同时引入相似函数来度量服务相似程度.整个匹配过程基于领域本体的语义信息.方法提供了新的方式来发现和利用已发布的Web服务,其灵活性和可扩展性能够实现复杂的Web服务请求.  相似文献   

15.
随着互联网信息的快速剧增,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义.目前研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不是很好.为了使机器更好地理解用户需求和文本内容,使过滤结果更能反映用户的真正需求,提高文本过滤的准确率和召回率,提出了基于用户本体模型UOM的文本信息过滤方法.该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等.基于UOM(User Ontology Model)的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高.通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效地为用户提供过滤服务.  相似文献   

16.
传统的导医多采用人工方式,无法满足现代网上医疗的需求。目前,结合疾病智能诊断与网络技术的智能医疗服务系统已经成为一项研究热点,但现有的研究成果在诊断效果上还有待完善。为此,提出一种基于VSM(向量空间模型)权重改进算法的智能导医系统,结合专家系统的思想并使用VSM计算用户输入和疾病之间的余弦相似度,推断出用户可能的疾病,引导用户正确就医。其中,根据疾病诊断的特点提出了改进的TF-IDF算法来计算症状的权重,使其更适用于医疗诊断。仿真实验结果表明,改进的TF-IDF算法的正确率高于传统的TF-IDF算法。  相似文献   

17.
基于层次聚类的分层可扩展性编码算法的优化   总被引:1,自引:0,他引:1  
针对视频流接收端带宽不一致所导致的接收质量和带宽利用率不高的问题,利用层次聚类的方法对接收端带宽进行分类,建立了一个基于分层可扩展性编码算法的自适应编码的数学模型,以此确定编码器编码的层数及各层的码流值.该方法对已有的分层可扩展性编码的自适应机制做了优化,提高了接收质量和带宽利用率.  相似文献   

18.
针对现有用户兴趣模型在模型建立以及更新阶段漂移策略的缺陷,设计了一种改进的基于隐式反馈的用户兴趣漂移方法.将用户兴趣分为长期兴趣和短期兴趣,对短期兴趣采用滑动窗口处理更新,对长期兴趣采用最近最少使用淘汰算法,并将该模型与遗忘策略模型、滑动时间窗口模型做了精确率的对比实验,实验结果显示该模型的性能优于其它三个模型.  相似文献   

19.
随着Internet的飞速发展,Web文本分类研究已经得到人们密切关注,并取得了大量的研究成果。基于向量空间模型(VSM),针对传统的Web文本分类方法缺乏认知自主性和不能再学习的特点,提出了一种扩展的Web文本分类算法,通过一系列实验,该算法产生的效果明显优于当前其他的分类方法。  相似文献   

20.
基于前缀项集的Apriori算法改进   总被引:1,自引:0,他引:1  
关联规则的挖掘是数据挖掘中一个重要内容,主要目的是找到事务数据库中的有趣的模式。Apriori算法是关联规则挖掘的最经典算法之一,但是它本身存在着效率上的瓶颈。在深入了解Apriori算法前提下,提出基于前缀项集的候选集存储结构,并利用哈希表在快速查找上的优势,大大提高了经典Apriori算法在连接步骤和剪枝步骤中的效率。实验证明改进后的Apriori算法在一定支持度下比经典Apriori算法有着更大的效率优势,并且支持度越小时提升效率越大。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号