首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
总论AELISC 2697-40-12(3)基于领域本体的语义文本挖掘研究/张玉峰,何超(武汉大学信息资源研究中心)//情报学报,2011,30(8):832-839.为了提高文本挖掘的深度和精度,作者研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据  相似文献   

2.
面对网络中日益丰富的文本性情感信息资源,利用关联挖掘技术对其进行智能化的自动挖掘与分析,获取语义层面的用户情感知识,对于企业竞争策略的制定和竞争优势的保持具有重要的潜在价值。将关联挖掘技术融入文本情感分析之中,研究并设计一种融合语义关联挖掘的文本情感分析算法,实现语义层面的情感分析与用户情感知识挖掘。实验结果表明,该算法取得了很好的预期效果,显著提高了情感分析的准确率与效率以及关联挖掘的深度与广度。  相似文献   

3.
动态竞争情报是企业在复杂多变的竞争环境中取得成功的关键.针对传统的竞争情报分析模型无法有效地对信息资源进行深层次的多维分析,获取语义层面的动态竞争情报,本文构建了基于联机分析挖掘的动态竞争情报多维语义分析模型.该模型利用竞争情报领域本体指导目标信息的采集与监控和实体与关系的抽取,实现竞争情报的语义组织和存储;设计了一种基于语义的多维关联分析算法进行语义层面的数据挖掘、学习和推理,实现竞争情报多维语义挖掘和知识发现.实验结果表明,该模型取得了很好的预期效果,显著提高了情报分析的深度与广度和情报分析的准确率与效率.  相似文献   

4.
文章将本体和上下文知识融入企业竞争情报分析之中,设计了一种基于语义决策树的归纳学习算法进行语义层面的情报分析和情报知识发现.该算法利用本体解决情报语义问题,利用上下文知识解决应用环境和具体对象问题.实验结果表明,该算法取得了很好的预期效果,显著提高了情报挖掘的智能性和情报分析的准确性,在一定程度上实现了企业竞争情报语义挖掘和情报知识自动分析与获取.  相似文献   

5.
为弥补传统竞争对手分析方法无法有效挖掘网络化企业竞争对手信息的缺陷,本文将语义文本挖掘技术引入企业竞争对手分析中,提出了一个基于语义文本挖掘的企业竞争对手分析模型.该模型采用规则化主题爬取技术获取结构化信息,利用竞争情报领域本体知识库和语义VSM矩阵实现竞争对手信息语义分析和描述,通过基于语义的文本挖掘技术提取竞争对手深层次语义知识.并以相机市场的两大竞争力企业--佳能、尼康为例进行了实证分析研究,实验结果表明,该模型具有潜在的实际应用价值,可有效提高企业决策水平.  相似文献   

6.
概念语义网络作为一种揭示知识单元间内在联系的知识组织体系,有利于提高信息检索系统与用户的交互性,实现概念检索、智能导航与知识推理.本文结合知识表示语言与本体构建理论,以情报学概念语义网络为例,详细介绍了面向领域的概念语义网络的开放数据库设计.文中介绍的概念语义网络数据关系模型具有较强的通用性与扩展性,适用于不同类型,不同规模的概念语义网络的设计与实现,对于构建领域概念语义网络有一定的参考借鉴意义.  相似文献   

7.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。  相似文献   

8.
基于NMF的用户模板构造方法   总被引:2,自引:0,他引:2  
文本过滤是网络安全领域的一个重要研究课题。基于内容的文本过滤关键在于建立语义层次上的用户模板。本文提出一种基于非负矩阵分解 (Non negativeMatrixFactorization ,NMF)的用户模板构造方法。该方法应用NMF算法分解项 文本矩阵来获取项之间的相关性。在此基础上 ,引入语义向量和权重向量的概念 ,并通过定义语义向量的类别区分度来提取用户模板。实际表明 ,与基于奇异值分解的潜在语义索引方法相比 ,该方法不仅较大地提高了过滤精度 ,而且具有计算速度快、占用存储空间较少的优点  相似文献   

9.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.  相似文献   

10.
基于本体的语义检索是提高信息系统检索精确度的有效途径之一.概念云是云模型在信息领域的应用,是本体中的概念按照一定算法在页面中的排列聚合.基于本体与概念云来构建信息检索系统,其设计方案是采用自上而下与自下而上的两种方式相结合构造全局本体、局部上层本体、局部下层本体;再使用Web2.0环境下的内容管理工具进行本体中概念的管理与组织,从而形成概念云;最后以本体与概念云来完善信息检索系统,既提高检准率,又满足用户对知识获取的需求,并可为其他本体系统构建者提供对概念的获取与重用用户知识的功能.本文还描述了本系统语义检索功能实现的原理,阐述了该系统基本实现步骤和关键细节,并展示了该系统的部分功能.  相似文献   

11.
针对当前跨媒体检索算法没有充分利用不同媒体特征之间的潜在语义关联和无法解决跨媒体检索过程中的维度灾难与语义鸿沟问题,研究并设计基于语义关联挖掘的跨媒体检索算法。该算法主要由语义关联挖掘、跨媒体本体动态构建、跨媒体语义相似度计算三个部分组成。研究表明,该算法能够有效地提升跨媒体检索的准确率和效率,能够在一定程度上满足用户跨媒体检索的需求。  相似文献   

12.
运用图示法自动提取中文专利文本的语义信息   总被引:1,自引:0,他引:1  
姜春涛 《图书情报工作》2015,59(21):115-122
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程] 设计两种运用图结构的模型:①基于关键词的文本图模型;②基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘, 并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能较后者提升2.1%-10.5%。由此而推断,使用图结构的表达法并结合图挖掘技术从专利文本中所提取的语义信息是有效的,有助于进一步的专利文本分析。  相似文献   

13.
Latent Semantic Indexing (LSI) is a popular information retrieval model for concept-based searching. As with many vector space IR models, LSI requires an existing term-document association structure such as a term-by-document matrix. The term-by-document matrix, constructed during document parsing, can only capture weighted vocabulary occurrence patterns in the documents. However, for many knowledge domains there are pre-existing semantic structures that could be used to organize and categorize information. The goals of this study are (i) to demonstrate how such semantic structures can be automatically incorporated into the LSI vector space model, and (ii) to measure the effect of these structures on query matching performance. The new approach, referred to as Knowledge-Enhanced LSI, is applied to documents in the OHSUMED medical abstracts collection using the semantic structures provided by the UMLS Semantic Network and MeSH. Results based on precision-recall data (11-point average precision values) indicate that a MeSH-enhanced search index is capable of delivering noticeable incremental performance gain (as much as 35%) over the original LSI for modest constraints on precision. This performance gain is achieved by replacing the original query with the MeSH heading extracted from the query text via regular expression matches.  相似文献   

14.
个性化语义TRIZ构建研究   总被引:2,自引:1,他引:1  
[目的/意义]研究构建个性化语义TRIZ的方法、流程与关键技术.该语义TRIZ可对专利中隐性技术信息进行深度揭示与语义关联.[方法/过程]设计一个开放性语义TRIZ框架.该框架从概念空间、索引空间、应用空间3个维度构建语义TRIZ;从微观层SAO、中观层技术主题、宏观层技术范畴3个层面描述语义TRIZ索引结构.基于该框架,以大口径光学元件专利为例构建领域个性化语义TRIZ.[结果/结论]针对中等规模专利数据集(数千条),本方法能有效地半自动构建领域个性化语义TRIZ,支持专利深度技术挖掘应用.  相似文献   

15.
基于词向量扩展的学术资源语义检索技术   总被引:1,自引:0,他引:1  
[目的/意义] 尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程] 利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论] 本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。  相似文献   

16.
针对图像的特性,给出一种图像的二元视觉语言模型,在此基础上提出一种新的图像语义挖掘方法。该方法将每幅图像表示成一个由视觉单词构成的矩阵,通过计算每个视觉单词的权重,按照权重的大小对视觉单词进行选择,利用选择后的视觉单词集合,构建图像的视觉语言模型;之后,按照贝叶斯公式,建立基于视觉语言模型的图像语义挖掘方法。实验结果表明,该方法在图像语义描述能力和区分性方面是有效的,能充分反映人对图像内容的理解,具有很好的应用价值。  相似文献   

17.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。  相似文献   

18.
提出一种基于潜在语义索引和本体论的文本语义处理方法。首先构建一个基于本体论的虚拟标准文本特征向量,然后采用潜在语义索引方法以虚拟标准文本特征向量为参照对文本集进行语义聚类,最后在虚拟标准文本特征向量的导引下利用本体库中的知识对聚类获得的文本集合的类别和语义进行显性标注。实验表明,该方法能较好地在语义层面对文本进行有效的聚类,而且聚类结果能显性地显示类聚所属的类别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号