首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于本体的专利摘要知识抽取*   总被引:4,自引:0,他引:4  
采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。  相似文献   

2.
分别介绍国外主要知识抽取项目如AKT、SEKT和ArtEquAKT等,并进行比较和评析.  相似文献   

3.
典型关系抽取系统的技术方法解析   总被引:3,自引:0,他引:3  
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

4.
基于NLP的知识抽取系统架构研究*   总被引:1,自引:0,他引:1  
在参考自然语言处理平台及知识抽取系统的系统结构的基础上,提出一个基于NLP的知识抽取系统的详细设计方案。自然语言处理过程包括分词、词性标注、句法分析、语义分析等8大模块;知识抽取过程包括论文类型分析、篇章结构分析、知识抽取、知识表示4大模块。通过对基于NLP的知识抽取系统架构的研究,明确自然语言处理与知识抽取的关系,分析出知识抽取的系统流程及关键技术。  相似文献   

5.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

6.
研究了一种能够实现对数据型网页中信息实施实时采集的信息技术。该技术能够智能识别表格结构,自动分离数据项,在对数据项的分析判断过程中,采用从单词上分类(By Words)和从表格排列方式(By Structure)划分相结合的方法,以Ontology思想为支撑,融合支持向量机算法(SVM)和隐马尔可夫模型(HMM)等一系列成熟模型。最后通过测试并将该技术应用于TBT预警信息动态采集子系统中,收到良好效果。  相似文献   

7.
基于本体的军备情报抽取系统主要由两部分构成:知识库和处理程序。该系统基于文本分类技术实现武器类别判定,基于命名实体识别技术实现武器对象判定。依据句法语义约束所形成的信息抽取规则,实现军备情报抽取,并依据本体在一定程度上实现语义层面上的信息整合。  相似文献   

8.
[目的/意义]以汽车论坛例,提出一种针对专业社交媒体文本的主题知识元抽取方法。[方法/过程]首先,通过LDA模型提取出汽车论坛中文本的主题,并进行去重,形成主题列表;其次,基于融合主题特征的深度学习模型T-LSTM模型构建适于汽车论坛本文的情感分析模型;然后,通过计算各词汇在图模型TextRank中的重要性与各词汇的Word2Vec主题相似度,抽取情感关键词与关键句,用于对文本主题与情感倾向的解释与补充;最后,对上述方法进行集成,输出结构化的主题知识元。[结果/结论]实验结果中,抽取得到的主题知识元合格率达到69.1%,表明本文提出的主题知识元抽取方法,能够围绕知识主题较为准确地抽取知识元,实现知识的结构化转换。  相似文献   

9.
近年来,知识抽取技术在非结构化文本的处理中起到很重要的作用.文章在对当前知识抽取的相关文献、系统和项目分析研究的基础之上,提出了当前知识抽取研究中的主要抽取内容对象的分类,并对这些主要内容对象抽取的相关技术方法进行综述.主要总结了Web对象识别和集成、术语识别和抽取、主题发现和识别、概念层次关系的抽取、非概念层次关系的抽取、事实抽取、观点抽取和倾向识别等7种内容对象抽取的技术方法.并在此基础之上,对未来知识抽取的发展趋势进行了分析.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

10.
信息抽取技术在情报监测中的应用   总被引:3,自引:0,他引:3  
刘剑兰  朱东华 《情报学报》2004,23(6):661-666
信息抽取 (InformationExtraction)是一门应用性的语言处理技术 ,近年来正受到越来越多的重视。我们选取了国防情报工作这个特殊的领域 ,应用信息抽取技术进行探索性的研究。我们的方法是针对国防情报 ,应用世界最通用的语言—英文 ,设计了一个信息抽取系统 ,对各国国防经费信息进行动态的监测。该方法可望提高信息获取的效率 ,也将会扩展到更多的领域  相似文献   

11.
知识抽取中的停用词处理技术   总被引:5,自引:0,他引:5  
在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹配技术。停用词的识别常常需要停用词表,识别过程中需要判断假停用词以降低噪声。实验表明,对停用词进行单独处理可以大大加快词语切分速度以及后续的句法分析归约速度。  相似文献   

12.
为促进学术交流和发展,为学者之间的交叉合作提供可参考的事实依据,并获得可支持具体决策的分析结论,将本体机制引入CSSCI学术资源的知识组织,以面向对象的方式来组织学者知识地图的相关概念,构建面向CSSCI的学者知识地图概念模型;此外,通过学者两两之间关系的关联分析和知识挖掘发现学者之间潜在的合作可能,找出某学科领域中能够对中心作者产生重要学术影响的关联作者,并基于关联明确划分作者群,希望能够加强相关领域的研究合作,实现知识的互补与领域成果的借鉴和启发。  相似文献   

13.
知识抽取中的嵌套向量分词技术   总被引:1,自引:1,他引:1  
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。  相似文献   

14.
大数据时代,知识资源呈现数量大、种类多、关系复杂等特征,增加了知识组织的难度,仅依靠知识自组织方法或知识他组织方法很难缓解这一困境。针对这一问题,文章尝试融合知识自组织和他组织方法。首先,对知识自组织和他组织方法进行简要介绍,其次,从知识组织的主客体、理念、维度、工具、方法与技术等方面比较知识自组织与他组织方法,挖掘两者的融合点。最后,探讨知识自组织和他组织方法融合机理,并构建知识自组织和他组织方法融合模型。本研究不仅深化了知识组织理论,还为知识组织实践工作提供新的方法,具有重要意义。  相似文献   

15.
基于知网和术语相关度的本体关系抽取研究*   总被引:1,自引:0,他引:1  
 提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确的语义标签。实验结果表明该方法具有较好的实用效果。  相似文献   

16.
企业知识管理能够加强知识的交流与共享责任的宣传,驱动以创新为目的的知识生产,并将其融入到企业的知识服务中。在对企业知识管理的内容进行划分和界定的基础上,针对目前企业在知识管理实现上所存在的有关知识的语义表达、新知识的发现,及隐性知识的交流环境等方面的制约瓶颈,论述了基于网格技术的知识网格系统的结构体系,进而分析了网格技术在企业的知识发现、知识组织与存储,以及知识服务的管理环节中的应用。  相似文献   

17.
知识信息谱的分析与提取   总被引:2,自引:1,他引:2  
Zipf定理揭示了一篇文献中词出现的频率规律,Luhn在Zipf定律的基础上提出了自动抽取有效词的基本思想。基于Luhn思想的传统信息检索长期停留在文献层次上,难以满足人们通过知识元获取知识的需求。为解决这一问题,本文从概念的内涵和外延的认识论出发,考察人们由模拟事物内涵和模拟事物外延提出的图灵机和Petri网构建两种不同的计算机系统。由此提出了知识信息谱分析概念,试图建立具有语义关系的知识元理论框架,实现一种计算机对知识的理解和处理方法。文中给出了最大熵法提取知识元的方法。试验证明这种方法实用、有效。  相似文献   

18.
基于XML平台的知识元表示与抽取研究   总被引:3,自引:2,他引:3  
互联网上检索信息,查准率、查全率不高的主要原因是信息组织的深度仅停留在文献层次。解决的根本方法是将信息组织深入到知识元层次。为此就要解决知识元表示与抽取正确与否的问题。图4。表2。参考文献4。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号