共查询到20条相似文献,搜索用时 234 毫秒
1.
基于Web数据的本体概念抽取 总被引:1,自引:0,他引:1
本体论(Ontology)在知识管理及语义网(Semantic Web)中越来越重要,但建造本体往往需要耗费大量的时间,且建造完成后本体的维护对知识管理者来说也是费时的工作。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;而概念是本体中最重要的组成部分之一,从半结构化的Web文档中自动抽取概念的效率和准确度的高低,直接决定了自动建造的本体的质量,提出一种自动的本体概念抽取模型,此模型不依赖于领域词典或核心本体,并且能达到快速有效地通过对中文Web文本挖掘自动地构建及更新领域本体概念的目的。 相似文献
2.
3.
为了使得广大高校教师和学生能够快速准确地进行信息检索和知识获取,以便了解本学科前沿领域知识,研究开发了一个基于语义Web的教研辅助系统平台,本文就该平台中图像的本体构建问题进行了探讨.按照图像所属的学科专业、课程和图像所表达的主题对图像进行分类,并用Web本体语言OWL来对本体进行描述. 相似文献
4.
5.
目前,应急预案是分布于多个单位的非结构化文档,缺乏统一的建模方法,造成对预案描述的领域知识进行表示和利用存在困难。为解决以上问题,提出一种基于本体的知识建模方法,对应急预案文本进行建模,并实现应急领域知识共享。根据对应急预案文本结构特征进行分析,在重用现有本体模型的基础上提出了各主要要素的本体模型,形成一种应急预案本体模型(emergency plan ontology model,EPOM)。通过利用该方法对某区域防汛应急预案进行本体知识建模,开展应用研究。应用结果表明,该方法能够有效建模应急预案描述的 相似文献
6.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点. 相似文献
7.
研究了从数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题。基于知识数据库实现动态页面获取,进行预处理后转换为XML文档,采用基于PAT-array的模式发现算法自动发现重复模式,结合基于本体的关键词库自动识别页面数据显示结构模型,利用XML的对象-关系映射技术将数据存入知识数据库,由此实现Web数据自动抽取。同时,利用知识数据库已有知识从互联网抽取新知识,达到知识数据库的自扩展。以交通信息自动抽取及混合交通出行方案生成与表示系统进行的实验表明该系统具有高抽取准确率和良好的适应性。 相似文献
8.
本文提出一种基于本体的非结构化知识管理系统框架.在该框架中,知识库由知识体和应用本体两部分组成,可解决知识的重用和共享问题.知识检索可以通过知识地图导航和自动检索两种方式完成,有一定的智能性.知识管理门户采用XML和XSL相结合的开发方法,具有动态特点.本文还对知识库的安全管理方法进行了初步研究,提出了一个可用的知识库安全管理解决方案. 相似文献
9.
针对Deep Web查询界面集成问题,定义了一种面向专门领域的域序列模式图(FSRG)模型,用于表示和发现同一领域查询界面中的所有域序列模式.该模型将领域内不同查询页面的域序列模式统一到一个有向有环图中.基于序列模式图进行研究可发现领域模式中域的结构化组织排列规律.还论述了域序列模式图的构造、域子序列模式划分和领域所有域的整体序列模式发现方法.在有限领域下封闭测试表明,该模型及其算法对结构化Web界面分析有较大应用价值.研究为实现智能化的Web数据模式处理提供了域序列分析方法,对大规模智能集成和搜索应用有一定参考价值. 相似文献
10.
基于本体的夹具设计知识表达 总被引:2,自引:0,他引:2
针对计算机辅助夹具设计领域存在的设计知识重用困难问题,提出了基于本体的知识表达方法,遵循CommonKADS构建知识模型的结构化方法,采用OWL来构建夹具设计知识本体,定义了该领域的基本概念,如装夹特征、元件、关系与约束等.在本体基础上,用SWRL来描述夹具设计规则,建立一个语义清晰的夹具设计知识库,分离了事实和推理.该本体采用了层次结构,便于扩充和修改,具有较强的推理能力.最后通过实例说明了该本体的应用. 相似文献
11.
12.
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。 相似文献
13.
支持Internet上个性化信息重组与发布的Web挖掘关键技术的研究 总被引:1,自引:0,他引:1
Internet上个性化信息的重组与发布是Web个性化技术的一个重要组成部分,这一领域目前存在的主要问题是:并非没有信息重组和发布的工具,而是缺乏能够使这类工具高效工作的支持技术。本文提出一种将流数据处理技术引入Web点击流、IP地址流及页面文本流挖掘和分析过程,研究基于Web数据流挖掘的用户行为和需求分析方法;将本体和领域知识引入Web内容挖掘过程,研究领域知识指导下的Web内容挖掘方法;将基于Web数据流挖掘的用户行为和需求分析与领域知识指导下的Web内容挖掘相结合,研究Internet上Web信息模式和Web用户模型及其相互关系的建立;将上述研究成果应用于实际,以期达到高效地支持Internet上满足用户个性化要求的信息重组与发布的目的。 相似文献
14.
研究Web文档服务的准确性和快速性,网络信息抽取成为处理海量网络信息的重要手段,而大量异构信息的有效抽取是非常困难的,为了改进和提高系统对于海量异构网页信息的抽取查全率和查准率,提出了一种新的信息抽取的方法,算法利用了隐马尔可夫模型在处理规则知识上的优势对每个页面构建HTML树,并利用Shannon熵来定位数据域,再用Maxi-mum Likelihood方法实现隐马尔可夫模型的构建,实现对Web信息的抽取。仿真结果表明,通过对大量学术论文头部结构信息的抽取,应用算法可以使信息抽取在召回率和准确率方面有明显的提高。 相似文献
15.
在分析Deep Web中不相容知识的单调性、动态性、模糊性的基础上,提出了基于tableau的不完备知识处理的模型生成方法IK-tableau。该模型采用非经典逻辑表示方法,将Deep Web信息表示为逻辑公式集合,采用模型生成算子对逻辑公式进行扩展。通过IK-tableau方法,能够找出Deep Web搜索中的不完备知识,并可以进行修正,生成知识模型;同时利用该模型可以进一步指导Deep Web搜索。 相似文献
16.
Design and development of a maintenance and virtual training system for ancient Chinese architecture
Ancient Chinese architecture is an important aspect of traditional Chinese culture and has been studied by many scholars around the world via historical documents, photographs, and three-dimensional models. In this paper, a building information model (BIM) and virtual reality (VR) and video analysing technology are used to develop a maintenance and virtual training system for ancient architecture. A digital ancient architecture model that includes a three-dimensional model and attributes is established, and the model can be visualized using a VR video processing system. Based on this system, we propose a method of fire detection in the maintenance system to ensure the safety of ancient buildings. After performing lightweight processing of the three-dimensional model, the Forge platform, which can achieve high-speed browsing via Web browsers, is used to perform the virtual construction, dismantling and other functions. By providing an immersive experience, users will develop a deeper understanding of ancient architectural structures and construction processes, which will accelerate research on ancient architecture. 相似文献
17.
传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点。本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数 (term frequency-inverse document frequency,TF-IDF)和自注意力机制的双向编码表示(bidirectional encoder representation from transformers,BERT)的3种冬奥问答系统模型。本文首次构建了冬奥问答数据集,并将上述3种方法集成在一起,应用于冬奥问答领域,用户可以使用本系统来快速准确地获取冬奥内容相关的问答知识。进一步,对3种模型的效果进行了测评,测量了3种模型各自的回答可接受率。实验结果显示BERT模型的整体效果略优于知识图谱和TDIDF模型,BERT模型对3类问题的回答可接受率都超过了96%,知识图谱和TDIDF模型对于复合统计问答对的回答效果不如BERT模型。 相似文献
18.
19.
一种新的语言信息计算模型 总被引:1,自引:0,他引:1
语言的可计算性问题是理论计算机科学的一个基本问题,字母文字信息的计算模型已经有数十年的历史,而适合汉语信息的计算模型尚未见到.中文信息处理与信息安全的研究迫切需要有适合汉语信息的数学计算模型,提出了两个新的字符串计算模型.在模型1的基础上定义了几个函数运算.利用这两个模型可以将任何汉语信息的处理转换为相应的数值进行处理,对汉语信息处理、汉语程序设计理论的建立和信息安全的研究具有一定的实际意义。 相似文献
20.
网络翻译系统中的格式信息流处理方法研究 总被引:5,自引:0,他引:5
随着国际互联网络技术的迅速发展 ,网络机器翻译技术应运而生 .但由于网上信息流格式具有多样性和多变性等特点 ,使得网络机器翻译技术面临新的困难和挑战 .以网络实时翻译系统为问题研究背景 ,对网络格式信息流处理方法进行了深入研究和探索 ,提出了基于动态知识获取和上下文相关分析的格式信息流处理方法 .该方法在使用机器翻译系统中对 HTML格式信息流处理取得了令人满意的效果 . 相似文献