首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
网络学术文档细粒度聚合本体构建研究   总被引:2,自引:0,他引:2  
[目的/意义] 旨在探索网络学术文档细粒度聚合本体构建的理论和方法。[方法/过程] 在梳理相关理论与方法的基础上,首先明晰细粒度聚合本体概念的基本类型、粒度特征和定义等基本理论问题,然后以网络环境下图书情报学领域"引文分析"主题语料为数据来源,从概念、属性和关系、实例等方面对细粒度聚合单元本体构建进行逐一探讨,并对本体进行评估和讨论。[结果/结论] 首次提出基于聚合单元知识体系构建细粒度聚合本体的思路与方法,可为基于聚合单元的细粒度组织、检索和导航中知识组织系统工具的构建提供参考。  相似文献   

2.
因果要素关联视域下社交媒体倦怠用户画像模型构建   总被引:1,自引:1,他引:0  
[目的/意义]探究社交媒体倦怠的原因要素和结果要素标签,分析各要素间的相互作用关系,扩展用户信息行为的理论研究范畴,为企业深入了解用户社交媒体倦怠发展态势提供指导。[方法/过程]基于信息生态理论,提取"信息人、信息、信息环境和信息技术"4个信息生态因子维度的社交媒体用户画像标签;根据用户心理特征和行为表现,抽取用户画像情感和行为标签,构建社交媒体倦怠用户画像模型。[结果/结论]透过社交媒体用户消极使用和负面情感变化的典型社会现象,对用户画像模型进行整合分析与关系凝练,证明本研究社交媒体倦怠用户画像模型与S-S-O理论框架具有一致性,并根据实际进行理论上的拓展和应用。  相似文献   

3.
[目的/意义]基于用户画像创建社交媒体资源聚合模型,为资源的聚合提供参考,丰富和拓展其理论研究体系。[方法/过程]在深度剖析用户画像的内涵、算法的基础上,基于社交媒体分别构建用户画像和资源画像的模型,运用社会化标签系统方法,研究基于社交媒体的用户画像和资源画像之间的映射关系。借鉴领域本体的方法,通过对数据的深层次挖掘,利用资源聚合的原理,构建基于资源画像的社交媒体内部资源聚合模型和外部资源聚合模型。[结果/结论]在大数据时代,基于用户画像和资源画像的相关理论与方法,能够为社交媒体的资源聚合提供新的思路。  相似文献   

4.
[目的/意义] 以社交事件为中心构建社会情景本体模型,使其能够对社会情景进行动态的、丰富语义的描述。[方法/过程] 研究Web服务相关事件本体,确定基本体;分析以用户为中心、以交互社区为中心和以资源为中心的社会情景相关本体,确定扩展本体。通过本体集成的6个阶段对基本体和扩展本体进行集成,输出以社交事件为中心的社会情景本体(SIECSCO)。以微信平台中的用户社会情景为例,构建SIECSCO 实例,验证本体模型的有效性。[结果/结论] 以社交事件为中心构建社会情景本体模型优于传统的社会情景本体模型结构,SIECSCO能够很好地对社会情景的动态演化过程进行描述。  相似文献   

5.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

6.
[目的/意义] 构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析。然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难。[方法/过程] 本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法。以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型。针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试。[结果/结论] 实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率。基于规则的本体实例抽取实验F值在93%左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51%。在本体实例获取中,词性信息和位置信息具有重要作用。  相似文献   

7.
魏巍  郑杜 《图书情报工作》2018,62(5):115-124
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(Adverse Drug Reaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取药物不良事件;并利用药品安全数据库的语义知识过滤药物的治疗和适用症信息以及否定的药物不良事件;最后,对报告源进行分类剔除传闻等噪音信息。[结果/结论]通过收集糖尿病论坛上的数据对模型的有效性进行验证,结果显示该模型的每一部分都有助于其整体性能的提升。  相似文献   

8.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

9.
[目的/意义] 微信、微博等自媒体中隐含着大量的用户旅游消费需求的信息,将这些信息进行分类并依据分类结果构建需求本体,从而帮助企业分析和研究用户需求以获取巨大的商业价值。[方法/过程] 利用SVM分类算法将微博信息分类并生成分类结果集,这些结果集中包含大量旅游相关概念的词汇,可以作为构建和扩展旅游需求本体的语料;然后通过调查各大旅游网站的类目确定旅游需求的核心概念,抽取分类结果中与旅游相关的概念。[结果/结论] 利用抽取结果匹配核心概念,生成扩展后的本体,使用HOZO本体编辑工具进行修改和完善,并呈现部分旅游需求本体。从实验结果看,本文所提方法能较为准确地对包含旅游需求的文本进行分类。  相似文献   

10.
陈忻  房小可  孙鸣蕾 《山西档案》2021,(1):80-87,79
【目的/意义】目前针对社会记忆构建的具体方法较少,尚不足以揭示红色记忆中的细粒度关系,利用自然语言处理技术与主题挖掘方法可以挖掘红色档案编研成果中的细粒度关系,有利于红色记忆的重构并对社会记忆构建方法实现有效补充。【方法/过程】本文选取北京香山革命纪念馆红色档案编研成果作为研究对象,对其进行预处理;立足于语义层面及主题层面,通过LDA模型对其展示成果中的五个红色篇章分别深入进行主题挖掘;通过命名实体识别及主题相似度计算的方法抽取其概念、关系与属性,最后构建篇章本体进行可视化展示。【结果/结论】文章利用主题模型对红色档案编研成果进行细粒度挖掘,进而进行本体构建,从而体现其中细粒度关联,实现社会记忆构建,力求实现记忆的映射和更好的呈现以加强档案资源的开发与利用。  相似文献   

11.
[目的/意义] 通过对国内外数字文化资源语义融合相关研究成果的总结和Europeana案例分析,为国内数字文化资源整合的研究与实践提供参考和借鉴。[方法/过程] 选取目前发展较为成熟的数字文化资源整合项目Europeana作为案例,分别从资源内容描述规则、语义知识本体模型设计、元数据语义化操作和关联数据的发布与访问4个方面对其数字文化资源语义融合的实现方法进行分析。[结果/结论] 研究发现,构建聚合式元数据模型、建立细粒度语义概念模型、创建开放的语义关联数据网络、提供泛在化关联数据应用服务是实现数字文化资源语义融合的关键。  相似文献   

12.
张乐 《图书情报工作》2020,64(18):126-136
[目的/意义] 针对目前自动问答系统在语义扩展方面存在的缺陷,提出一种基于词向量的语义扩展技术,设计并实现一个图书馆的智能咨询系统。[方法/过程] 使用基于Word2vec词向量语义扩展技术结合中文分词、共现词匹配技术设计智能问答引擎,结合协同办公的管理理念,实现图书馆智能咨询系统的构建,并对系统的运行数据进行统计分析。[结果/结论] 该系统在工作时间、咨询效果和后台管理上较好地满足设计需求,为图书馆智能化信息咨询系统建设提供参考。  相似文献   

13.
邱璇  李端明  张智慧 《图书情报工作》2015,59(2):112-117,50
[目的/意义]单一资源构建本体存在概念完整性和语义关系完整性的局限,为了满足用户对资源检索的个性化需求,综合FCA和异构资源各自的优势,采用异构资源构建本体的手段克服单一资源的局限。[方法/过程]以主题词表和Folksonomy数据集为数据源,各自构建形式背景,通过并叠置运算获得异构资源的形式背景,转换成概念格,从概念格中抽取概念模型,使用protégé工具和OWL语言构建实验本体。[结果/结论]通过词重率、增词率、漏词率3个参数,评估实验本体构建效果。实验结果表明,融合的本体有效地丰富了概念和概念间关系,比单一资源构建的本体更具有优势,为本体构建提供了一种新的可行方案。  相似文献   

14.
[目的/意义] 构建一个基于多语言本体的跨语言信息检索模型,有助于用户通过该模型使用自己熟悉的语言来获取不同语种的信息资源。[方法/过程] 通过本体设计及检索模型功能模块设计建立一个基于数字出版领域本体的中英跨语言信息检索模型,并利用Java语言及Lucene搜索引擎架构对该模型进行编程实现。[结果/结论] 多语言领域本体具有明确、形式化、共享、概念化、结构清晰等特征,可以作为语义层应用于跨语言信息检索系统之中,实现信息资源的语义表达。经测试,本文构建的模型能够较好地实现分词、查询扩展和语义关联等功能,促进跨语言信息检索向语义层次发展。  相似文献   

15.
[目的/意义] 研究统一医学语言系统中语义网络与社会化标注系统结合的深层次应用。[方法/过程] 总结UMLS语义网络的现有应用,分析UMLS语义类型与FrameNet语义类型的特征,构建适合本研究的语义类型,并通过实例梳理社会化标注系统与本体映射的思路。[结果/结论] 提出将所构建的语义类型作为标签归类的分类器以及作为分众分类系统与框架网络本体映射的桥梁。突破传统的基于统计的标签归类方法可为本体与分众分类系统的映射提供新的视角。  相似文献   

16.
白华 《图书情报工作》2015,59(17):127-133
[目的/意义]针对大众分类法和知识组织系统各自的优势和缺点,构建兼有大众分类和概念本体特征的新本体,利用语义关联技术为标签添加语义,以克服传统分类线性结构的缺陷。[方法/过程]建立一个"文学图书本体", 该本体以每对概念与标签之间的资源相似率为标准,采用标签—概念映射和集成技术把标签映射到概念框架中,从而一方面赋予标签以等级关系、同一关系和相关关系等语义,另一方面提高概念本体的标引能力,使每种图书的属性充分得到语义表达和揭示。[结果/结论]试验表明,新本体在容纳性、灵活性和多向语义关联方面的功能,均有显著提高,因而可提高图书资源的知识表示和组织能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号