首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
汉语文本特征词的抽取方法   总被引:10,自引:3,他引:10  
薛翠芳  郭炳炎 《情报学报》2000,19(3):242-247
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。  相似文献   

2.
目前,国内外对在线评论特征词的研究很少考虑到卖家发布的商品标题和描述信息,这使得数据挖掘过程盲目,挖掘结果准确率不高。采用聚类分析方法,把商品标题和描述考虑进来,搭建三层挖掘模型对在线评论进行研究和分析,提出定位L-K-中心点算法。实验结果证明,该方法能提高挖掘的准确率,减少挖掘时间。  相似文献   

3.
在线产品评论中通常包含多个产品特征,影响评论接收者对产品的总体判断.表征产品整体、组件和性能的产品特征词之间存在各种关系,这些关系影响评论接收者的信息处理和整合过程.现有的评论倾向性合成方法主要考虑的是词汇在文本中出现的位置、频率等因素,没有考虑到词汇之间的关系.本文提出了一种基于产品特征词关系识别的倾向性合成方法,首先在产品特征词、情感词和修饰词提取的基础上,将特征句表示为一个三元组,然后识别产品特征词之间的等同、等级和相关关系,构建产品特征词关系图,在此基础上由底至顶、由类内至类间完成文本倾向性合成.我们在手机评论集上对该方法进行了验证,实验结果表明,使用该方法得到的评论倾向性值与在线评分、人工标注倾向性值之间存在显著的正相关关系,相关系数分别为0.701和0.823.  相似文献   

4.
国内知识产权研究领域的关键词共现网络顶点度分布符合幂律分布特征,具有较高的聚类系数和较低的平均距离,符合复杂网路特征。通过G-N聚类分析,发现目前国内知识产权研究领域主要包括知识产权的数字化挑战、知识产权与技术创新等七大子领域。引入关键词的学科隶属度算法,对经济管理学、图书情报学和法学在知识产权领域的研究热点分布情况进行可视化分析,发现图书情报学在知识产权的数字化挑战及其应对方面的研究优势明显,进而建议图书情报学界加强跨学科合作,拓展学科覆盖面。  相似文献   

5.
选取图书馆学、情报学领域各4种核心期刊,构建近30年的关键词共现网络,引入学科隶属度和G-N聚类算法,对图书馆学、情报学领域的知识地图进行共时和历时分析.研究发现:该领域的关键词共现网络符合复杂网络的基本特征.共时分析发现:可将该领域划分为10个板块;属于情报学的5个(信息组织、信息检索、文献计量学、用户研究与服务、网络技术);属于图书馆学的4个(信息资源建设、文献学、资源共建共享、图书馆事业);两学科关注度相当的1个(开放存取).历时分析发现:1990年以前图书馆学研究的体系性更强;1990-2000年,情报学的发展态势强于图书馆学;2000年后图书馆学则强于情报学.  相似文献   

6.
[目的/意义]基于作者对自身研究的描述性评价和后续研究者的评论性引用视角,利用摘要和引文语料提取突破性研究的特征词,从而了解突破性研究的摘要和引文语料特征以帮助对于突破性研究的识别。[方法/过程]选取Science评选为"Breakthrough of the Year"的关键文献和Nobel Prize获得者的"key publications"作为突破性研究语料数据,整合论文的摘要和引文语料进行特征词提取。特征词提取中,首先利用Stanford CoreNlp工具对语料进行分词及词频统计,并结合专家意见提取特征词元。然后将特征词作为种子词,利用医学文本的语义关系对特征词进行语义拓展。最后通过查全率和查准率进一步对比摘要和引文的特征词拓展前后的检索识别效果。[结果/结论]突破性研究语料中遴选出8个摘要语料的特征词元和8个引文语料的特征词元。特征词检索识别中,摘要和引文的拓展特征词的查全率最高,引文特征词的查准率最高,引文拓展特征词的查全率和查准率综合效果较好。  相似文献   

7.
从当代科学技术发展规律与主要特点出发,提出了制定管理科学发展战略的基本依据。分析了我国管理科学学科发展的特点、阶段和发展状况,进而对科学基金资助管理科学的总体特点与效果进行了分析;明确了国家自然科学基金管理科学部工作的指导思想、总体目标与措施;提出了管理科学部的具体工作方针以及对项目研究的要求,最后,提出发展战略与优先资助领域遴选研究工作要点和要求。  相似文献   

8.
9.
科研领域中,论文关键词对领域研究特点的表征能力存在差异。针对如何有效地区分关键词对领域研究特色的揭示能力,以高效地提取领域中的特色知识点的问题,提出将科研领域放置于其背景学科中,以全局视角考察关键词在领域内、外的统计特征,并依此提出关键词领域度的概念和计算方法。以“高校图书馆”研究领域为例,根据关键词领域度指标提取50个特色知识点,结果表明,这些特色知识点能很好地揭示“高校图书馆”领域研究的特色。  相似文献   

10.
文章对领域分析这一认知学派新范式的起源、构建方法以及在情报学中的应用现状进行了阐释,揭示出当前领域分析范式在我国情报学应用研究中所存在的问题.  相似文献   

11.
面向知识处理的领域本体及其应用研究   总被引:3,自引:0,他引:3  
本体是关于领域概念及概念之间关系的精确描述。本文给出面向知识处理的领域本体模型及其描述语言。一个本体由实例、类、属性、关系和类间关系等元素组成。在给出领域知识本体模型的基础上,给出了基于框架的领域知识本体表示语言、三层组织结构以及本体的公理体系。在领域本体的驱动下,以数学家知识获取为例给出一种面向领域的知识获取方法,并给出领域知识语义正确性检查的方法。最后介绍一个领域本体管理和知识获取工具。  相似文献   

12.
中文域名信息资源管理与保护   总被引:3,自引:0,他引:3  
苏广利  郭闽英 《情报学报》2002,21(5):603-607
本文分析了中文域名信息资源管理与保护的现状 ,从技术效率层面和权利价值层面着手 ,提出了中文域名信息资源管理与保护五大对策 :(1)要拥有中文域名的主权 ;(2 )简化中文域名注册手续 ;(3)完善中文域名预留制度 ;(4 )打击中文域名恶意抢注 ;(5 )正确处理中文域名争议。  相似文献   

13.
文章首先确定了国家信息政策80个主要关键词,在此基础上,运用共词分析,聚类出了信息政策5个子领域,并将其呈现在映射图中,以展现信息政策体系结构.进一步地,将其同Rowlands的结果对比分析,发现我国关于隐私保护方面存在政策缺失,以及在信息社会和基础设施方面更多地是使用了国家力量.  相似文献   

14.
国内知识网络研究的年发文量和学术共同体规模总体上呈增长趋势,期刊分布、机构分布、作者分布均呈现相对集中与高度离散并存的特征,研究热点主要包括知识管理、产业集群、社会网络、知识流动、复杂网络、数字图书馆、知识共享、知识服务、知识转移等;知识网络理论研究重点集中在知识网络的概念、类型、结构、构建方法、形成与演化的动力及机制等方面。  相似文献   

15.
陈果  赵以昕 《情报学报》2020,39(1):1-11
当前几种经典的复杂网络模型尚不能有效拟合领域知识网络现实情况,表现为:①以边连线为增长单元难以有效拟合知识网络模块化增长的高聚集效应;②知识增长中除马太效应外,有其他重要因素(如守旧、创新)与之抗衡。因此,有必要根据领域知识自身增长特点探寻一种新的演化模型,以有效实现领域知识的量化分析和预测。本文以典型的领域共词网络为例,从微观的增长视角解析其生成过程、增长方式和多种影响因素,以前人研究结论为证据,提出一种由模块化增长单元组成,并融合跟风、守旧与创新三种影响因素的领域知识网络演化模型;随后,通过实验仿真证明了该模型能更好地拟合现实领域知识网络的整体和微观结构;最后,以此模型为基础,通过进一步的仿真实验揭示了相关因素在领域新知识增长、知识聚集中的影响力度和相互作用。本研究为领域知识增长规律和共现型知识网络结构规律的探索提供了更直接可靠的量化分析基础。  相似文献   

16.
为了提高信息抽取过程中的语义深层次的理解和准确率,本文提出了一种基于领域本体和语块分析的语义信息抽取方法,在详细说明其信息抽取模型的基础上,重点针对命名实体识别、词性组合模板、基于本体的三元组和二元组规则等关键问题进行了深入的分析和研究,提出了相应的解决方法,并进行了相关试验性研究.结果表明:采用本文所述的系统结构及其技术构建文本信息抽取系统是可行的,其能在深层次语义理解的基础上进一步提高信息抽取的准确率.  相似文献   

17.
钱毅 《档案学研究》2019,33(4):109-115
智慧档案馆是智慧技术迅猛发展背景下档案信息化持续发展的新阶段,体现了档案管理在信息链理论下沿着数据—信息—知识—智能—智慧的路径发展的必然趋势。本文在对智慧档案馆概念辨析和相关研究回顾的基础上,从体系化的角度创新性地提出智慧档案馆全域对象与建设层级的思想,横向上将智慧档案馆划分为馆库环境域、设备设施域、档案载体域和档案内容域四个对象域,纵向上从智识、治理、智联、智能、智慧五个层级设计其发展路径,二者结合共同构成对象—层级模型。该模型明确了智慧档案馆系统的现实发展路径,可以为在建设实践中根据自身技术和管理情况进行技术选型提供启发。  相似文献   

18.
姜韶华  党延忠 《情报学报》2006,25(3):301-305
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。  相似文献   

19.
阐述了民族地区高校图书馆进行特色定位及文化建设的重要性.并从四个方面论述了民族地区高校图书馆的特色定位与文化建设是其生存之本和历史使命。  相似文献   

20.
基于IIG和LSI组合特征提取方法的文本聚类研究   总被引:8,自引:0,他引:8  
本文利用改进的信息增益特征选择方法和潜在语义索引技术组合的特征提取方法 ,对文本进行了有效的自动聚类。从语料库中抽取了 2 5 0篇文本 ,首先利用向量空间模型和改进的信息增益特征选择方法 ,构造文本特征向量 ,利用C 均值方法聚类 ,聚类结果准确率、查全率、F measure分别达到 0 .82、0 . 88、0 .83。在此基础上 ,对最优的特征选择结果运用潜在语义索引方法 ,对奇异值分解的结果进行截断处理 ,发现奇异值K取 4 0时聚类结果的准确率、查全率、F measure达到 0 . 95、0. 5 7、0 . 78,在有效地降维的同时 ,大幅度地提高了聚类的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号

京公网安备 11010802026262号