首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
方志类古籍地名识别及系统构建   总被引:4,自引:0,他引:4       下载免费PDF全文
以地方志资料汇编<方志物产>(广东分卷)为语料,设计并构建了古籍地名识别系统.采用规则与统计相结合的命名实体识别方法,实现了物产地名的自动识别.分析了命名实体识别技术在中国方志类古籍整理中的应用前景,为方志类古籍进行数字化整理、挖掘物产分布、物产引进和传播等相关研究提供了新的途径.  相似文献   

2.
以地方志资料汇编《方志物产》(广东分卷)为语料,利用命名实体识别技术实现物产地名的自动识别。通过对物产地名、识别规则的文献计量学研究,挖掘物产分布、物产引进和传播等知识内容,为方志类古籍的数字化整理提供新途径。  相似文献   

3.
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。  相似文献   

4.
本文提出了生物医学实体评价,并采用信息计量学中的共词分析予以实现.首先,以基于机器学习的识别方法为主,结合基于字典和基于启发式规则的识别方法,完成科研文献中生物医学实体的识别;进而,在生物医学实体识别基础上构建生物医学实体共现网络;最后,通过生物医学实体共现网络分析实现生物医学实体的评价.  相似文献   

5.
基于本体的汉语领域命名实体识别   总被引:1,自引:0,他引:1  
命名实体识别是众多自然语言处理任务的核心内容之一,也是近年来的领域研究热点.本文将命名实体分为两大类:常规命名实体和领域命名实体.基于已经构建的领域本体MPO,本文提出一种基于本体知识规则与统计方法相结合的领域命名实体识别方法.该方法通过本体化实例,获取实体构成词性规则模板,结合CRFs机器学习模型,进行领域命名实体识别.实验结果表明:相比运用单一统计方法而言,该方法能使领域实体的识别性能显著提高,F值达到92.36%.同时表明本体化知识规则的有效运用,能够在领域实体边界和特殊形式领域实体识别的准确率上发挥积极作用.  相似文献   

6.
贾君枝  冯婕 《图书情报工作》2017,61(12):122-128
[目的/意义] 挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程] 提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果/结论] 分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。  相似文献   

7.
本文通过研究开源自然语言处理平台GATE和条件随机场模型,提出一种高效的电子产品领域命名实体识别策略,为实习项目中的初步工作--通过计算机智能方法识别出电子产品领域的产品品牌、属性等命名实体提出解决方案,并为下一步可能开展的领域内自动问答系统等高层应用提供底层支撑.该方法是基于层叠模型的规则与统计相结合的新的方法,分别继承了基于规则和基于统计识别方法的优点.最终,通过分析电子产品领域自身的领域特点实现了如品牌、重量等二十余种命名实体的识别.对比实验结果表明,该系统达到了令人满意的识别效果.  相似文献   

8.
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197 个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。图8。表11。参考文献13。  相似文献   

9.
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。  相似文献   

10.
自动综述是指针对特定的主题进行多文档自动摘要,最终提供简洁、重要的信息.新闻专题自动综述是多文档自动摘要的一种应用形式,它可以帮助人们快速了解某个新闻事件的概貌.提出了一种基于名实体的新闻专题自动综述方法.该方法首先从新闻专题的文章集合中识别并挑选出代表新闻要素的时间、地点、人物、机构等名实体,经过语义处理后进行名实体的频率统计.然后根据句子中名实体的频率,结合句子位置、长度等因素计算句子的综合权值选出摘要句,最后根据句子的时间戳信息对句子排序输出得到最终的新闻专题综述.实验结果表明,该方法是有效的,具有实用价值.  相似文献   

11.
Geographical research often involves searching for place names in full-text resources, such as digitized books. Place names often have variants, resulting in many different names for a single geographical place, a problem that can lead to missed results in full-text searches for place names. The problem occurs because full-text search engines merely match words in the search box with words in online documents, leaving place–name variants unsearched. This paper describes how relevant resources can be missed due to this problem and describes the different sources of place–name variation. Finally, the paper describes some solutions to the place–name variation problem in full-text searching.  相似文献   

12.
古籍责任者的署名方式多样、名目繁杂,要确定其真实姓名,必须进行大量的考证。而在著录中客观反映著者情况是一项复杂而细致的工作。责任者姓名选取的正确与否,关系到一部古籍的文献价值,而责任者籍贯的著录与否,更值得同仁的重视或求教于方家。  相似文献   

13.
万维网信息资源组织中域名的规范化问题   总被引:2,自引:0,他引:2  
宛玲 《情报学报》2001,20(1):26-31
域名在万维网信息资源组织中占有特殊的地位。本文分析了目前域名名称命名中所存在的问题 ,提出了改进域名信息服务功能的一些命名措施 ,指出域名应具有揭示站点信息资源的性质以及易于记忆的功能。  相似文献   

14.
[目的/意义] 在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程] 对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187, 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论] 在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。  相似文献   

15.
Selling home: Corporate stadium names and the destruction of commemoration   总被引:3,自引:0,他引:3  
A city's primary benefits from professional sports franchises are civic pride and identification with its teams. The stadium or arena, as the physical “memory place”; for teams, has historically been named to commemorate the relationship among the team, the city, and the fans. This paper chronicles the rise in corporate naming and argues that sacrificing the commemorative name of a sports venue for a paid corporate name alters the identity statements of memory places, abbreviates the narrative about a city and its teams, and threatens the idyllic illusions about sports that fans have long chosen to maintain. As corporate naming spreads beyond sports, the substitution of commercialization for commemoration presents a growing threat to public memory places of many kinds.  相似文献   

16.
古籍索引编制与一般索引编制有所不同。在古籍索引编制的过程中,古籍版本的选择是需要处理的首要技术问题,而款目内容的选择则是索引编制的重点所在。因为人名、地名、职官名、书名等实体名称在不同时期有所不同,因此人名、书名、物产名称的选择及其限定词的使用在古籍索引编制中各具特色,参照系统的编制应占有相当大的份量。同时,古籍索引的排序方法及出处表达同样不能被忽视。  相似文献   

17.
《周礼》是先秦史和中国古代史研究中不可或缺的史料,作为描述国家行政体制类著作,它涉及大量档案方面的内容,对档案史研究具有极为重要的史料价值。档案界在运用《周礼》档案史料方面,既卓有成效,也存在着一些误读和误用问题。笔者从档案史料学角度,借助语言文字演变规律、二重证据法和逻辑分析法等对《周礼》的成书时间、内容、天府、龟室等史料误读问题做出了较全面的梳理。指出《周礼》约成书于战国或秦初;区分了《周礼》内容中先秦制度的实录与作者主观设计两部分不同性质的内容;指出“天府”兼有职官和机构名称两重属性,以及“龟室”为保管待卜用龟之处所,而非存放甲骨档案的库房。  相似文献   

18.
国家图书馆中文名称规范的探讨   总被引:2,自引:0,他引:2  
本文回顾了国图中文名称规范的历史,并指出个人名称标目学科附加成分存在的问题,提出个人名称非规范标目附加成分的重要性,分析虚拟团体名称,最后对中文名称规范工作提出4点建议。  相似文献   

19.
Contemporary scientific publishing in mathematics and physics (as in other exact sciences) is a complex and rapidly changing process. The most important element of this process, namely, the refereeing process is considered. In particular, meaningful changes towards refereeing process in mathematics and physics are identified and predicted. Considering a transition that takes place from the traditional refereeing system to other models and introducing the four basic parameters of the refereeing process, namely, the review stage, the openness for editors, referees and authors, journals and e-journals, feedback and e-feedback, several different models are proposed and described for improving the traditional refereeing system (e.g., 2-stage open and semi-open pre-review models, 1-stage open and blind pre-review models, and 0-stage open post-review models).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号