首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 93 毫秒
1.
中文文本的地理空间关系标注   总被引:1,自引:0,他引:1  
为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。  相似文献   

2.
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。  相似文献   

3.
杨盈  邱芹军  谢忠  田苗  郑诗语  郑帅 《测绘通报》2023,(8):155-160+177
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。  相似文献   

4.
随着互联网应用的发展,所产生的非结构化文本大多与地理位置相关联,因此,地理信息检索(GIR)成为当前GIS和IR领域研究的热点。文本地理编码是建立文本与地理位置坐标对应关系的过程,是实现GIR的基础。本文对文本地理编码涉及的地理实体识别、地理实体消歧、文本位置聚焦、区域语言建模等关键技术进行分类总结,提出了该领域未来研究工作和面临的挑战,为文本地理编码进一步相关研究提供新思路。  相似文献   

5.
网络文本中蕴含着大量的交通信息,对交通命名实体识别是地情变化监测、交通实体更新的重要前提。针对交通命名实体识别任务中缺少专业标注数据和有效识别方法导致识别效果无法满足需求的问题,文中提出一种融合深度学习模型的交通命名实体自动提取方法。该方法首先利用语言表征模型充分融合语境来提取文本特征,然后通过结合双向神经网络模型来学习上下文语境,最终由条件随机场模型对输出进行约束得到全局最优标记序列实现交通实体的识别。实验证明,该方法准确率可以达到90%以上,能够实现对交通实体的有效识别。  相似文献   

6.
张亮  胡菡  石婷婷  邵军 《地理空间信息》2021,19(12):89-90,113
从新型基础测绘地理实体建设出发,明确了基础地理实体的内容,继承和扩展了传统的地理要素的分类及编码,提出一套地理实体编码方法,探讨了该实体编码下的要素实体化过程,为今后基于地理实体的新型基础测绘生产提供借鉴.  相似文献   

7.
对模糊地理实体的点实体、线实体和面实体的模糊性进行了研究,就它们的模糊表示进行了阐述。特别是就模糊面实体和确定的面实体进行对比,就二者的不同点进行了探讨,并给出了模糊面实体的实例,最后对本文进行了总结,得出了本文的研究只是一个探讨,还有很多问题需要解决。  相似文献   

8.
余丽  陆锋  刘希亮 《测绘学报》2016,45(5):616-622
从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词,最终组织成结构化实例,并使用百度百科和Stanford CoreNLP开展了试验。研究结果表明,本文方法能自动挖掘自然语言的部分词法特征,无须领域专家知识和大规模标注语料,适用于未知关系类型的信息抽取任务;较之经典的Frequency、TFIDF和PPMI频率统计方法,精度和召回率分别提升约5%和23%。  相似文献   

9.
针对当前因基础地理实体标识码不统一、不持久导致的多源数据无法与其精准对接、数据资源无法高效流通的问题,该文在对比研究当前主流标识体系的基础上,设计了适用于新型基础测绘与实景三维建设的基础地理实体MA标识体系,涵盖实体编码、标识注册、标识解析及基于实体标识的应用服务等。研究与实验表明,基础地理实体MA标识码具备全球唯一、终生保持等特点,基础地理实体MA标识体系能够支撑构建基础地理实体的应用生态,未来可以从根本上解决多源数据关联共享的难题。  相似文献   

10.
提出了地理实体的多态特征概念,对地理实体的几何、属性、关系的多态特征的成因、表现进行了分析,并对每一种多态特征进行了模拟方法的设计。提出了一种改进的多态模拟方法来实现几何多态管理,设计了融合体与映射集合的属性多态模拟方法,提出了解决多种层属特征的"地理实体组织法",并对空间关系的多态特征表达方式进行了讨论。系列方法已在相应系统中得到较好的应用验证。  相似文献   

11.
顾及距离与形状相似性的面状地理实体聚类   总被引:3,自引:0,他引:3  
与点状地理实体不同,面状地理实体不仅具有位置特征,还具有形状特征。对于面状地理实体而言,仅考虑距离因素设计聚类准则是不全面的。综合考虑距离和几何形状相似性来设计聚类准则,实现了相应的聚类算法。实验证明,该算法适合面状地理实体的聚类分析。  相似文献   

12.
汪铁华 《东北测绘》2014,(6):157-158,161
外业调查与核查是地理国情普查重要任务之一。本文结合地理国情外业调绘工作,介绍了在移动设备中构建地理国情普查外业调绘核查系统的设计与实现,该系统可在外业调绘工作中发挥较大作用,提高外业调绘的工作效率,保证调绘数据的质量。  相似文献   

13.
传统GIS中,文本常常被作为非空间信息而被忽视。而在实际应用中,很多有关空间位置的描述都是以文本途径来体现的。文本方式已经成为人们表达和接受空间信息的主要方式之一。地名是文本中最常见的空间信息表达内容。提出了一种基于文本地名自动识别的空间信息检索新方法,从自然语言形态的文本数据中实现地名的自动识别,并将识别的地名与空间数据进行关联显示,实现文本中地名信息的空间定位与显示。  相似文献   

14.
地理国情监测是为了获取自然与人类社会活动引起的地表变化信息,为政府、行业和公众提供地理国情信息服务,自然保护区生态环境是地理国情监测的重点之一。本文以兴凯湖国家级自然保护区为例,基于多期地理国情普查成果,确定监测内容与指标,并有针对性地对监测结果进行对比分析,以反映该保护区的现状和变化情况。  相似文献   

15.
为积极配合审计部门开展领导干部自然资源资产离任审计工作,充分利用地理国情普查及监测成果,探索领导干部自然资源资产离任审计的内容、方法和评价指标体系,探讨了基于地理国情普查和监测数据成果、基础测绘及相关技术获取的各类自然资源资产基础数据。按专业部门现行标准与有关行业部门进行必要的专题数据整合和处理,建设市级自然资源本底数据库,摸清自然资源的存量与变量,为建立自然资源资产审计长效机制奠定扎实的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号