首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 734 毫秒
1.
为提高苹果生产领域实体识别的准确性,提出一种新的Transformer优化模型。首先,为解决苹果生产数据集的缺失,基于苹果栽培领域园艺专家的知识经验,创建以苹果病虫害为主的产业数据集。通过字向量与词向量的拼接,提高文本语义表征的准确性;随后,为防止位置信息缺失,引入具有方向和距离感知的注意力机制,平均集成BiLSTM的上下文长距离依赖特征;最后,结合条件随机场(Conditional random fields, CRF)约束上下文标注结果,最终得到Transformer优化模型。实验结果表明,所提方法在苹果病虫命名实体识别中的F1值可达92.66%,可为农业命名实体的准确智能识别提供技术手段。  相似文献   

2.
农业病虫害领域的意图识别和槽位填充研究仍处于起步阶段,除语料严重匮乏外,还面临任务相互独立、忽略彼此相关性和未充分利用意图嵌入信息等问题。为此,提出了一种基于意图嵌入信息和槽位门控机制的意图识别与槽-位填充联合模型(AgIG-IDSF)。首先,该模型在共享编码模块引入了注意力机制用于丰富上下文语义特征;其次,提出了一种融合意图嵌入表示和槽位门控机制的意图-槽位交互方法用以增强意图信息指导槽位填充任务的能力,进而提高模型的整体识别性能。在包含22个意图类别、10个槽位类别和11 976条标注样本的自构建语料上进行了实验。结果表明,在该语料上AgIG-IDSF模型的意图识别准确率为94.41%,槽位填充F1值为94.01%,整体识别准确率高达88.07%,显著优于包含双向关联模型在内的多种基准模型,表明了该模型在识别农业病虫害意图与槽位方面的有效性。此外,在公共数据集上的实验结果还表明了该模型具有一定的泛化能力。  相似文献   

3.
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction, Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。  相似文献   

4.
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。  相似文献   

5.
当前农业实体识别标注数据稀缺,部分公开的农业实体识别模型依赖手工特征,实体识别精度低。虽然有的农业实体识别模型基于深度学习方法,实体识别效果有所提高,但是存在模型推理延迟高、参数量大等问题。本研究提出了一种基于知识蒸馏的农业实体识别方法。首先,利用互联网的海量农业数据构建农业知识图谱,在此基础上通过远程监督得到弱标注语料。其次,针对实体识别的特点,提出基于注意力的BERT层融合模型(BERT-ALA),融合不同层次的语义特征;结合双向长短期记忆网络(BiLSTM)和条件随机场CRF,得到BERT-ALA+BiLSTM+CRF模型作为教师模型。最后,用BiLSTM+CRF模型作为学生模型蒸馏教师模型,保证模型预测耗时和参数量符合线上服务要求。在本研究构建的农业实体识别数据集以及两个公开数据集上进行实验,结果显示,BERT-ALA+BiLSTM+CRF模型的macro-F1相对于基线模型BERT+ BiLSTM+CRF平均提高1%。蒸馏得到的学生模型BiLSTM+CRF的macro-F1相对于原始数据训练的模型平均提高3.3%,预测耗时降低了33%,存储空间降低98%。试验结果验证了基于注意力机制的BERT层融合模型以及知识蒸馏在农业实体识别方面具有有效性。  相似文献   

6.
基于条件随机场的农作物病虫害及农药命名实体识别   总被引:3,自引:0,他引:3  
互联网农技问答平台现仅依靠人工提供答题服务,响应速度慢,回答质量难以保证。实现智能农技问题解答,构建农技知识库,需要从现有问答数据提取“农作物-病虫害-农药”命名实体三元组。现有对农业中文命名实体识别的研究较少,且准确率较低。根据农作物、病虫害及农药命名实体的特点,针对农技问答数据,提出基于条件随机场的农作物、病虫害及农药命名实体的识别方法。对数据集进行格式整理及自动分词,并对分词后的语料,针对是否包含特定界定词、是否含特定偏旁部首、是否是数量词、是否是特定左右指界词及词性等特征进行自动标注。利用标注后的数据训练CRF模型,可以对语料进行分类,包括判断语料是否属于农作物、病虫害、农药3类命名实体并识别该语料在复合命名实体中的位置,从而实现了对3类命名实体的识别,由此可自动构建关联三元组。通过试验选择特征组合和调整上下文窗口大小,提高了本方法的识别准确度,降低了模型训练时间,对农作物、病虫害、农药命名实体识别的准确度分别达97.72%、87.63%、98.05%,比现有方法有显著提高。  相似文献   

7.
为探究变化背景下安徽省干湿指数时空分布格局,利用安徽省1957—2016年的逐日气象观测数据,在采用区域修正模式的FAO 56 Penman-Monteith模型计算潜在蒸散量(ET0)的基础上,通过云模型定量描述近60年安徽省干湿指数(AI)的时空分布特征、均匀性和稳定性。结果表明:安徽省AI、ET0呈现波动下降趋势,倾向率分别为-0.006a-1和-0583mm/a,降水量P呈现1155mm/a的上升趋势,ET0和P的相向趋势造成了AI的逐渐降低,近60年安徽省总体呈现变湿趋势。相较于ET0与AI,P最为离散,稳定性最差。在四季尺度上,以夏季为主导(-0.012a-1)的夏秋冬AI降低为安徽省干湿变化主要特征,AI超熵值由高到低依次为夏季、秋季、春冬季,不确定性逐渐降低;四季ET0变化熵值均低于年均熵值,四季ET0模糊性与随机性较差,冬季ET0具有最大不稳定性;夏冬季节的雨雪增加与春秋季降水量减少是安徽省四季降水格局的主要表现形式,且夏季降水增加趋势显著(2 467mm/a),同时表现出最大的不均匀性和不稳定性。在空间尺度上,AI、ET0和P均呈现皖南至皖北的梯度变化特征,〖JP〗出现非平滑纬度地带性现象,空间上各区域熵与超熵均高于时间序列,空间上AI的分布更为离散、不稳定。  相似文献   

8.
中国农技推广信息平台(NJTG)问答社区可以帮助用户与农业专家进行交互,从而获得精准的问题答案以解决农业场景问题。在平台问答社区中,每天会新增关于水稻的提问语句上千百条,检测相同语义问句是农业智能问答的关键技术环节,针对此问题采用字符级别的Word2Vec表示初始化问句表征,使用Siamese神经网络作为基础模型框架,学习句子的语义特征,获取上下文信息,然后使用BiLSTM长短期神经网络提取语义时序特征,最后在语义层次上使用一种包含语义信息的余弦函数计算问句相似度,并与其他语义匹配模型进行对比试验。通过构建7 820对水稻问句的相似对数据集,用来优化和训练模型的重要参数。试验结果表明:本文提出的BiLSTM-CNN模型可高效提取文本不同粒度的特征,提高水稻问句相似度匹配效果,在所构建的数据集上BiLSTM-CNN模型准确率和F1值均高于其他文本匹配模型,达到98.2%和88.75%。与此同时,所提出的模型在6种不同类别的水稻问句对的准确率也优于其他对比模型,在数据量较小的情况下,仍然可以取得较高的准确率,证明提出的模型具有良好的鲁棒性。  相似文献   

9.
10.
针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的Django框架设计农业领域的实体识别、实体查询、农知问答等子系统。经过试验对比,所提出的改进的Bi-LSTM-CRF在农业信息领域具有更好的实体识别能力,在农业信息语料库上的精确率、召回率和F1值分别为93.23%、91.08%和92.16%。实现农业领域实体识别和农业信息问答的知识图谱网站演示,对农业信息化的发展具有重要意义。  相似文献   

11.
徐浩 《湖南农机》2008,(3):138-139
网络文化以其独特开放性、平等性、互动性及无政府性形成了与传统文化的冲突与矛盾,它正越来越多地影响当代大学生的思想,道德和价值观念。本文从影响大学生网络道德行为的三大因素出发,分析了其原因对策,希望引起教育工作者的共鸣。  相似文献   

12.
李玥 《湖南农机》2007,(5):84-86
简要介绍网络仿真软件OMNeT ,分析OMNeT 在教学中应用的优点。通过OM-NeT 构建了一个模拟的尽量简化的计算机网络,并给这个网络配上原理性的网络协议,最后让它运行起来。这样可以让学生通过观看网络运作动画、分析网络性能结果和设计简单网络实体,更容易、深入地理解网络协议和算法的复杂行为,收到更好的教学效果。  相似文献   

13.
随着计算机技术网络的快速发展,网络安全成为人们研究的焦点。本文分析了网络攻击的主要方式和网络安全的关键,举例让我们对病毒的攻击有深入了解,再采用相应的技术防范。  相似文献   

14.
参考作物腾发量(ET0)是估算作物腾发量的关键参数,其准确预测对提高作物需水预报精度具有十分重要的意义。Elman神经网络是BP网络的改进结构,具有适应时变性的特点;最小二乘支持向量机(LS-SVM)是支持向量机(SVM)的一种优化算法,它基于结构风险最小化准则,可兼顾模型的经验风险和推广能力。将两种方法应用于参考作物腾发量预测中,并以铁岭市为例,对比分析LS-SVM模型与Elman模型的预测值。结果表明:LS-SVM模型学习速度快,具有比Elman模型更高的模拟性能和预测精度,更适合参考作物腾发量的预测。  相似文献   

15.
为了有效提高配电网络的收敛速度,避免不成熟收敛,在传统遗传算法的基础上,提出了一种快速环路分解遗传算法。提出用支路的开关状态(0或1)作为控制参数,避免繁琐的编码方法,缩短了染色体的长度,同时对交叉位置的选取和变异提出了独特的方案,并用于网络重构中,极大地提高了计算效率。  相似文献   

16.
绿色生态空间网络是景观生态学的重要研究内容,是耦合景观格局、生态过程与生态功能的重要桥梁,对于提高景观连接性、保护物种多样性、促进生态系统结构与功能的完整性具有重要意义。本文梳理了绿色生态空间网络的研究脉络,从绿色生态空间网络的概念与特征、相关理论与研究方法等方面展开论述,阐述了绿色生态空间网络的相关概念及发展历程,构建、分析与优化中的常见方法与主要特点,以及绿色空间网络研究中的相关理论,列举了绿色生态空间网络的主要应用领域,如城市、水文、防风固沙、水土保持等,并对绿色生态网络的基本改变、研究方法、尺度研究以及和其他空间网络结合等方面进行了展望。  相似文献   

17.
网络在给人们工作、生活带来便捷的同时,也产生了一些消极影响。通过分析网络安全面临的挑战及其表现形式,从技术层面提出有效保护网络安全的有效途径。  相似文献   

18.
论述了Wingate4.x的工作原理,分析实现网络共享关键技术,即代理转存技术、网络地址转换技术和重定向技术,并具体介绍了实现共享上网安装过程及方法,对许多想共享上网的用户有指导作用。  相似文献   

19.
王丽 《湖南农机》2007,(11):165
本文探讨了计算机网络安全的形式和如何防范的基本措施.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号