首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
类人计算领域, 题意的机器理解是数学应用题自动求解的难点. 常识性知识的缺失直接影响到题意理解的准确性. 本研究以常识为研究对象, 收集了历年初等数学古典概型的典型案例, 分析了古典概型类应用题的常识特征, 并进行了常识类型划分; 设计了XML结构存储常识性知识, 构建常识库系统实现古典概型常识的分类、表征及存储, 辅助计算机进行题意理解. 通过典型案例的应用, 其结果显示本研究构建的常识库对古典概型应用题的题意正确理解是十分有帮助的.  相似文献   

2.
数学应用题自动求解,即利用计算机对自然语言描述的应用题进行自动理解和作答,一直是人工智能领域研究的重难点和核心目标之一。针对应用题语义复杂、上下文情景多变、关键参数难以准确识别的问题,提出一种基于依存句法的初等数学分层抽样应用题题意理解方法。通过构建一个面向初等数学分层抽样类应用题的句模库,并结合依存句法来实现分层抽样应用题解题信息的自动抽取。实验研究发现,与仅基于句模的信息抽取方法相比,该方法对不同语义角色的句子的信息抽取准确率均有一定提升,整题理解的准确率从40%上升至68%。  相似文献   

3.
刘丽  王永恒  韦航 《计算机应用》2015,35(12):3481-3486
针对传统粗粒度情感分析忽略具体评价对象,以及现有细粒度情感分析方法忽略无关评价要素的问题,提出结合条件随机场(CRF)和语法树剪枝的方法对产品评论进行细粒度情感分析。采用基于MapReduce的并行化协同训练(Tri-training)的方法对语料进行半自主标注,利用融合多种语言特征的条件随机场模型,获取评论中的评价对象和正负面评价词。通过建立领域本体和句法路径库实现语法树剪枝,对含有多个评价对象和评价词的文本,去掉无关评价对象的干扰,抽取出正确的评价单元,最后形成可视化产品报告。实验结果显示,提出的方法在两种不同领域数据集上,识别情感要素的综合准确率达89%左右,情感评价单元的综合准确率也达89%左右。实验结果表明,与传统方法相比,结合CRF和语法树剪枝的方法识别准确率更高,性能更好。  相似文献   

4.
提出融合领域特征向量与词向量的识别方法,将基于武器装备名特征库与维基语料训练得到的领域特征向量引入Bi-LSTM+CRF模型,并对武器装备名进行自动识别实验。引入领域特征向量后模型的识别准确率由78.30%提升到82.10%,召回率由65.25%提升到67.30%,对未登录武器装备名识别的召回率从45.08%提升到50.16%。此外,将领域特征融入条件随机场(conditional random field,CRF)模型,实验表明,在小规模语料库与领域特征支持的情况下,CRF模型的效果要优于Bi-LSTM+CRF模型且对稀疏特征的利用效率更优。  相似文献   

5.
数学问题自动求解是人工智能领域的一项重要工作。以应用题自动求解为目标,以高考入学考试数学试卷中的分层抽样应用题为研究对象,重点研究了分层抽样应用题的句子语义角色识别方法。根据分层抽样的原理,首先定义了分层抽样题意表征中的五种核心语义角色,分别为:总体、样本、总体中的层、样本中的层和实体之间的关系。基于这五种语义角色,应用题题意理解中的核心问题被转换为对应用题文本中的句子进行语义角色判定。提出了一种基于特征词与n-gram模型相结合的句子语义角色判定方法,对分层抽样应用题文本中的句子进行语义角色判定。根据测试集中的实验结果,应用题的整题识别准确率由基于特征词的判定方法的17.95%提高到64.1%。实验结果说明基于特征词与n-gram模型相结合的句子语义角色判定方法能够提高题意理解的准确率。  相似文献   

6.
旅游领域命名实体识别是旅游知识图谱构建过程中的关键步骤,与通用领域的实体相比,旅游文本的实体具有长度长、一词多义、嵌套严重的特点,导致命名实体识别准确率低。提出一种融合词典信息的有向图神经网络(L-CGNN)模型,用于旅游领域中的命名实体识别。将预训练词向量通过卷积神经网络提取丰富的字特征,利用词典构造句子的有向图,以生成邻接矩阵并融合字词信息,通过将包含局部特征的词向量和邻接矩阵输入图神经网络(GNN)中,提取全局语义信息,并引入条件随机场(CRF)得到最优的标签序列。实验结果表明,相比Lattice LSTM、ID-CNN+CRF、CRF等模型,L-CGNN模型在旅游和简历数据集上具有较高的识别准确率,其F1值分别达到86.86%和95.02%。  相似文献   

7.
传统的微博情感分析往往忽略不带感情色彩的情感词对微博情感的影响,并缺乏对复杂句式的分析。为此,提出结合条件随机场(conditional random filed,CRF)和复杂句式的跨粒度情感分析方法。该方法在CRF模型的基础上,融合复杂句式特征和语义依存特征,对学生微博进行细粒度情感分析,识别出微博文本中的情感要素,在此基础上,通过基于复杂句式的粗粒度情感分析方法分析微博文本的情感倾向,实现对学生总体情感倾向的跨粒度分析。实验结果显示,跨粒度情感分析方法的提出,使得情感要素识别的综合准确率达88%左右,微博情感分析的综合准确率达87%左右。比起传统的情感分析方法,准确率更高,分类效果更好。  相似文献   

8.
找到能减小类内距离、增大类间距离的特征表示方法是行人识别的一个挑战。提出一种基于行人验证和识别相融合的深度网络模型来解决这一问题。首先,识别监督学习网络模型增加不同个人的类间间距,验证监督学习网络模型减少同一个行人的类内间距;然后,将行人验证和识别的深度网络融合,提取到更有分辨能力的行人特征向量;最后,采用了联合贝叶斯的行人比对方法,通过监督学习排名的方式,提高行人比对的准确率。实验结果表明,所提方法在VIPeR库上同其他深度网络相比有较高的识别准确率,融合网络与单独的识别和验证网络相比有更高的收敛速度和识别准确率。  相似文献   

9.
命名实体识别是自然语言处理中的一个关键。在需求文档中存在过长的实体:虚功能,使得普适的传统命名实体识别方法无法有效地识别得到完整的实体。本文针对需求文档实体识别模型进行深入研究,引入深度学习方法,提出基于深度残差网络(ResNet)的CNER方法与基于规则的方法相结合,进行针对中文需求文档的分词。本文的命名实体识别模型是一种编码-解码模型,使用带有注意力机制的双向长短期记忆网络(BiLSTM with attention)进行编码,得到分词后文本的上下文特征和句式特征,使用条件随机场(CRF)方法进行解码,再结合语法规约的干预进行需求文档实体识别。实验表明,所提方法在需求文档领域识别效果优于普适的传统方法。  相似文献   

10.
武器装备名是军事领域中一类重要的命名实体,英文武器装备名的自动识别对于军事领域的信息处理有着重要的价值。作为一种融合了上下文特征的统计模型,条件随机场(conditional random field,CRF)在对命名实体的识别中有着广泛的应用。针对武器装备名的构造特点及CRF模型在使用语言特征上存在的不足,对已有CRF模型提出两点改进:丰富模型使用的特征,对武器装备名的构造模式与要素进行分析总结,形成针对武器装备名的要素类,并将该类别信息作为特征提供给CRF模型使用;针对构成武器装备名的要素大多是多词单位,将标注单元由词扩展到多词组合。实验结果显示,改进后模型对武器装备名识别的准确率和召回率均有明显提升,准确率由85.62%提升为90.60%,召回率由42.27%提升为88.17%。该方法不仅对于军事领域相关的信息处理任务有着重要价值,并且对于其他语种和相关领域的研究都有着重要的借鉴意义。  相似文献   

11.
中文分词是自然语言处理的基础性问题。条件随机场模型分词过程中出现的切分粒度过小和多字粘连造成的错分问题,是影响分词结果的两个主要原因。提出了一个基于字词分类的层次分词模型,该模型采用多部有效词典进行处理,在外层分词系统中解决切分粒度过小问题;在内层核心层,条件随机场分词后再处理多字粘连问题。实验结果表明,采用加入多词典的字词结合层次分类模型F-测度值有较大的提高,有助于得到好的分词结果。  相似文献   

12.
基于条件随机域的词性标注模型   总被引:3,自引:0,他引:3  
词性标注主要面临兼类词消歧以及未知词标注的难题,传统隐马尔科夫方法不易融合新特征,而最大熵马尔科夫模型存在标注偏置等问题。本文引入条件随机域建立词性标注模型,易于融合新的特征,并能解决标注偏置的问题。此外,又引入长距离特征有效地标注复杂兼类词,以及应用后缀词与命名实体识别等方法提高未知词的标注精度。在条件随机域模型框架下,本文进一步探讨了融合模型的方法及性能。词性标注开放实验表明,条件随机域模型获得了96.10%的标注精度。  相似文献   

13.
针对现阶段方面级情感分析(ABSA)存在的方面词与不相关上下文错误匹配以及缺乏语法层面特征的问题,提出一种融合匹配长短时记忆网络(mLSTM)和语法距离的ABSA模型mLSTM-GCN。首先,逐词计算方面词与上下文的关联性,并将得到的注意力权重与上下文表示融合作为mLSTM的输入,从而得到与方面词关联度更高的上下文表示;然后,引入语法距离以获得与方面词语法关联度更高的上下文,从而获取更多的上下文特征来指导方面词的建模,并通过方面掩盖层得到方面表示;最后,结合位置权重、上下文表示以及方面表示来进行信息交互,从而获取用于情感分析的特征。在Twitter、REST14和LAP14数据集上的实验结果表明,相较于特定方面的图卷积网络(ASGCN),mLSTM-GCN的准确率分别提升1.32、2.50和1.63个百分点,宏平均F1分别提升2.52、2.19和1.64个百分点。可见,mLSTM-GCN能够有效降低方面词与不相关上下文错误匹配的概率,提升分类效果。  相似文献   

14.
在初等数学领域的命名实体识别(NER)中,针对传统命名实体识别方法中词嵌入无法表征一词多义以及特征提取过程中忽略部分局部特征的问题,提出一种基于BERT的初等数学文本命名实体识别方法——BERT-BiLSTM-IDCNN-CRF.首先,采用BERT进行预训练,然后将训练得到的词向量输入到双向长短期记忆(BiLSTM)网...  相似文献   

15.
徐关友  冯伟森 《计算机应用》2022,42(9):2693-2700
最近一些基于字符的命名实体识别(NER)模型无法充分利用词信息,而利用词信息的格子结构模型可能会退化为基于词的模型而出现分词错误。针对这些问题提出了一种基于transformer的python NER模型来编码字符-词信息。首先,将词信息与词开始或结束对应的字符绑定;然后,利用三种不同的策略,将词信息通过transformer编码为固定大小的表示;最后,使用条件随机场(CRF)解码,从而避免获取词边界信息带来的分词错误,并提升批量训练速度。在python数据集上的实验结果可以看出,所提模型的F1值比Lattice-LSTM模型高2.64个百分点,同时训练时间是对比模型的1/4左右,说明所提模型能够防止模型退化,提升批量训练速度,更好地识别python命名实体。  相似文献   

16.
冯艳红  于红  孙庚  赵禹锦 《计算机应用》2016,36(11):3146-3151
针对基于统计特征的领域术语识别方法忽略了术语的语义和领域特性,从而影响识别结果这一问题,提出一种基于词向量和条件随机场(CRF)的领域术语识别方法。该方法利用词向量具有较强的语义表达能力、词语与领域术语之间的相似度具有较强的领域表达能力这一特点,在统计特征的基础上,增加了词语的词向量与领域术语的词向量之间的相似度特征,构成基于词向量的特征向量,并采用CRF方法综合这些特征实现了领域术语识别。最后在领域语料库和SogouCA语料库上进行实验,识别结果的准确率、召回率和F测度分别达到了0.9855、0.9439和0.9643,表明所提的领域术语识别方法取得了较好的效果。  相似文献   

17.
梯田是坡耕地上最主要的水土保持工程,准确地提取梯田信息对水土保持监测和评价十分重要。为了解决无人机遥感梯田识别研究中梯田特征自动学习的问题,制作了一套像素级标注的梯田正射影像样本集并设计FCN-8s模型与DenseCRF模型结合的梯田识别方法。实验结果表明,该方法在山脊区梯田、密集水平梯田和不规则梯田识别的总体精度、F1分数和Kappa系数均值分别为86.85%、87.28%、80.41%,与其他方法相比,效果较好。该方法适用于无人机遥感梯田识别领域,是一种精确有效的识别方法。  相似文献   

18.
结合微博新词的构词规则自由度大和极其复杂的特点,针对传统的C/NC-value方法抽取的结果新词边界的识别准确率不高,以及低频微博新词无法正确识别的问题,提出了一种融合人工启发式规则、C/NC-value改进算法和条件随机场(CRF)模型的微博新词抽取方法。一方面,人工启发式规则是指对微博新词的分类和归纳总结,并从微博新词构词的词性(POS)、字符类别和表意符号等角度设计的微博新词的构词规则;另一方面,改进的C/NC-value方法通过引入词频、邻接熵和互信息等统计量来重构NC-value目标函数,并使用CRF模型训练和识别新词,最终达到提高新词边界识别准确率和低频新词识别精度的目的。实验结果显示,与传统方法相比,所提出的方法能有效地提高微博新词识别的F值。  相似文献   

19.
车玲  张仰森 《计算机工程》2012,38(20):152-155
以条件随机场(CRF)作为构建词义消歧模型库的概率模型,利用CRF分别训练高频义项和低频义项标点句语料,应用生成的模型文件进行消歧实验.通过分析标注结果中的概率值确定阈值,以区分标注正确项和错误项.使用表现较好的模型文件和相应阈值构建面向词义消歧的条件随机场模型库.实验结果证明,对低频义项建模的词义消歧效果优于对高频义项进行建模,可以达到80%以上的正确率,并且可以获得较高的召回率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号