首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
在自然语言中,动词的用法主要包含3种:字面、转喻和隐喻.动词的隐喻用法在隐喻的研究中占有重要的地位.动词的隐喻计算包含两个子任务:隐喻识别和隐喻理解.本文采用条件随机场、最大熵模型来识别动词的隐喻搭配,并在此基础上,加入了两种语义信息:《同义词词林》的同义词信息和《知网》的语义信息来识别动词的隐喻表达,实验识别正确率可...  相似文献   

2.
当前由于电子政务发展迅速而引起的电子政务文档数量剧增,如何使用户能够提高检索文档信息查准率的同时提高检索的查全率已经成为一个热门问题。文章提出电子政务文档元数据的语义组织方法,包括文档集的资源描述框架模型的建立、合并以及检索词在文档中相似度的计算。对电子政务文档的智能搜索提出一种基于语义网检索的实现方法,结合语义网便于机器理解的优点,提高了检索集的查全率和查准率。  相似文献   

3.
为解决卷积神经网络在进行语音识别时通过样本训练神经网络所花费的时间过长的问题,提出了采用分数阶的理论处理卷积神经网络中的节点函数Sigmoid函数,使Sigmoid函数的收敛速度加快,而在不影响卷积神经网络进行语音识别的正确率的前提下,从而达到了减少训练所需时间提高整个神经网络的训练效率的目的 .实验结果表明:在保证正确率的前提下采用分数阶进行处理有效的减少了训练所花的时间.  相似文献   

4.
隐喻普遍存在于自然语言中,精确的识别隐喻可以促进自然语言处理具体任务中语义的理解.为了提高中文名词隐喻识别效果,提出一种基于知识增强的语义表示(ERNIE)和双向长短期记忆网络(BiLSTM)的分类模型ERNIE_BiLSTM.该模型使用ERNIE进行编码,获取上下文相关的语义表示;并利用双向LSTM再次训练词向量,捕获文本长距离的语义关系.实验结果表明,ERNIE_BiLSTM模型在中文名词隐喻识别数据集上表现良好,准确率达到90.34%.  相似文献   

5.
为了使不同类型传感器网络能够自适应地访问和交换彼此的信息资源,研究分析基于传感网整合框架的传感观测服务。通过使用Tomcat服务器构建传感观测服务2.0系统,并针对传感观测服务SOS 2.0核心操作和信息模型,使用Java编程实现XML文档验证规则,首先通过使用schema对XML文档架构的正确性进行检验,其次使用schematron对XML文档架构的规范约束表达式进行验证。实验结果表明,借助XML文档验证规则,即可增加传感观测服务的语义信息,又能解决异构传感器之间的通信问题。  相似文献   

6.
针对现有答案选择方法语义特征提取不充分和准确性差的问题,引入自注意力和门控机制,提出了一种答案选择模型。该模型首先在问题和答案文本内部利用层叠自注意力进行向量表示,并在自注意力模块中让单词和位置分开进行多头注意力;然后将答案句通过卷积神经网络(Convolutional neural network, CNN)得到的向量表示输入注意力层,根据问题生成与问题相关的答案表示,并通过门控机制融合两种表示;最后计算问题和答案文本的相关性分数,得到候选答案的排名和标注。结果表明:该模型与双向长短时记忆网络模型、自注意力模型和基于注意力的双向长短时记忆网络模型相比,在WebMedQA数据集上平均倒数排名分数分别提高了8.37%、4.79%和2.03%,预测答案正确率也有提高。这表明提出的模型能够捕获更丰富的语义信息,有效提升了答案选择的性能。  相似文献   

7.
针对现有工程信息检索中文档语义理解和关联不足的问题,根据工程环境下信息检索的特点,提出一个异质工程文档的检索方法,包括内容分析、语义建模、多维关联、语义推理与扩展以及查询处理等过程.采用基于本体的理解标注多源异质工程文档,获取工程语义信息,建立语义标注库,实现异质文档内容的统一表达.采用以文档为中心的多维关联机制,在文档内容语义理解的基础上,将基于本体的内在关联扩展为融合文档及内容的多重关联.结果表明,多维关联机制能够启发式地关联产品生命周期中的文档,增强查询的导航能力,为语义推理和检索扩展提供服务.  相似文献   

8.
为便于厘清机器阅读理解任务的研究现状,按照答案来源,将机器阅读理解分为完形填空、片段选择、多项选择和答案生成4类.在统一的编码器-交互与推理-输出框架下对此4类任务的已有研究进行了综述,并描述了2种对此框架的可能扩展;最后讨论了机器阅读理解未来需要解决的问题.  相似文献   

9.
面对阅读理解数据集存在多文档、多段落候选,而参考答案只出现在一个段落里面的情景,提出基于段落选择的分层融合阅读理解模型。段落选择器用于在候选文档中选出最佳段落,基于双向注意力的分层信息融合模型用于在最佳段落中定位参考答案的起始和结束位置,降低传统直接选择机器阅读理解模型的复杂性和计算量。在DuReader中文数据集上进行实验效果对比,结果显示所提出的方法较基准方法在Bleu-4和Rouge-L指标分别提高了约12%和11%,进一步验证了所提出方法的有效性。  相似文献   

10.
将全信息(自然语言的语法、语义和语用信息)自然语言理解应用到可靠语音功能的研究中,提出在语音识别之后增加一个全信息自然语言理解的文本后处理功能,通过深入分析词语的语法信息(位置、识别稳定度)、语义信息(语句目标含义)和语用信息(语境和谐度)对语音识别结果语句进行评估、检错和纠错,最终输出优化语句。实验结果表明,增加全信息自然语言理解后处理可使识别正确率获得较好改善。  相似文献   

11.
答疑系统是现代远程教育中一个重要的组成部分。针对目前智能答疑系统在知识共享和问题求解精确性方面的不足,本文提出一种基于ontology的智能答疑系统模型,以大学计算机信息技术教程课程为例,构建课程知识本体,并在基于本体的推理和答案匹配模式方面进行了尝试。  相似文献   

12.
提出一个基于语义模板的用户交互问答系统,其中语义模板用于标识句子中各成分之间的语义关联关系.语义模板的使用有助于问题的分解和各成分间语义关联关系的研究,可提高分析精度,适宜于英文和中文问题的分析.在系统运行中,将问题和用户选择的正确答案对,存储在数据库中,通过积累知识构建知识库,实现问题自动回答.  相似文献   

13.
基于本体和转移网络的网络教育自动答疑系统   总被引:4,自引:0,他引:4  
刘亚军  赵贇 《哈尔滨工业大学学报》2004,36(12):1649-1650,1692
针对网络教育自动答疑系统的特点,研究了网络教育领域本体的构建方法.提出基于本体的问题模式的确定以及基于转移网络解决规范化问题的答案生成.讨论了基于本体知识的语义相似度模型,用于解决非规范问题的答案生成.实验结果说明,利用本体的知识和丰富的语义信息能够解决答疑系统中的语义问题.  相似文献   

14.
针对答案选择过程中存在语句特征、语句间的相关语义信息提取不充分的问题,在长短时记忆网络(LSTM)的基础上,提出基于LSTM和衰减自注意力的答案选择模型(DALSTM). DALSTM使用LSTM和衰减自注意力编码层提取丰富的上下文语义信息,通过衰减矩阵缓解反复使用注意力机制出现的权重过集中于关键词的问题. 使用注意力机制对问题与答案间的信息进行双向交互,融合问答对间的相似性特征,丰富问答对间的相关语义信息. 在WiKiQA、TrecQA及InsuranceQA数据集上的模型评估结果表明,相较于其他基于BiLSTM的先进模型,DALSTM的整体性能表现更好,3个数据集的平均倒数排名(MRR)分别达到0.757、0.871、0.743.  相似文献   

15.
为研究面向大规模网络数据的社会化问答系统(Social Question and Answer System,SocialQA).分别描述了问答系统的各个组成技术:1)问句预处理:问句分析和问句扩展.2)问句匹配.本文在1500万个网络问答数据集上,进行了问句匹配的实验.实验表明:在封闭测试中,问句匹配的准确率,达到了90%以上,在开放测试中,问句匹配的准确率达到了70%以上,很好地满足了系统的精度和实时性的要求.  相似文献   

16.
分析了自动应答系统的工作原理,提出了一种改进的信息检索算法。并据此设计了一个基于FAQ(Frequently-Asked Questions)的自动应答系统。当用户以自然语言形式提出问题后,系统首先在FAQ的问题库中查找与用户所提问题语义最相近语句作为候选问题,然后从FAQ的答案库中找出与候选问题匹配的答案作为最后的结果返回给用户。实验结果表明,系统对用户的自助服务效果显著,回答问题的正确率达到0.40。  相似文献   

17.
Considering the shortcomings of existing research methods in the Chinese medical health questions classification task, this paper proposes a new health questions classification method that incorporates the health questions’ local semantic information and global structural information. We first obtain the questions’ local semantic representation and global structural representation by the convolutional neural network (CNN) and independent recurrent neural network (IndRNN). Then, we extract the questions’ semantic representation, and especially we get the questions’ semantic representation by fusing the local semantic representation and global structural representation using a self-attention mechanism. Finally, we classify the semantic representation of the medical health question through the softmax layer and output classification result. Experimental results show that this method leads to a good performance in the Chinese medical health questions dataset, and that it effectively improves the semantic representation ability of the model and significantly resolves the gradient vanishing and gradient explosion problems.  相似文献   

18.
The information integration method of semantic web based on agent ontology (SWAO method) was put forward aiming at the problems in current network environment, which integrates, analyzes and processes enormous web information and extracts answers on the basis of semantics. With SWAO method as the clue, the following technologies were studied: the method of concept extraction based on semantic term mining, agent ontology construction method on account of multi-points and the answer extraction in view of semantic inference. Meanwhile, the structural model of the question answering system applying ontology was presented, which adopts OWL language to describe domain knowledge from where QA system infers and extracts answers by Jena inference engine. In the system testing, the precision rate reaches 86%, and the recalling rate is 93%. The experimental results prove that it is feasible to use the method to develop a question answering system, which is valuable for further study in more depth.  相似文献   

19.
智能问答系统中问句相似度计算方法   总被引:2,自引:0,他引:2  
以《现代操作系统》为例,在智能问答系统中,综合考虑问句的词和语义等多方面特征,并对编辑距离法进行改进,设计了一种新的组合式问句相似度计算方法。实验结果表明,该算法取得了良好的效果,可以有效地提高问答系统的性能。  相似文献   

20.
基于模式学习的中文问答系统答案抽取方法   总被引:1,自引:0,他引:1  
答案抽取是中文问答系统的关键,而通常答案是借助于问题的答案句子模式抽取得到,由于答案句子模式是语言专家根据语言规则提炼获得,因此非常依赖于专家经验。针对这一局限性,提出了一种利用模式学习来获得中文答案句子模式的方法,该方法利用搜索引擎从互连网上检索相关问题文本,人工提取包含答案的句子段,并标注问题类型及答案,形成各种问题类型的问答训练语料。通过统计学习,提取候选答案句子模式,计算候选句子模式权重,并根据权重获得相应问题类型的答案句子模式。基于事实的问题答案抽取结果表明,提出的基于模式学习的方法有很好的效果,实验答案提取准确率值达到了0.28,学习方法获得的模式基本上覆盖了常规答案句子模式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号