首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
尹伊淳  张铭 《中文信息学报》2018,32(11):112-116
该文描述了ZWYC团队在“2018机器阅读理解技术竞赛”上提出的机器理解模型。所提出模型将机器阅读理解问题建模成连续文本片段抽取问题,提出基于富语义特征的神经交互网络模型。为了充分使用答案标注信息,模型首先对数据进行细致的重构,让人工标注的多个答案信息都能融合到数据中。通过特征工程,对每个词构建富语义表征。同时提出一种简单有效的问题和文档交互的方式,得到问题感知的文档表征。基于多个文档串接的全局表征,模型进行答案文本预测。在最终测试集上,该模型获得了目前先进的结果,在105支队伍中排名第2。  相似文献   

2.
针对现有命名实体识别方法主要考虑单个句子内的上下文信息,很少考虑文档级上下文影响的问题,文中提出基于机器阅读理解的中文命名实体识别方法,利用阅读理解思想,充分挖掘文档级的上下文特征,支撑实体识别.首先,针对每类实体,将实体识别任务转化为问答任务,构建问题、文本及实体答案三元组.然后,将三元组信息通过双向Transformer编码器进行预训练,再通过卷积神经网络捕捉文档级文本上下文信息.最后通过二进制分类器实现实体答案预测.在MSRA、人民日报公开数据集和自建数据集上的命名实体识别对比实验表明,文中方法性能较优,阅读理解思想对实体识别具有较好的作用.  相似文献   

3.
余笑岩  何世柱  宋燃  刘康  赵军  周永彬 《软件学报》2023,34(11):5179-5190
选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提出一种联合学习框架下基于多视角图编码的选择式阅读理解方法,从多视角充分挖掘文档句子之间以及文档句子和问句之间的关联关系,实现证据句及其关系的有效建模;同时通过联合训练证据抽取和答案预测任务,利用证据和答案之间强关联关系提升证据抽取与答案预测的性能.具体来说,所提方法首先基于多视角图编码模块对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义3个视角捕捉文档、问题和候选答案之间的关系,获得问答对感知的文档编码特征;然后,构建证据抽取和答案预测的联合学习模块,通过协同训练强化证据与答案之间的关系,证据抽取子模块实现证据句的选择,并将其结果和文档编码特征进行选择性融合,并用于答案预测子模块完成答案预测.在选择式阅读理解数据集ReCO和RACE上的实验结果表明,所提方法提升了从文档中选择证据句子的能力,进而提高答案预测的准确率.同时,证据抽取与答案预测联合学习很大程...  相似文献   

4.
近年来,科技论文发表数量与日俱增,科研人员需要阅读文献的数量也随之迅速增长.如何快速而有效地阅读一篇科技论文,逐渐成为一个重要的研究课题.另一方面,在阅读科技论文时,理解与其相关的重要参考文献可帮助读者更好地理解文章的内容.然而,如何从众多的参考文献中快速找到最重要、最相关的几篇,如何避免在阅读过程中迷失在文档的多维空间,仍是值得研究的问题.为了解决上述问题,提出了一个基于文本摘要和引用关系的可视辅助文献阅读系统.该系统利用一种基于阅读目的的文本摘要技术提取出论文中重要的句子,并采用多尺度的可视化方式进行展示;使用LDA(latent dirichlet allocation)话题模型抽取参考文献的核心话题;记录用户的阅读行为,用于提示其阅读上下文,以保证用户关注点不发生迷失.同时,在一个具体的案例场景中详细介绍了系统的使用方法,并进行了用户研究以验证系统的可用性.  相似文献   

5.
阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。  相似文献   

6.
基于浅层语义树核的阅读理解答案句抽取   总被引:2,自引:0,他引:2  
阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。  相似文献   

7.
谭红叶  武宇飞 《计算机科学》2018,45(Z6):72-74, 90
阅读理解任务是在给定的单篇文本上,要求计算机根据文本的内容对相应的问题作出回答。以北京语文高考阅读理解为背景,对其中的词义判断题进行了分析与研究,提出了一个基于支持度计算的解答框架,并尝试使用语言模型、点互信息与句子相似度3种方法来计算支持度。通过实验验证,3种方法在真实数据集和自动构造的数据集上均有一定成效。其中,基于点互信息的支持度计算方法在真实数据集上表现最好,获得了75%的选项正确率。  相似文献   

8.
阅读理解问答系统是利用语义理解等自然语言处理技术,根据输入问题,对非结构化文档数据进行分析,生成一个答案,具有很高的研究和应用价值。在垂直领域应用过程中,阅读理解问答数据标注成本高且用户问题表达复杂多样,使得阅读理解问答系统准确率低、鲁棒性差。针对这一问题,该文提出一种面向垂直领域的阅读理解问答数据的增强方法,基于真实用户问题,构造阅读理解训练数据,一方面降低标注成本,另一方面增加训练数据多样性,提升模型的准确率和鲁棒性。该文用汽车领域数据对本方法进行实验验证,其结果表明,该方法对垂直领域中阅读理解模型的准确率和鲁棒性均得到有效提升。  相似文献   

9.
阅读理解(reading comprehension,RC)任务的目的在于理解一篇文档并对提出的问题返回答案句.提出了一种充分利用外部资源来提高RC系统性能的方法,使得RC系统性能在Remedia和ChungHwa两种语料上均得到提高.特别地,在对基于Remedia语料RC系统的性能分析表明,24.1%的性能提高归因于基于Web的答案模式匹配的运用,11.1%的性能提高归因于语言学特征匹配策略运用.同时也进行了t-test,结果表明答案模式匹配、语言学特征匹配和词汇语义关联推理的运用所得到的性能提高是显著的.  相似文献   

10.
机器阅读理解是自然语言处理和人工智能领域的重要前沿课题,近年来受到学术界和工业界的广泛关注。为了提升机器阅读理解系统在多文档中文数据集上的处理能力,我们提出了N-Reader,一个基于神经网络的端到端机器阅读理解模型。该模型的主要特点是采用双层self-attention机制对单个文档以及所有输入文档进行编码。通过这样的编码,不仅可以获取单篇文档中的关键信息,还可以利用多篇文档中的相似性信息。另外,我们还提出了一种多相关段落补全算法来对输入文档进行数据预处理。这种补全算法可以帮助模型识别出具有相关语义的段落,进而预测出更好的答案序列。使用N-Reader模型,我们参加了由中国中文信息学会、中国计算机学会和百度公司联手举办的“2018机器阅读理解技术竞赛”,取得了第3名的成绩。  相似文献   

11.
Reading From Paper versus Reading From Screen   总被引:1,自引:0,他引:1  
  相似文献   

12.
Must Reading     
《Software, IEEE》1986,3(6):57-57
  相似文献   

13.
14.
阅读土地     
艺术家毛同强用三年的时间,搜集了1300多张废弃了的地契,创作了《地契》这件大型作品。  相似文献   

15.
《Ergonomics》2012,55(10):1231-1248
The design of low vision aids for partially sighted people, such as magnifiers, is evaluated theoretically in order to identify meaningful directions of research for improving these aids. Both reading with and without a magnifier involves alternating sequences of locating and recognizing textual information. Little is known, however, about these processes in magnifier reading. On the basis of an extensive review of the literature, two topics are identified that stand out as being in need of experimental investigation: (1) the relationship between the (typo)graphical characteristics of printed text and the location and recognition of textual information, and (2) the interplay of location and recognition processes in magnifier reading, including the role of non-visual factors, such as movements of the hand, trunk, head and eyes in this interplay. With regard to the first topic, it is expected that the visibility and, hence, the recognition of textual information by partially sighted people can be improved by matching the fundamental spatial frequencies of graphical structures with the spatial contrast sensitivity of partially sighted people. With regard to the second topic, it is argued that persistent problems in the design of magnifiers, such as the optimal window size, can only be resolved by studying reading with a magnifier as a (multimodal) perceptual-motor activity.  相似文献   

16.
17.
设计了一种能够自适应调整的智能阅读架, 该智能阅读架采用ARM Cortex-A53树莓派微处理器架构, 整机系统由阅读架终端、云端服务器和应用端用户平台3部分构成. 阅读架终端配置单目摄像头, 能实时识别读者前倾、后仰、左偏、右偏、抬头、低头以及正确的坐姿, 并能通过步进电机控制阅读架实现上下、左右角度调节, 自适应跟踪读者的阅读姿态. 此外, 智能阅读架能够将用户使用时间、阅读姿态等信息上传云端服务器, 组建用户档案库, 供用户访问. 该设计产品可以广泛推广到幼儿园及中小学、图书馆阅览室、普通家庭等场合, 帮助阅读者端正坐姿, 养成良好的阅读习惯, 社会和经济效益显著.  相似文献   

18.
Reading dynamically displayed text   总被引:5,自引:0,他引:5  
Two experiments were carried out to find an optimal electronic text display method given limited display space. The display formats tested fell into two categories: Times Square, in which text is scrolled from right to left; and rapid, serial, visual presentation (RSVP), in which text is presented one or several words at a time to a fixed location in the display. Previous studies have indicated that Times Square format is not as efficient as page format display or, by extrapolation, as RSVP. These studies, unlike the present experiments, did not include a smooth-scrolling (pixel-by-pixel) condition. In Experiment 1, a comparison was made between multiple-word RSVP and three versions of Times Square format, differing only in the size of steps by which the display was scrolled. Except for the largest step-size, comprehension was as high in the Times Square conditions as in the RSVP condition. The subjects expressed a significant preference for smooth scrolling Times Square over any other condition. Experiment 2 showed that comprehension for smooth scrolling Times Square was at least as high as that for RSVP at presentation rates ranging from 100 to 300 words per minute. Times Square reading is discussed in terms of optokinetic nystagmus (OKN).  相似文献   

19.
Sixty four members of the public were exposed to the same staged conversation either while waiting in a bus station or travelling on a train. Half of the conversations were by mobile phone, so that only one end of the conversation was heard, and half were co present face-to-face conversations. The volume of the conversations was controlled at one of two levels: the actors' usual speech level and exaggeratedly loud. Following exposure to the conversation participants were approached and asked to give verbal ratings on six scales. Analysis of variance showed that mobile phone conversations were significantly more noticeable and annoying than face-to-face conversations at the same volume when the content of the conversation is controlled. Indeed this effect of medium was as large as the effect of loudness. Various explanations of this effect are explored, with their practical implications.  相似文献   

20.
Today, Amazon recommends books to you based on the books you've previously bought or searched for—soon, it could know exactly what paragraphs you've read. But will this help it make better recommendations? Is this customer service or an invasion of privacy? The author takes a look at recommender systems and if they truly deliver on what they promise or portend a much more error-prone method of tracking people.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号