期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李芳何婷婷《中文信息学报》2011,25(2):9-15

为了满足用户的个性化需求,提供尽可能丰富、实用、方便的文摘结果,该文设计了面向查询的多文档自动文摘的多种摘要模式。在将查询返回的文档集合表示为以文本、段落为节点的双层复杂网络结构以发现子主题的基础上,除传统的摘要模式外,该文又设计了概括摘要、局部摘要、全局摘要和详细摘要这四种摘要模式,并给出了各种摘要的生成方法。支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息。相似文献

2.

基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法

曾昭霖严馨徐广义陈玮邓忠莹《小型微型计算机系统》2023,(1):185-192

针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Attention神经网络模型,获得具有丰富上下文语义信息的句子、文档向量表示;并在此过程中通过双线性变换注意力机制,使得文档向量表示不仅具有反映文档深层主旨信息的基本特性,还融入句子与用户查询的相关性信息,然后利用句向量与其进行相似度计算获得相应的句子重要性得分;其次,由句子重要性得分、句子中包含的关键词特征、句子的长度特征以及句子的时序权重系数加权组合得到最终的句子综合特征权重得分;最后,利用MMR算法来选择摘要句.实验结果表明,与其他方法相比本文提出的方法能在一定程度上提高面向查询的多文档抽取式摘要的质量,具有一定的有效性及优越性. 相似文献

3.

多文档文本摘要的一种改进HITS算法

黄丽雯钱微《计算机应用》2006,26(11):2626-2627,2630

提出了一种对HITS算法进行改进的新方法，本方法将文档内容与一些启发信息如“短语”，“句子长度”和“首句优先”等结合，用于发现多文档子主题，并且将文档子主题特征转换成图节点进行排序。通过对DUC2004数据的实验，结果显示本方法是一种有效的多文本摘要方法。相似文献

4.

基于子主题和用户查询的多文档摘要系统

下载免费PDF全文

徐晓丹《计算机系统应用》2011,20(3):112-115

文章描述了一种基于子主题划分和查询相结合的多文档自动摘要系统的设计：首先利用同义词词林计算句子语义相似度,通过对句子的聚类得到子主题,然后根据用户的查询对子主题进行重要度排序,在此基础上,采用一种动态的句子打分策略从各个主题中抽取句子生成摘要。实验结果表明生成的摘要冗余少,信息全面。相似文献

5.

基于事件指导的多文档生成式摘要方法

王振超孙锐姬东鸿《计算机应用研究》2017,34(2)

建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。该文提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反应篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。相似文献

6.

基于LDA重要主题的多文档自动摘要算法

刘娜路莹唐晓君李明霞《计算机科学与探索》2015,(2):242-248

提出了基于LDA(latent Dirichlet allocation)重要主题的多文档自动摘要算法。该算法与已有的基于主题模型的多文档自动摘要算法主要有两点区别:第一,在计算句子主题与文档主题相似度问题上,引入并定义了主题重要性的概念,将LDA模型建立的主题分成重要和非重要主题两类,计算句子权重时重点考虑句子主题和文档重要主题的相似性;第二,该方法同时使用句子的词频、位置等统计特征和LDA特征组成的向量计算句子的权重,既突出了传统的统计特征的显著优势,又结合了LDA模型的主题概念。实验表明,该算法在DUC2002标准数据集上取得了较好的摘要效果。相似文献

7.

面向查询的文本摘要关键技术研究综述

徐睿刘金亚静《软件工程》2024,(2):1-9

面向查询的文本摘要是自动文摘中的一个特殊领域,可以根据用户个性化的查询需求,从原始文档或文档集中提取有价值的摘要信息。目前,该技术已经在面向查询的搜索引擎、智能化信息检索、问答系统等领域得到广泛应用,并受到越来越多的关注。文章基于面向查询的文本摘要任务的典型技术框架,从查询理解、文档处理和信息组织三个方面对其国内外研究方法的现状进行对比和分析,对不同业务场景的应用进行了举例,归纳了面向查询的文本摘要面临的挑战及发展趋势。相似文献

8.

上下文敏感的多文档自动摘要生成方法

仇丽青李伟明《计算机工程》2010,36(21):265-266,269

针对现有的多文档自动摘要生成方法中存在的问题,提出一种多文档自动摘要生成方法,该方法能够最大限度地减小摘要内容的冗余。选取权重最大的句子作为摘要句,把已选句子中包含的词汇的权重设置为接近0的常数,当下次选择摘要句时,可以避免再次选取包含这些词汇的句子。使用自动摘要评测方法ROUGE对该方法进行评测。实验结果表明,根据该方法抽取的机器摘要能够获得较高的成绩。相似文献

9.

一种个性化查询扩展方法

于春雷朱征宇何杰董曙佳《计算机工程与应用》2012,48(2):119-123

针对当前主流web搜索引擎存在信息检索个性化效果差和信息检索的精确率低等缺点, 通过对已有方法的技术改进, 介绍了一种基于用户历史兴趣网页和历史查询词相结合的个性化查询扩展方法。当用户在搜索引擎上输入查询词时,能根据学习到的当前用户兴趣模型动态判定用户潜在兴趣和计算词间相关度,并将恰当的扩展查询词组提交给搜索引擎,从而实现不同用户输入同一查询词能返回不同检索结果的目的。实验验证了算法的有效性,检索精确率也比原方法有明显提高。相似文献

10.

基于PageRank的中文多文档文本情感摘要

林莉媛王中卿李寿山周国栋《中文信息学报》2014,28(2):85-90

文本情感摘要任务旨在对带有情感的文本数据进行浓缩、提炼进而产生文本所表达的关于情感意见的摘要。该文主要研究基于多文档的文本情感摘要问题, 重点针对网络上存在同一个产品的多个评论产生相应的摘要。首先,为了进行关于文本情感摘要的研究,该文收集并标注了一个基于产品评论的中文多文档文本情感摘要语料库。其次,该文提出了一种基于情感信息的PageRank算法框架用于实现多文档文本情感摘要,该算法同时考虑了情感和主题相关两方面的信息。实验结果表明,该文采用的方法和已有的方法相比在ROUGE值上有显著提高。相似文献

11.

基于DSC的多文本自动摘要

下载免费PDF全文

李成果《计算机系统应用》2014,23(7):7-11

多文本摘要的目标是对给定的查询和多篇文本（文本集）,创建一个简洁明了的摘要,要求该摘要能够表达这些文本的关键内容,同时和给定的查询相关。一个给定的文本集通常包含一些主题,而且每个主题由一类句子来表示,一个优秀的摘要应该要包含那些最重要的主题。如今大部分的方法是建立一个模型来计算句子得分,然后选择得分最高的部分句子来生成摘要。不同于这些方法,我们更加关注文本的主题而不是句子,把如何生成摘要的问题看成一个主题的发现,排序和表示的问题。我们首次引入dominant sets cluster（DSC）来发现主题,然后建立一个模型来对主题的重要性进行评估,最后兼顾代表性和无重复性来从各个主题中选择句子组成摘要。我们在DUC2005、2006、2007三年的标准数据集上进行了实验,最后的实验结果证明了该方法的有效性。相似文献

12.

Mahesh Gangathimmappa Neelakandan Subramani Velmurugan Sambath Rengaraj Alias Muralidharan Ramanujam Naresh Sammeta Maheswari Marimuthu 《Concurrency and Computation》2023,35(2):e7476

Due to the exponential increase in the generation of digital documents and in the online search user diversity, multilingual information is highly available on the Internet. However, the huge amount of multilingual data cannot be analyzed manually. Therefore, cross lingual multi-document summarization (CLMDS) model is introduced to generate a summary of several documents in which the summary language is different from the source document language. This paper presents a Deep Learning Enabled Cross-lingual Search with Metaheuristic based Query Optimization (DLCLS-MQO) model for Multi-document summarization. The DLCLS-MQO model allows to offer a query in Tamil, summarize several English documents, and lastly translate the summary into Tamil. The DLCLS-MQO model encompasses four stages of operation such as multilingual search, query optimization, automatic sematic lexicon builder, and document summarization. Firstly, bidirectional long short-term memory (BiLSTM) model is applied to perform multilingual searching process. Followed by, sunflower optimization (SFO) algorithm based query optimization process is carried out. Moreover, global vectors (GloVe) method is used for the construction of domain oriented sentiment lexicons. Finally, extreme gradient boosting (XGBoost) model is applied for the CLMDS. A detailed simulation analysis takes place to highlight the betterment of the DLCLS-MQO model. The resultant experimental values portrayed the superior performance of the DLCLS-MQO model over the compared methods. 相似文献

13.

面向冗余度控制的中文多文档自动文摘

王红玲周国栋朱巧明《中文信息学报》2012,26(2):92-97

多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。相似文献

14.

基于主题概念抽取的多文档文摘方法 总被引：3，自引：2，他引：1

宋宣辰刘贵全《计算机工程》2010,36(4):190-192

提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传统的词形统计,能更准确地提取文档中的重要信息。DUC2005的评测结果表明,该方法比传统方法能获得更好的效果。相似文献

15.

基于维基百科的多文档自动摘要系统研究

刘茂福余博胡慧君《微型机与应用》2011,30(16):89-91,94

设计并实现了一个基于维基百科的抽取式多文档自动摘要系统。使用ROUGE评测工具对使用维基百科前后的摘要进行对比实验。实验结果表明,维基百科能较大程度地提高多文档摘要的质量。相似文献

16.

一种基于局部—全局主题关系的演化式摘要系统

吴仁守刘凯王红玲《中文信息学报》2018,32(9):75-83

带有时间标志的演化式摘要是近年来提出的自然语言处理任务,其本质是多文档自动文摘,它的研究对象是互联网上连续报道的热点新闻文档。针对互联网新闻事件报道的动态演化、动态关联和信息重复等特点,该文提出了一种基于局部—全局主题关系的演化式摘要方法,该方法将新闻事件划分为多个不同的子主题,在考虑时间演化的基础上同时考虑子主题之间的主题演化,最后将新闻标题作为摘要输出。实验结果表明,该方法是有效的,并且在以新闻标题作为输入输出时,和当前主流的多文档摘要和演化摘要方法相比,在Rouge评价指标上有显著提高。相似文献

17.

基于评论质量的多文档文本情感摘要

林莉媛王中卿李寿山周国栋《中文信息学报》2015,29(4):33-39

文本情感摘要任务旨在对带有情感的文本数据进行浓缩、提炼进而产生文本所表达的关于情感意见的摘要,用以帮助用户更好地阅读、理解情感文本的内容。该文主要研究多文档的文本情感摘要问题,重点针对网络上存在的同一个产品的多个评论进行摘要抽取。在情感文本中,情感相关性是一个重要的特点,该文将充分考虑情感信息对文本情感摘要的重要影响。同时,对于评论语料,质量高的评论或者说可信度高的评论可以帮助用户更好的了解评论中所评价的对象。因此,该文将充分考虑评论质量对文本情感摘要的影响。并且为了进行关于文本情感摘要的研究,该文收集并标注了一个基于产品评论的英文多文档文本情感摘要语料库。实验证明,情感信息和评论质量能够帮助多文档文本情感摘要,提高摘要效果。相似文献

18.

多文档文摘中句子优化选择方法研究 总被引：2，自引：0，他引：2

秦兵刘挺陈尚林李生《计算机研究与发展》2006,43(6):1129-1134

在多文档文摘子主题划分的基础上,提出了一种在子主题之间对文摘句优化选择的方法．首先在句子相似度计算的基础上,形成多文档集合的子主题,通过对各子主题打分,确定子主题的抽取顺序．以文摘中有效词的覆盖率作为优化指标,在各个子主题中选择文摘句．从减少子主题之间及子主题内部的信息的冗余性两个角度选择文摘句,使文摘的信息覆盖率得到很大提高．实验表明,生成的文摘是令人满意的．相似文献