首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于语义的单文档自动摘要算法   总被引:1,自引:0,他引:1  
章芝青 《计算机应用》2010,30(6):1673-1675
单文档自动摘要的目的是在原始的文本中通过摘取、提炼主要信息,提供一篇简洁全面的摘要。自动摘要的主流方法是通过统计和机器学习的技术从文本中直接提取出句子,而单文档由于篇章有限,统计的方法无效。针对此问题,提出了基于语义的单文本自动摘要方法。该方法首先将文档划分为句子,然后计算每一对句子的语义相似度,通过运用改进型K-Medoids聚类算法将相似的句子归类,在每一类中选出最具代表性的句子,最后将句子组成文档摘要。实验结果表明,通过融合语义信息,该方法提高了摘要的质量。  相似文献   

2.
给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web了分词算法,提出了基于句子抽取的Web文摘生成算法.算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和超连接属性.根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要.最后实验分析表明效果较好.  相似文献   

3.
仇丽青  李伟明 《计算机工程》2010,36(21):265-266,269
针对现有的多文档自动摘要生成方法中存在的问题,提出一种多文档自动摘要生成方法,该方法能够最大限度地减小摘要内容的冗余。选取权重最大的句子作为摘要句,把已选句子中包含的词汇的权重设置为接近0的常数,当下次选择摘要句时,可以避免再次选取包含这些词汇的句子。使用自动摘要评测方法ROUGE对该方法进行评测。实验结果表明,根据该方法抽取的机器摘要能够获得较高的 成绩。  相似文献   

4.
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。  相似文献   

5.
主题模型LDA的多文档自动文摘   总被引:3,自引:0,他引:3  
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA (latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.  相似文献   

6.
随着信息快速增长,如何从大量文档中提取摘要信息成为自然语言处理一个重要的研究方向。文章提出了一种不依赖于任何训练集和自然语言本身信息的自动摘要方法,该方法利用改进后的PageRank公式和HITS公式对文档所有句子打分排序,选取得分高的句子作为摘要。实验证明,该方法简单易行,具有高效性,良好的效果以及扩展性。  相似文献   

7.
张璐  曹杰  蒲朝仪  伍之昂 《计算机应用》2017,37(7):2100-2105
对于节录式自动摘要需要从文档中提取一定数量的重要句子,以生成涵盖原文主旨的短文的问题,提出一种基于词句协同排序的单文档自动摘要算法,将词句关系融入以图排序为基础的句子权重计算过程中。首先给出了算法中词句协同计算的框架;然后转化为简洁的矩阵表示形式,并从理论上证明了收敛性;最后进一步通过去冗余方法提高自动摘要的质量。真实数据集上的实验表明,基于词句协同排序的自动摘要算法较经典的TextRank算法在Rouge指标上提升13%~30%,能够有效提高摘要的生成质量。  相似文献   

8.
自动文本摘要是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的摘要方法。同时给出了较为客观和有效的摘要评价方法。实验表明了该方法的有效性。  相似文献   

9.
文章旨在研究政府部门的信息系统应急预案起动机制,并得出经济可行的解决方案。文章在参与的区县一级政府各机关众多信息系统现场测评工作中,发现大多数系统在应急预案启动方面滞后,因此文章由参加的所有测评项目中选取具有代表性的150个信息系统为研究对象,通过对应急预案的分类、响应及现实需求进行分析,设计了一套信息系统应急预案自动启动管理系统。  相似文献   

10.
多文档自动摘要技术可以向用户提供一个简洁、全面的摘要信息,因此研究多文档自动摘要技术具有很重要的意义.本文提出了一种上下文敏感的基于词频统计的多文档自动摘要生成方案.该方案利用高频词的重要作用统计高频词信息,同时具备上下文敏感的特性.它具有简单易行,运行速度快,效果好等特点.实验结果证明,取得了很好的ROUGE成绩.  相似文献   

11.
The area of automatic groups has been one in which significant advances have been made in recent years. While it is clear that the definition of an automatic group can easily be extended to that of an automatic semigroup, there does not seem to have been a systematic investigation of such structures. It is the purpose of this paper to make such a study.We show that certain results from the group-theoretic situation hold in this wider context, such as the solvability of the word problem in quadratic time, although others do not, such as finite presentability. There are also situations which arise in the general theory of semigroups which do not occur when considering groups; for example, we show that a semigroup S is automatic if and only if S with a zero adjoined is automatic, and also that S is automatic if and only if S with an identity adjoined is automatic. We use this last result to show that any finitely generated subsemigroup of a free semigroup is automatic.  相似文献   

12.
13.
开发了一种基于图像识别的自动打靶机器人系统.该系统利用OV7670摄像头获取靶面图像,经过图像处理及靶面识别后得到射击成绩.本系统完成了对图像的采集 、识别 、判靶算法的研究,综合运用图像灰度化 、二值化 、阀值分割等图像预处理方法,采用局部特征识别的算法进行靶面检测,应用灰度特征识别光斑区域,以STM32F407单片机进行实时处理 、控制触摸屏显示环数.  相似文献   

14.
针对本项目组的指针式压力表自动检定系统,以采集图像表盘中心点为基准,自动控制可调节支撑架使摄像机光轴线与表盘中心处于同一高度;以表盘外轮廓为基准,使表盘尽量充满整个采集画面.采用单片机对步进电机加减速进行离散控制.实验结果表明,该算法能较快地将摄像头调至预期的位置,对仪表盘能达到良好的采集效果.研究成果算法简单且易于实现,具有较好的推广价值.  相似文献   

15.
针对自动编码模块结构单一,准确率与噪音免疫性能较差的问题,基于自动编码技术设计一种机器人英语语音自动识别方法.通过堆叠多个无监督网络的自动编码,架构出适用于语音自动识别的自编码网络,将音素向量作为英语语音特征提取辅助信息,将全差异因子作为网络隐含变量,进行特征向量补偿;应用一阶FIR(Finite Impulse Response,非递归型滤波器)数字高通滤波器进行预加重处理,随机置零处理输入的语音特征参数,经过逐层训练实现英语语音自动识别.实验结果表明,本文方法对单词、句子都具有一定的有效性,识别准确率较高,且噪声免疫性能较强.  相似文献   

16.
17.
考试自动阅卷系统   总被引:2,自引:0,他引:2  
随着计算机技术的发展,计算机操作技能考试在社会上越来越受到人们的重视.但是,计算机操作技能考试阅卷比较麻烦,如何实现自动化智能阅卷成为研究的热门课题.本文通过软件VB对试卷内容间接的读取、判断完成阅卷评分过程,并且根据考试的结果给出相应的专家诊断意见.  相似文献   

18.
A systematic method for roundtrip engineering of systems, automatic roundtrip engineering (ARE), is presented. It relies on the automatic derivation of inverses for domain transformations. While roundtrip engineering is a well known system engineering method, systematic conditions for its deployment have not yet been formalized, and this is done in the paper. Secondly, ARE is a generic architectural style for different architectural scenarios. To show this, the paper gives a first classification, defining several subclasses of ARE systems: sequenced ARE systems, automatic Model-View-Controller engineering (MVARE), and bidirectional aspect systems (Beavers). Sequenced ARE systems extend the ARE principle to chains of transformations. MVARE systems project a domain into a set of simpler ones, simplifying system understanding. Beaving systems generalize aspect-oriented programming to roundtrip engineering. All ARE classes describe different generic application architectures and have a great potential to simplify the construction of roundtrip engineering tools and applications.  相似文献   

19.
《Computer》1980,13(9):41-56
Advances such as specialized parallel hardware and new algorithms for text searching will improve the effectiveness of information retrieval systems.  相似文献   

20.
An algorithm for the construction of finite models of sets of predicate-calculus sentences is given. The algorithm differs from resolution in its ability to incorporate certain extra sentences (human advice) gracefully. Since the problem attacked by the algorithm is NP-complete, it is hoped that this ability to accept advice will make the algorithm useful more as a tool in the hands of a researcher than as a stand-alone procedure.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号