首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 499 毫秒
1.
基于BP神经网络指纹识别的算法   总被引:2,自引:0,他引:2  
通过对多种指纹分类算法的研究和分析,提出了一种基于BP神经网络对指纹模板进行分类的新算法.首先在对指纹图象进行预处理后建立起指纹模板库,然后采用时间模拟退火函数进行学习因子修正的方法来减少BP算法迭代次数,以提高收敛速度及跳出局部最小.仿真证明:该算法与传统的指纹识别算法相比,分类速度明显高于传统的固定步长的BP算法.  相似文献   

2.
传统基于目标函数法的模糊聚类算法是一种迭代的“爬山”算法,容易陷入局部最优解.提出了基于遗传算法与禁忌搜索结合的模糊聚类算法,综合运用遗传算法的多出发点和禁忌搜索的记忆性来改善聚类的效果,并通过迭代的遗传禁忌搜索算法产生最优聚类中心,实验中分别通过人工数据和标准数据测试验证了该算法的有效性.  相似文献   

3.
提出一种新的多类标分类算法——多类标聚类树算法.该算法利用文本属性特征及类标信息,通过迭代调用"基于类标信息的聚类算法",将两空间分类树的生长不断划分,直至空间足够简单为止.实验证明,提出的多类标聚类树算法总体上优于其他对比算法,其分类能力强于排序能力.  相似文献   

4.
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度.  相似文献   

5.
一种改进的SVM算法及其在证券领域中的应用   总被引:2,自引:0,他引:2  
根据传统的SVM算法原理,提出一种新的基于连续的和过程化的SVM算法,该算法在分类结果上不再局限于两类分类问题的离散情况,是一种支持向量的动态选择算法.将该算法应用于证券领域中,结果表明该算法是有效且正确的.  相似文献   

6.
基于核方法的分类型属性数据集模糊聚类算法   总被引:1,自引:0,他引:1  
针对分类型属性数据的聚类问题.将核方法的思想推广到快速、高效率的模糊c-均值算法,构造了基于核函数的模糊核c-均值聚类算法.该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息,并且避免了模糊k-modes算法中每次迭代均要直接计算类中心的缺点,提高了聚类的精确度和稳定性.同时该算法对模式(类中心)的初始值选择不敏感.时实际的线性可分的和线性不可分的分类型属性数据集的仿真实验证明了该算法的有效性.  相似文献   

7.
边缘信息指导下的半模糊聚类图像分割方法   总被引:2,自引:0,他引:2  
提出了一种利用边缘信息的半模糊均值聚类的图像分割算法,它先用边缘检测和区域生长算法对图像进行一次预分割,确定聚类的初始参数,然后在这个基础上对“边缘”部分的点采用模糊聚类、非“边缘”部分使用分明聚类,避免了模糊聚类时初始参数设定的盲目性,减少了迭代时的计算量,提高了迭代收敛速度.除灰度特征外,聚类时还利用了点到类的距离特征,较好地保持了分割图像的连续性.直接观察对比多幅图像的分割实验结果可以明显地发现,该算法较常用的Cksu方法、二维熵阈值分割方法以及FCM方法的分割结果更准确.就Lena图像而言,该算法的收敛速度也比一般的FCM快了将近一倍.  相似文献   

8.
聚类是一种高效的数据分析方法,经典的K-means算法只适用于类簇为凸形的数据集,谱聚类算法虽然避免了K-means的一些缺点,但相似度中的参数设置问题以及较高的计算、存储复杂度对聚类有所限制.基于局部和全局信息的正则化迭代聚类,先取部分数据作为一个整体聚类,然后逐渐加入少量数据进行迭代求解.该方法继承传统谱聚类的优点,充分利用局部正则化和全局正则化信息,通过迭代方式求解使较大规模数据聚类成为可能.通过实验对比结果显示,该算法有良好的聚类效果.  相似文献   

9.
提出一种应用于科技文献分类的文本特征选择方法.该方法运用了聚类与关联规则的思想,对文本特征进行逐层选择.同时为提高K-means算法的聚类性能,对K-means算法做了相应的改进,通过为算法的终止条件设定标准值来减少算法迭代次数,减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰.采用KNN分类器进行对比实验,实验结果表明,该特征选择方法在科技文献分类方面有较高的准确率.  相似文献   

10.
设计了一种用于调整不一致性判断矩阵的加权迭代算法,该方法充分考虑了判断矩阵的原始信息,且在满足一致性要求的前提下尽可能多的保留原始信息.实验表明:该算法是有效的、可行的.  相似文献   

11.
流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用.以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少.针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题.实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别.  相似文献   

12.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

13.
提出一种新的自适应层次分类(HAC)模型,通过本体对特征集进行语义扩展,并以增量形式在层次模型中构建特征上下文和类别相关上下文,以辅助实现一种高效、无阻滞的层次分类. 实验结果证明,模型HAC具有相对更好的分类性能,而且分类速度更快,有利于实现实时在线的文档分类.  相似文献   

14.
为了提高党政机关公文办理的自动化、科学化程度,尝试将业已成熟的汉语多类文本分类技术应用于机关公文办理系统中,并加入专家评估和反馈模块,使该系统具备"渐进式学习"的能力,将公文办理的经验积累在数据库中,不断提高输出结果的准确度.经过实验证实了文本分类技术在党政机关公文办理中的应用价值.  相似文献   

15.
Optimal clustering for the web documents is known to complicated combinatorial Optimization problem and it is hard to develop a generally applicable oplimal algorithm. An accelerated simuIated arlneaIing aIgorithm is developed for automatic web document classification. The web document classification problem is addressed as the problem of best describing a match between a web query and a hypothesized web object. The normalized term frequency and inverse document frequency coetficient is used as a measure of the match. Test beds are generated on - line during the search by transforming model web sites. As a result,web sites can be clustered optimally in terms of keyword vectors of corresponding web documents.  相似文献   

16.
Web文档自动分类是Web挖掘中的重要研究内容。文档向量空间模型(VSM)是实现文档自动分类的基础,但如何排除冗余属性并降低向量空间的维数是一个难点。文中运用粗集理论对由样本文档集合构成的信息系统进行数据泛化,并求取文档的最优规约属性集,大大降低了文档的特征空间的维数,减少了冗余属性对文档分类的干扰,提高了分类效率。运用Fuzzy ARTMAP(adaptive resonance theory mapping)神经网络,利用其自适应分类和增量学习的优良特性,实现了对Web文档的在线自适应分类。  相似文献   

17.
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作. 但网页可以划分成不同的块,对分类 而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.  相似文献   

18.
文本分类中的类别信息特征选择方法   总被引:3,自引:0,他引:3  
随着网上电子文档的急剧增长,文本分类技术在信息检索中的应用变得日益重要.特征维数增加会使样本统计特性的评估变得更加困难,从而降低分类嚣的泛化能力,出现“过学习”的现象.因此,文档特征的选择和提取是文本分类的必要前提.提出一种基于类别信息的特征选择方法,谊方法在尽量保留文档信息的同时,考虑了文档的类别信息.实验表明,这种方法的分类性能比较好,特别是在微平均指标上,与OCFS以及卡方统计量相比有较大幅度的提高.  相似文献   

19.
信息检索中通过网页链接信息提取文档内部关系进行搜索结果重排可以提升检索系统的性能。通过Markov网络来展现文档内部关系,该网络更直观地解释了文档间的语义相关性,利用这种文档内部语义关系计算文档重要性对检索结果进行重排。根据文档分布特征阐述了Markov文档网络的构造算法,讨论了Top-k及其相关文档的重要性评分算法,修正初始检索的文档评分。通过这种方式,既保持了文档图的查询相关性,又丰富了文档内部关系,扩大了重排序范围。实验表明,在多个标准文档集上基于Markov网络的结果重排技术对检索性能有较大的稳定提升。  相似文献   

20.
近年来由于现代数字电子技术的飞速发展,各类合同、文档、传单的真实性有待于考证;而且也迫切需要准确掌握各类打印文档的来源。针对打印文档的真伪性问题,提出在对单个字符图像进行灰度级压缩和二值去噪的基础上,利用统计法中的灰度共生矩阵来提取字符图像的特征值;并以这些特征值建立相应的样本数据库,借助神经网络工具箱对特征值进行分类和识别。试验对试验条件的控制较为严格,样本采集为5种全新打印机打印的文档各取5张,字符图像的提取采用同一扫描仪,并且控制工作时间和打印文档的数目一致。实验结果表明,观察提取的特征数据发现,不同打印文档的特征数据之间有明显差别,而且特征数据的正确性和可靠性明显提高。试验中对5种打印机全部正确识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号