首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 76 毫秒
1.
中文网页自动分类现状的研究   总被引:1,自引:0,他引:1  
本文重点阐述中文网页自动分类关键技术的现状,介绍分析了两个中文网页自动分类系统。并在文章最后对未来研究提出建议。  相似文献   

2.
本文主要研究了树匹配算法在网页分类中的应用。在详细地介绍树匹配算法后。通过实验证明了该方法的有效性。  相似文献   

3.
该文介绍中文网页自动分类的研究状况;分析常用的特征提取方法并比较其在中文网页分类应用中的优劣,总结经典分类方法;简述分类评价指标;讨论目前分类系统。  相似文献   

4.
周序生  李爽 《计算机仿真》2011,28(10):121-124,252
研究网页自动分类是为快速找到用户所需网页.由于网络中网页数量相当大,而且网络是一种半结构化、海量、高维等文本,传统文本分类方法无法进行降维和消除冗余信息,易出现维数灾问题,网页分类准确率低,用户很难找到自己所需网页.为了提高网页分类准确率,提出基于主成分支持向量机的网页自动分类方法.首先对网页数据进行预处理,提取网页特...  相似文献   

5.
研究人员对网页分类进行大量富有成效的研究工作,截至目前与网页分类相关的研究主要集中于如何选择合适的分类特征、如何设计高效的分类算法这两个方面。从上述两个角度对当前网页分类技术的研究现状进行归纳和综述,以便后续研究人员能更好、更准确地把握网页分类的研究动态。  相似文献   

6.
吕英杰  叶强  李一军 《计算机工程》2007,33(15):178-180
互联网的发展使网页分类技术成为了研究热点,针对传统的基于统计的分类技术只能提供精确分类的情况,该文运用模糊综合评判理论进行文本分类,根据自然语言的复杂性和理解的不确定性,使分类后的网页以一定的概率分属于各个类别,真实地反映了网页信息。实践表明,用户可以根据所得概率进行灵活处理,以满足各种实际需要。  相似文献   

7.
中文网页自动分类研究   总被引:2,自引:0,他引:2       下载免费PDF全文
本文以实践经验为基础,对网页的源程序公共结构进行了分析,并充分考虑到中文网页的文字特点,给出了一种中文网页的分类方法与实现手段,结果表明该方法行之有效。  相似文献   

8.
本文提出了基于未标记的中文网页的增量式Bayes自动分类算法,实验结果表明,该算法是可行的和有效的。  相似文献   

9.
极限学习机ELM不同于传统的神经网络学习算法(如BP算法),是一种高效的单隐层前馈神经网络(SLFNs)学习算法。将极限学习机引入到中文网页分类任务中。对中文网页进行预处理,提取其特性信息,从而形成网页特征树,产生定长编码作为极限学习机的输入数据。实验结果表明该方法能够有效地分类网页。  相似文献   

10.
一个网页自动分类系统的设计   总被引:2,自引:0,他引:2  
本文介绍了设计的一个网页自动分类系统。介绍了预处理 ,批量训练 ,特征选择 ,在线测试和重归档等模块的设计过程。系统采用有指导的学习方法 ,选取 Naive Bayes作分类模型和信息增益作为特征提取方法。测试结果表明 ,系统获得了较好的精度  相似文献   

11.
遗传算法和神经网络在白细胞自动识别中的应用   总被引:1,自引:1,他引:0  
该文讨论并建立了一真彩色白细胞显微图像微机自动识别系统。针对传统组合优化方法用于特征选择的种种缺陷,提出了基于遗传算法的特征选择策略。根据细胞特征,笔者对传统的遗传算法做了相应的改进。最后运用选择特征子集来训练BP神经网络作为分类器。结果证明该方法对于分类系统的性能优化有明显效果。  相似文献   

12.
基于潜在语义标引的WEB文档自动分类   总被引:7,自引:1,他引:6  
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。  相似文献   

13.
张振  许少华 《软件》2020,(2):102-107
针对多通道非线性时变信号分类问题,提出一种基于稀疏自编码器的深度小波过程神经网络(SAE-DWPNN)。通过构建一种多输入/多输出的小波过程神经网络(WPNN),实现对时变信号的多尺度分解和对过程分布特征的初步提取;通过在WPNN隐层之后叠加一个SAE深度网络,对所提取的信号特征进行高层次的综合和表示,并基于softmax分类器实现对时变信号的分类。SAE-DWPNN将现有过程神经网络扩展为深度结构,同时将深度SAE网络在信息处理机制上扩展到时间域,扩展了两类模型的信息处理能力。该网络可提取多通道时序信号的分布特征及其结构特征,并保持样本特征的多样性,提高了对信号时频特性和结构特征的分析能力。文中分析了SAE-DWPNN的性质,给出了综合训练算法。以基于12导联ECG信号的7种心血管疾病分类诊断为例,实验结果验证了模型和算法的有效性。  相似文献   

14.
基于扩展角分类神经网络的文档分类方法   总被引:10,自引:0,他引:10  
CC4神经网络是一种三层前馈网络的新型角分类(corner classification)训练算法,原用于元搜索引擎Anvish的文档分类.当各文档之间的规模接近时,CC4神经网络有较好的分类效果.然而当文档之间规模差别较大时,其分类性能较差.针对这一问题,本文意图扩展原始CC4神经网络,达到对文档有效分类的效果.为此,提出了一种基于MDS-NN的数据索引方法,将每一文档映射至k维空间数据点,并尽可能多地保持原始文档之间的距离信息.其次,通过将索引信息变换为CC4神经网络接受的0,1序列,实现对CC4神经网络的扩展,使其能够接受索引信息作为输入.实验结果表明对相互之间规模差别较大的文档,扩展CC4神经网络的性能优于原始CC4神经网络的性能.同时,扩展CC4神经网络的分类精度与文档索引方法有密切关系.  相似文献   

15.
基于改进神经网络的WEB数据挖掘研究   总被引:2,自引:1,他引:1  
人工神经网络是在现代神经生物学研究成果的基础上发展起来的一种模拟人脑信息处理机制的网络系统,它不但具有处理数值数据的一般计算能力,而且还具有处理知识的思维、学习、记忆能力.基于神经网络的数据挖掘过程由数据准备、规则提取和规则评估三个阶段组成.研究了分解型规则抽取算法,在分析了分解型算法后,利用关联法对输入输出神经元进行关联计算,按关联度排完序之后,用神经网络进行结点选择,可以大大减少神经网络的输入结点个数数据集中数据的验证,表明了方法的有效性.  相似文献   

16.
武妍 《计算机工程》2005,31(11):10-12
为了提高前向神经网络的分类能力,该文将多级神经元扩展使用到多层感知器的输出层和隐含层中,并提出了量子神经网络的学习算法。通过一个实际的分类问题实验验证了该方法的有效性。实验表明,无论输出层或隐含采用多级神经元,都可以带来分类能力的提高。而当输出层采用多级神经元时,还可以导致连接的减少和训练速度的加快。  相似文献   

17.
针对网页分类中关联分类方法存在的如下两点不足:(1)仅把网页当成纯文本处理,忽略了网页的标签信息,(2)仅用网页中的特征词作为关联规则的项,没有考虑特征词的权重,或仅以词频来量化权重,忽略了特征词位置特征的影响,提出了基于特征词复合权重的关联网页分类方法。该方法利用网页标签信息所体现的位置特征计算特征词的复合权重,并以此权重为基础建立分类规则,对网页进行分类。实验结果表明,该方法取得了比传统的关联分类方法更好的效果。  相似文献   

18.
神经网络算法在CRM中的应用   总被引:1,自引:0,他引:1  
在探讨CRM的基础上引入神经网络的数据挖掘方法,详细阐述了该技术在客户关系管理上的重要意义和主要的实现方法和过程.随着市场竞争的不断升级,以先进的客户关系管理办法来满足客户要求,提高客户满意度和忠诚度,神经网络方法可以更好的满足CRM系统的要求.该技术的深入应用还要求我们在市场环境中不断观察详细的记录及其属性来对神经网络工具及模型做出慎重选择.  相似文献   

19.
公路汽车动态称重信号由于受外界各种干扰因素的影响,数据处理较为复杂。针对汽车动态称重系统中数据处理的复杂性,提出了利用神经网络算法对动态称重信号中影响测量精度的主要因素进行数据融合,实现消除外界干扰和非线性校正。实验结果表明,神经网络算法对动态称重信号的数据融合可行有效,其精度满足ASTMWIM系统分类(E1318-94标准)的III类要求。  相似文献   

20.
本文提出了基于改进的模糊逻辑神经元网络算法的FCM算法,在随机蛤出的初始聚类中心的试验中具有很好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号