首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于模糊软集合理论的文本分类方法   总被引:3,自引:0,他引:3  
为提高文本分类精度,提出一种基于模糊软集合理论的文本分类方法。该方法把文本训练集表示成模糊软集合表格形式,通过约简、构造软集合对照表方法找出待分类文本所属类别,并针对文本特征提取过程中由于相近特征而导致分类精度下降问题给出一种基于正则化互信息特征选择算法,有效地解决了上述问题。与传统的KNN和SVM分类算法相比,模糊软集合方法在文本分类的精度和准度上都有所提高。  相似文献   

2.
为提高文本分类的准确性,本文提出了一种基于量子PSO和RBF神经网络的新的文本分类方法.首先建立描述样本类别的关键词集合,并采用模糊向量空间模型建立每类样本的特征向量,然后采用RBF神经网络实施文本自动分类,采用改进的量子PSO优化RBF神经网络的参数,以提高其逼近能力.选取中国期刊网的部分文献作为实验数据,实验结果说明本文所提出方法的分类精准度与其他同类方法相比有明显的提高.  相似文献   

3.
基于模糊模型相似测量的字符无监督分类法   总被引:2,自引:0,他引:2  
该文提出一种基于模糊模型相似测量的文本分析系统的字符预分类方法 ,用于对字符的无监督分类 ,以提高整个字符识别系统的速度、正确性和鲁棒性 .作者在字符印刷结构归类的基础上 ,采用模板匹配方法将各类字符分别转换成基于一非线性加权相似函数的模糊样板集合 .模糊字符的无监督分类是字符匹配的一种自然范例并发展了加权模糊相似测量的研究 .该文讨论了该模糊模型的特性、模糊样板匹配的规则 ,并用于加快字符分类处理 ,经过字符分类 ,在字符识别时由于只需针对较小的模糊样板集合而变得容易和快速  相似文献   

4.
模糊聚类在中文文本分类中的应用研究   总被引:4,自引:0,他引:4  
将基于等价关系的模糊聚类技术应用于中文文本分类,提出了基于模糊聚类的中文文本分类算法ATCFC。该算法利用基于二级字索引的正向最大匹配算法对文本分词,建立模糊特征向量空间模型,使用贴近度法刻划文本间的相似度。利用算法ATCFC对文本集合进行动态聚类实验,实验结果表明算法ATCFC对于中文文本分类是可行、有效的。  相似文献   

5.
基于模糊综合评判的文本自动分类算法   总被引:2,自引:0,他引:2  
文本分类在文献检索、信息过滤、数据组织、信息管理等领域中应用十分广泛。本文给出了一种基于模糊综合评判的文本自动分类算法,该算法以文本分词技术作为基础,以类间词频方差作为评判因素的选择依据,通过预定义类中关键词的词频均值高低构造评判矩阵,以最大隶属度作为评判原则。文中详细描述了算法的理论依据、评判因数的选择、评判矩阵的构造及分类算法。实验结果表明本文提出的分类算法具有相当的应用价值。  相似文献   

6.
基于模糊模型相似测的字符无监督分类法   总被引:1,自引:0,他引:1  
该文提出一种基模糊模型相似测量的文本分析系统的字符预分类方法,用于对字符的无监督分类,以提高整个字符识别系统的速度,正确性和鲁棒性,作者在字符印刷结构归类的基础上,采用模板匹配方法将各类字符分别转换成基于一非线性加权相似函数的模糊样板集合,模糊字符的无监督分类是字符匹配的一种自然范例并发展了加权模糊相似测量的研究,该文讨论了该模糊模型的特性,模糊样板匹配的规则,并用于加快字符分类处理,经过字符分类,在字符识别时由于只需针对较小的模糊样板集合变得容易和快速。  相似文献   

7.
提出一种基于免疫原理的模糊分类系统的设计方法.该算法基于生物免疫系统中的克隆选择和超变异原理,通过抗体种群的演化来优化模糊分类规则集合,可以同时确定隶属度函数形状、规则集合以及规则的数目.针对典型数据集的仿真实验表明了本文方法的有效性.  相似文献   

8.
提出了一种基于模糊形式概念分析的文本分类模型,通过概念化文本到一个更加抽象的概念形式,以概念而非文本作为训练样本,最终结合近邻分类算法实现文本分类决策。实验结果表明该算法有很好的性能。  相似文献   

9.
在传统的文本分类中,文本向量空间矩阵存在“维数灾难”和极度稀疏等问题,而提取与类别最相关的关键词作为文本分类的特征有助于解决以上两个问题。针对以上结论进行研究,提出了一种基于关键词相似度的短文本分类框架。该框架首先通过大量语料训练得到word2vec词向量模型;然后通过TextRank获得每一类文本的关键词,在关键词集合中进行去重操作作为特征集合。对于任意特征,通过词向量模型计算短文本中每个词与该特征的相似度,选择最大相似度作为该特征的权重。最后选择K近邻(KNN)和支持向量机(SVM)作为分类器训练算法。实验基于中文新闻标题数据集,与传统的短文本分类方法相比,分类效果约平均提升了6%,从而验证了该框架的有效性。  相似文献   

10.
罗军  况夯 《计算机应用》2008,28(9):2386-2388
提出一种新颖的基于Boosting模糊分类的文本分类方法。首先采用潜在语义索引(LSI)对文本特征进行选择;然后提出Boosting算法集成模糊分类器学习,在每轮迭代训练过程中,算法通过调整训练样本的分布,利用遗传算法产生分类规则。减少分类规则能够正确分类样本的权值,使得新产生的分类规则重点考虑难于分类的样本。实验结果表明,该文本分类算法具有良好分类的性能。  相似文献   

11.
传统的机器学习方法是在训练数据和测试数据分布一致的前提下进行的。然而,在一些现实世界中的应用,训练数据和测试数据来自不同的领域。在不考虑数据分布的情况下,传统的机器学习算法可能会失效,针对这一问题,提出一种基于模糊C均值(FCM)的文本迁移学习算法。首先,通过简单分类器对测试样本分类,接着,利用自然邻算法构建样本初始模糊隶属度;然后,利用FCM算法通过迭代更新样本模糊隶属度,修正样本标签;最后,对样本孤立点进行处理,得到最终分类结果。实验结果表明,该算法具有较好的正确率,有效的解决了在训练数据和测试数据分布不一致的情况下的文本分类问题。  相似文献   

12.
模糊kNN在文本分类中的应用研究   总被引:1,自引:0,他引:1  
自动文本分类是根据已经分配好类标签的训练文档集,来对新文档分配类标签.针对模糊kNN算法用于文本分类的性能进行了一系列的实验研究与分析.在中英文两个不同的语料集上,采用四种著名的文本特征选择方法进行特征选择,对改进的模糊kNN方法与经典kNN及目前广泛使用的基于相似度加权的kNN方法进行实验比较.结果表明,在不同的特征选择方法下,该算法均能削弱训练样本分布的不均匀性对分类性能的影响,提高分类精度,并且在一定程度上降低对k值的敏感性.  相似文献   

13.
In this work, we investigate the application of modeling alternatives regarding fuzzy Markov chain-based, multitemporal, cascade classification of remote sensing data. From a theoretical viewpoint, alternative designs for the fuzzy Markov chain-based model are formally presented. From a pragmatic perspective, experimental results are discussed and analyzed, providing a deeper understanding of the virtues and odds of multitemporal remote sensing data classification based on fuzzy Markov chains. We claim that the key components of the fuzzy Markov chain-based, multitemporal classification model with respect to its alternative designs are the t-norm and s-norm operators, and the fuzzy aggregation function. The main objective of this paper is to investigate how a particular design may affect the classification performance. In addition, this paper aims at assessing the impact of the monotemporal classifiers’ accuracies on the quality of the multitemporal classification outcome, according to the selected design alternatives. In conclusion, this paper presents design guidelines for both the developer of image analysis systems and the designer of classification methods based on fuzzy Markov chains.  相似文献   

14.
Classification is one of the most popular data mining techniques applied to many scientific and industrial problems. The efficiency of a classification model is evaluated by two parameters, namely the accuracy and the interpretability of the model. While most of the existing methods claim their accurate superiority over others, their models are usually complex and hardly understandable for the users. In this paper, we propose a novel classification model that is based on easily interpretable fuzzy association rules and fulfils both efficiency criteria. Since the accuracy of a classification model can be largely affected by the partitioning of numerical attributes, this paper discusses several fuzzy and crisp partitioning techniques. The proposed classification method is compared to 15 previously published association rule-based classifiers by testing them on five benchmark data sets. The results show that the fuzzy association rule-based classifier presented in this paper, offers a compact, understandable and accurate classification model.  相似文献   

15.
提出了一种基于模糊积分的模糊分类器集成的方法,该方法能在模糊分类器生成过程中,进一步减少主观因素的参与成份,使分类模器具有更好的稳定性和更高的分类识别率。给出了基于隶属度矩阵的模糊积分密度确定方法,介绍了基于模糊积分的分类器集成算法。用权威的数据集作为实验数据集,将提出方法与已有的分类器集成方法进行实验比较,评测了所提出方法的有效性。  相似文献   

16.
In this paper, we have presented two new multivariate fuzzy time series forecasting methods. These methods assume m-factors with one main factor of interest. Stochastic fuzzy dependence of order k is assumed to define general methods of multivariate fuzzy time series forecasting and control. These new methods are applied for forecasting total number of car road accidents casualties in Belgium using four secondary factors. Practically, in most of the situations, actuaries are interested in analysis of the patterns of casualties in road accidents. Such type of analysis supports in deciding approximate risk classification and forecasting for each area of a city. This directly affects the underwriting process and adjustment of insurance premium, based on risk intensity for each area. National Institute of Statistics, Belgium provides risk intensity based classification of each city. Thus, this work provides support in deciding the appropriate risk associated with an insured in a particular area.  相似文献   

17.
This paper proposes a classification method that is based on easily interpretable fuzzy rules and fully capitalizes on the two key technologies, namely pruning the outliers in the training data by SVMs (support vector machines), i.e., eliminating the influence of outliers on the learning process; finding a fuzzy set with sound linguistic interpretation to describe each class based on AFS (axiomatic fuzzy set) theory. Compared with other fuzzy rule-based methods, the proposed models are usually more compact and easily understandable for the users since each class is described by much fewer rules. The proposed method also comes with two other advantages, namely, each rule obtained from the proposed algorithm is simply a conjunction of some linguistic terms, there are no parameters that are required to be tuned. The proposed classification method is compared with the previously published fuzzy rule-based classifiers by testing them on 16 UCI data sets. The results show that the fuzzy rule-based classifier presented in this paper, offers a compact, understandable and accurate classification scheme. A balance is achieved between the interpretability and the accuracy.  相似文献   

18.
李锋  齐晓慧  李洪梁 《计算机仿真》2007,24(12):138-140,169
控制规则在模糊控制器中有着十分重要的地位,模糊控制规则的优化较多地被人们所重视,利用权重因子对模糊控制规则进行自动调整,是目前比较多的做法.但目前多种做法鱼龙混杂,人们有时不能正确选择所需方法.文章对基于权重因子的模糊控制规则方法进行了归纳,并基于MATLAB/SIMULINK环境,针对某一实际系统采用四种方法进行仿真、分析、比较,结果对四种方法的优缺点作出了比较,四种方法都不能适应每个模糊控制器设计的要求,有各自的适应范围,得出的结论对模糊控制器的设计有参考意义.  相似文献   

19.
在文本分类中获得有类别标记训练样本的代价是很高昂的,本文针对这个问题对传统的模糊聚类方法进行改进,提出模糊划分聚类方法FPCM,将聚类的无监督性和样本的先验知识结合起来,通过相似度度量聚类相关文本,取得比较客观的簇和少量标记文本,为监督学习找到分类依据,并结合朴素贝叶斯增量学习方式进行分类器的学习.本文进一步用估计分类误差损失的方法平衡选取候选样本,提高了分类准确率,实现了应用范围更加广泛的无标记文本分类学习模型.  相似文献   

20.
模糊积分理论可有效处理分类决策不确定性问题。当前模糊密度的确定方法未考虑各个分类器识别结果的可区分程度及各分类器对识别结果的支持程度,会丢失融合识别的相关信息。文中提出基于可分度和支持度的自适应模糊密度赋值融合识别算法。该算法根据各分类器对待识别样本的识别结果的可区分程度和支持程度对分类器的融合模糊密度进行自适应赋值,从而有效实现多分类器融合识别。将该算法应用于自然交互环境下的人脸表情识别和Cohn-Kanade表情识别。实验结果表明,该算法能有效提高总体表情识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号