首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
王潇 《福建电脑》2008,(3):35-35,56
针对现有粗糙集文本分类模型的不足,采用了可变精度粗糙集模型。结果表明,在大多数数据染上该方法具有良好的分类效果。  相似文献   

2.
一种基于粗糙集理论的文本分类方法   总被引:1,自引:0,他引:1  
在网络这个庞大的虚拟图书馆中,占信息比重最大的文本数据却缺乏结构化、组织化的规整性,大大降低了网络文本信息的利用效率,而文本的自动分类技术则能降低网络的查询时间,提高网络搜索质量。文章提出了一种基于粗糙集理论的文本分类方法。  相似文献   

3.
林珣  李志蜀  周勇 《计算机科学》2011,38(11):239-240,263
文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。  相似文献   

4.
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Wdb文本分类方法.采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊租糙集的属性约简算法生成分类规则:最后利用知识库进行文档分类.在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类.通过试验比较,该方法具有较好的分类效果.  相似文献   

5.
《微型机与应用》2015,(21):81-84
在文本分类中,特征空间维数可以达到数万维。使用信息度量的方法,如文档频率、信息增益、互信息等,对特征进行选择后的维数通常还是很大,降低阈值或减小最小特征数可能会降低分类效果。针对这个问题,提出基于粗糙集的二次属性约简。实验表明,该方法在有效降低特征维数的同时保证了分类效果。  相似文献   

6.
文本分类是根据未知文本的内容将其划分到一个或多个预先定义的类别的过程,是许多基于内容的信息管理任务的重要组成部分.文本分类问题的难点是特征空间的高维性,通常采用特征选择作为降维的重要方法.将属性约简和文本分类的特点相结合,提出了一种基于粗糙集的特征选择算法即改进的快速约简算法.实验表明该算法是有效的,不仅可以降低特征空间的维度,而且能够维持高精度.  相似文献   

7.
CBA算法是将关联规则挖掘与分类技术相结合的一种分类算法,在许多领域中得到了广泛应用.针对CBA处理海量数据效率低的缺点,提出了一个改进的CBA算法.该算法将粗糙集理论应用到CBA算法中,对决策表进行属性约简,提高了分类关联规则的生成效率;并应用PEP(pessimistic error pruning)方法对候选规则进行剪裁.实验结果表明,该算法比CBA具有更高的分类效率和准确度.  相似文献   

8.
网络科技资源应用集成环境所汇集到的信息纷繁复杂,使得用户对信息的浏览、检索造成了一定的困难.首先对所有汇集到的信息向量化,然后通过对IF-IDF权重构造函数进行了改良,使其更加适合本项目的实际情况,接着利用粗糙集理论进行属性约简,生成最终的决策表对科技信息进行分类.最终结果证明,提出的分类系统比传统人工分类的效率有较大提高,取得了良好的效果.  相似文献   

9.
为提高中文文本分类的效果,提出了一种基于粗糙集理论的规则匹配方法.在对文本特征的提取过程中,对CHI统计方法进行了适当的改进,并对特征项的权值进行了缩放和离散化.结合区分矩阵实现关于粗糙集理论的属性约简和规则提取,并采用规则预检验的方法对规则匹配的决策参数进行优化,以提高中文文本分类的效果.实验结果表明改进后的规则匹配方法分类准确率更高,同时在训练数据较少的情况下也可以取得不错的效果.  相似文献   

10.
基于粗糙集和BP神经网络的文本分类研究   总被引:2,自引:0,他引:2  
研究文本分类、提高文本检索效率问题,针对文本特征维数过高导致神经网络收敛速度慢、文本分类精度低的难题,结合粗糙集的属性约简和神经网络的文本分类优点,提出了一种粗糙集(RS)结合BP神经网络的文本自动分类算法(RS-BPNN).RS-BPNN首先应用粗糙集理论的属性约简对文本特征预处理,降低向量维数,然后把冗余的属性从决策表中删去,最后利用神经网络进行分类.并在MATLAB环境中进行了仿真实验,仿真结果表明,RS-BPNN方法的识别精度比传统的BP神经网络高4%左右,提高了文本分类的精度和检索效率.  相似文献   

11.
基于粗糙集理论的属性约简算法   总被引:4,自引:1,他引:4  
粗糙集理论是一种新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的.从大量数据发现知识时,属性约简是一个关键问题.在理解和分析基于粗糙集理论的数据挖掘算法基础上,提出了一个基于属性依赖度的属性约简算法.实验结果表明,该算法能更有效地对决策系统进行约简.  相似文献   

12.
树突状细胞算法(DCA)在应用于入侵检测时,需要对网络监测数据进行约简,以降低系统负担,提高检测效率。提出一种结合粗糙集属性约简和DCA的异常入侵检测方法。采用粗糙集属性重要度对数据集进行属性约简,产生DCA输入信号,而后利用DCA算法进行入侵检测。通过KDD CUP99数据集对所提出的改进算法进行验证,结果表明,算法在保证检测率的前提下,显著降低了误报率。算法实现了入侵检测特征的自动提取,显著减少了所需检测的特征数目,加快了算法运行速度,具有良好的综合性能。  相似文献   

13.
基于粗集理论的支持向量机分类方法研究   总被引:2,自引:2,他引:2  
韩虎  任恩恩  李玉龙 《计算机工程与设计》2007,28(11):2640-2641,2645
介绍了粗集理论的基本概念和支持向量机分类的基本原理,提出将粗集理论和支持向量机方法相结合.通过应用粗集理论对数据的预处理,消除决策表中大量的冗余信息和冲突对象,但不丢失任何有用信息.通过这样对数据维数的约简,大大简化了支持向量分类模型的结构,同时也有效地提高了支持向量机的分类效率.通过对一组实验数据的仿真验证了该方法的可行性.  相似文献   

14.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。  相似文献   

15.
针对目前物流行业在资源优化配置以及组织调度等环节中出现的匹配精度低、调用效率差等现实问题,将物流资源分类标准作为切入点,以行业内现有资源分类体系为基础,结合实际样本数据,提出基于粗糙集的物流资源分类方法。首先以粗糙集理论为指导,对物流资源属性进行约简,然后从数据挖掘的角度进行基于属性重要度的资源分类,最终分析得出资源分类规则,以此为物流资源整合提供理论依据。通过实例分析,证明该分类方法的有效性。  相似文献   

16.
粗糙集理论知识库的属性重要度,体现的是去掉某个或某些属性前后的知识库分类变化的程度。对现有粗糙集理论的属性重要度确立方法的不足,充分考虑条件属性对决策的直接和间接的影响,提出一种新的基于粗糙集属性依赖度的属性重要度确定方法。此外,针对原有属性重要度与改进重要度的差别,讨论改进的属性重要度的意义,并证明改进的属性重要度更加可信。最后,利用改进的方法对机械故障属性重要度进行仿真;对比原有属性重要度的数据,改进方法获得的数据不但更符合属性约简结果,并且具有更大区分度,十分有利于决策者快速做出判断。  相似文献   

17.
属性约简是粗糙集合研究的重要内容之一。为了能够有效地获取决策表中属性最小相对约简,提出了一种基于GA-PSO的属性约简算法。该算法以条件属性对决策属性的支持度为基础,求解核属性,把所有的条件属性(除去核属性)加入粒子群算法的初始种群中,并用遗传算法对不满足适应度条件的粒子进行交叉变异操作。实验结果表明,该算法在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够快速有效地获得最小相对属性集。  相似文献   

18.
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和[F1]值都得到了一定的提高。  相似文献   

19.
结合模糊集理论的粗糙集属性约简算法*   总被引:1,自引:0,他引:1  
结合模糊关系的理论,对粗糙集理论的属性约简算法进行研究,提出了一个新的属性约简算法,并给出了一个应用实例.  相似文献   

20.
基于粗糙集约简的多分类器系统构造方法   总被引:1,自引:0,他引:1       下载免费PDF全文
多分类器系统是近年来兴起的一种有效的分类机制,为提高多分类器系统的分类精度,提出了一种基于粗糙集约简构造多分类器系统的机制,并从输入和输出两个角度对如何选择单个分类器进行了探讨。通过对4个UCI数据集进行验证,发现基于输出的选择融合方法得到了最好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号