首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
目前特征选择方法中常用的特征相关性测度可有效评估两个特征之间的相关性,但却将特征孤立看待,没有考虑其它特征对它们相关性的影响。文中在整体考虑特征之间关系的前提下,提出用稀疏表示系数评估特征的相关性,它与现有特征相关性测度的不同之处在于可揭示特征在其它所有特征影响下与目标的相关性,反映特征间的相互影响。为验证稀疏表示系数评估特征相关性的有效性,在典型的高维小样本数据上,比较了Relief F方法及分别以稀疏表示系数、对称不确定性和皮尔森相关系数为相关性测度的特征选择方法选择的特征集的分类能力。实验结果表明文中方法选择的特征集的分类能力高且较稳定。  相似文献   

2.
特征选择方法与算法的研究   总被引:1,自引:0,他引:1  
特征选择的主要思想是通过去除一些包含少量或不相关的信息的特征去选择特征子集。特征选择方法可分为三大类:一是过滤式,二是封装式,三是嵌入式。鉴于目前存在大量的特征选择算法,为了能够适当地决定在特定的情况下使用哪种算法,需要提出可以依赖或判定的标准。文中的主要工作就是综述一些基本特征选择算法,根据文献中已有的理论和实验结果对特征选择方法和算法进行比较分类,然后提出一种可以依赖或判定的标准。  相似文献   

3.
特征选择的主要思想是通过去除一些包含少量或不相关的信息的特征去选择特征子集。特征选择方法可分为三大类:一是过滤式,二是封装式,三是嵌入式。鉴于目前存在大量的特征选择算法,为了能够适当地决定在特定的情况下使用哪种算法,需要提出可以依赖或判定的标准。文中的主要工作就是综述一些基本特征选择算法,根据文献中已有的理论和实验结果对特征选择方法和算法进行比较分类,然后提出一种可以依赖或判定的标准。  相似文献   

4.
基于粒子群的最大相关最小冗余混合式特征选择方法   总被引:2,自引:0,他引:2  
在分析粒子群优化(PSO)算法和简化PSO算法的基础上,提出一种基于PSO的最大相关最小冗余的Filter-Wrapper混合式特征选择方法.Filter模型是基于互信息和特征的相关冗余综合测度,Wrapper模型是基于改进的简化粒子群算法.在PSO搜索过程中,引入相关冗余度量标准来选择特征子集,将Filter融合在Wrapper中,利用Filter的高效率和Wrapper的高精度提高搜索的速度和性能.最后以支持向量机(SVM)为分类器,在公共数据集UCI上进行实验,实验结果表明了所提出算法的可行性和有效性.  相似文献   

5.
现有的过滤式特征选择算法忽略了特征之间的关联性。鉴于此,提出了一种新的过滤式特征选择算法——基于持续同调的特征选择算法(Rel-Betti算法),该算法能够识别特征之间的关联性以及组合效果。通过提出相关贝蒂数概念,筛选出数据集中重要的拓扑特征信息。该算法对数据集进行预处理后,根据类标签将数据集分类,计算不同类中的相关贝蒂数,获得数据信息的特征均值,按特征均值差值大小对特征进行重要性排序。利用UCI数据集中的8个数据,将该算法与其他常见算法在决策树、随机森林、K近邻和支持向量机这4种学习模型下进行比较实验。结果表明,该算法是一种有效的特征选择算法,其能够提高分类的准确率和F1值,并且不依赖于特定的机器学习模型。  相似文献   

6.
分析了数据仓库主题的特征,给出了选择准则,提出了一种基于Md测度的主题搜索算法。该算法以数据仓库主题特征矢量空间中的距离为测度,从关系数据库中寻找具有数据仓库主题特征对象。还对该算法的计算复杂性进行了说明,并给出了一个SQL平台上的应用实例。  相似文献   

7.
犹豫直觉模糊集集成了直觉模糊集与犹豫模糊集的优点,能够更好地处理决策者偏好不一致时的不确定性问题。通过考虑决策者提供信息的犹豫性与模糊性,给出了犹豫直觉模糊集上知识测度的公理化定义,并且构建出犹豫直觉模糊集上一类含参知识测度,这类知识测度可以有效地刻画犹豫直觉模糊集所包含的信息量和决策者的态度特征。接下来,基于对该类知识测度中的参数进行讨论,得到一系列代表决策者不同态度特征的知识测度,进一步验证了知识测度与决策者态度系数的变化成正比。最后,基于犹豫直觉模糊集的知识测度提出多属性群决策方法,并将此方法应用于某互联网公司的空调安装公司选择的案例中,证明了所提出的知识测度具有有效性与实用性。  相似文献   

8.
王波  徐毅琼  李弼程 《计算机工程与设计》2007,28(10):2401-2402,2416
提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度.  相似文献   

9.
《计算机应用研究》2005,22(6):91-92
分析了数据仓库主题的特征,给出了选择准则,提出了一种基于Md测度的主题搜索算法.该算法以数据仓库主题特征矢量空间中的距离为测度,从关系数据库中寻找具有数据仓库主题特征对象.还对该算法的计算复杂性进行了说明,并给出了一个SQL平台上的应用实例.  相似文献   

10.
提出了一种将超图理论与图象的空-频域特征分析相结合的图象分割方法,该方法是基于图象的多分辨率小波分析及高斯-马尔可夫随机场理论,在抽取一组反映图象局部空间结构信息的特征矢量基础上,根据同一区域的象素具有相似的特征矢量的原则,将图象转换为一个关于特征相似性测度的领域超图,再利用覆盖-选择算法对该超图进行分割的方法,实验证明,该方法具有较好的稳定性和适应性,尤其对于一些信噪比较低的图象,也具有良好的分  相似文献   

11.
该文介绍了文本分类的定义,主要的特征选择方法,文本表示的向量空间模型,分类效果的评价指标。  相似文献   

12.
结合自主开发的HUST-CAID(哈尔滨理工大学计算机辅助工业造型设计)系统的特点,引入自由曲面特征,给出了自由曲面特征的参数化定义,并在此基础上对自由曲面特征识别进行研究,先是给出自由曲面特征识别的定义,接着提出了基于曲线的特征识别的算法。该方法将基于曲线的特征以二维参数的形式给出定义,使其能在二维平面上研究,通过重构特征的剖面模板库,从而利用目标特征与模板特征匹配实现了特征识别。  相似文献   

13.
面向分类特征的无监督特征选择方法研究   总被引:1,自引:0,他引:1  
针对分类特征数据给出一种新的特征重要性程度度量方法.以一趟聚类算法为基础,提出一种无监督特征选择方法.理论分析表明该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择.在UC I数据集上的实验结果表明,与文献中的经典方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效可行的.  相似文献   

14.
提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较大相关、较小冗余的特征选择(MRLR)算法。MRLR算法在特征选择时不仅考虑了特征与类标签之间的相关性,而且还考虑了特征之间的冗余性。大量的仿真实验表明,MRLR算法在针对分类属性数据的特征选择时,能获得冗余度小且更具代表性的特征子集,具有较好的高效性和稳定性。  相似文献   

15.
特征选择作为一个数据预处理过程,在数据挖掘、模式识别和机器学习中有着重要地位。通过特征选择,可以降低问题的复杂度,提高学习算法的预测精度、鲁棒性和可解释性。介绍特征选择方法框架,重点描述生成特征子集、评价准则两个过程;根据特征选择和学习算法的不同结合方式对特征选择算法分类,并分析各种方法的优缺点;讨论现有特征选择算法存在的问题,提出一些研究难点和研究方向。  相似文献   

16.
刘海燕  王超  牛军钰 《计算机工程》2012,38(14):135-137
针对传统特征选择算法只专注于特征类相关性或者特征冗余性的问题,提出一种基于条件互信息的特征选择算法。该算法采用k-means的基本思想聚类特征,并从中选出类相关度最大的特征,从而去除不相关和冗余特征。实验使用5个数据集,结果表明,该算法的分类性能优于传统特征选择算法。  相似文献   

17.
在垃圾邮件过滤中,考虑到特征词对合法邮件和垃圾邮件分类贡献的不同,通过定义分类贡献比系数,将特征词分类贡献的思想应用到特征选择和朴素贝叶斯过滤器的设计中,在英文语料库上进行实验,实验结果表明,应用特征词分类贡献的垃圾邮件过滤方法可以有效提高过滤器对合法邮件和垃圾邮件的识别能力,降低过滤器对合法邮件和垃圾邮件的误判率。  相似文献   

18.
谢娟英  吴肇中 《软件学报》2022,33(4):1338-1353
针对基于信息增益与皮尔森相关系数的特征选择算法FSIP(feature selection based on information gain and Pearson correlation coefficient)存在的特征子集选取需要人工参与的问题,提出基于可辨识矩阵的完全自适应2D特征选择算法DFSIP(disc...  相似文献   

19.
文章主要进行了接收端的垃圾邮件处理技术的对比研究,包括预处理、特征选择和分类3大步骤。其中特征选择技术包括文档频率(DF)、信息增益(IG)、优势率(ODD)等方法。文章详细介绍了其中基于粗糙集理论的特征选择方法--信息增益(knowledge gain),并用实验验证了该方法在正确率等指标中的突出表现。主流分类器算法包括k近邻、贝叶斯、SVM等,其中详细展示了线性分类器在垃圾邮件分类算法实验中的突出表现。  相似文献   

20.
Web文本挖掘及特征选择   总被引:11,自引:0,他引:11  
文章介绍了Web挖掘的有关理论,从Web文本挖掘的定义,Web文本挖掘任务的功能等方面加以阐述,然后重点分析了Web文本挖掘,文本的特征表示,特征选择,将多维文本分析与文本挖掘这两种技术有机地结合起来,快速,有效地挖掘Web上的HTML文档,最后,概述了Web文本挖掘的用途和前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号