首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
面向特定领域文本分类的实际应用,存在大量样本相互掺杂的现象,使其无法线性表述,在SVM中引入核函数可以有效地解决非线性分类的问题,而选择不同的核函数可以构造不同的SVM,其识别性能也不同,因此,选择合适的核函数及其参数优化成为SVM的关键.本文基于单核核函数的性质,对多项式核函数与径向基核函数进行线性加权,构建具有良好的泛化能力与良好的学习能力的组合核函数.仿真实验结果表明,在选择正确参数的情况下,组合核函数SVM的宏平均准确率、宏平均召回率及宏平均综合分类率都明显优于线性核、多项式核与径向基核,而且能够兼顾准确率与召回率.  相似文献   

2.
针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题. 选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点. 仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性.  相似文献   

3.
针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用EigenVoice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜索法确定核函数的最优参数,采用DAG方法实现SVM核函数的多元分类.在仿真实验中评估了线性核、多项式核、径向基核以及组合核函数,实验结果表明,在采用正确的参数前提下,在不同的多分类策略、自适应时间、信噪比和不同的说话人数量的情况下,组合核函数的识别性能明显都优于其它三个单核函数.  相似文献   

4.
构建了一个基于最大熵原理的不良文本识别模型,该模型分为训练和测试两个模块,先从训练语料中抽取特征,利用最大熵方法对特征进行训练,然后使用经过训练的特征,对测试集中的不良文本进行识别,达到了比较满意的识别效果,最后对实验结果进行了分析。  相似文献   

5.
本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的敏感信息的识别及解决的方法。研究表明在文本的分词处理方面,对不良信息形式的变化进行预处理,能够提高过滤的效率。  相似文献   

6.
本文提出用SVM Sigmoid来进行汉语组块识别的方法。SVMs具有不需要进行认真选取特征的优点,并且在具有高维特征空间的输入数据上也能够具有高的泛化性能,通过核函数的原则,SVMs能够在独立于训练数据维数的小计算范围内进行训练。Sigmoid函数使用一个参数模型来直接拟合后验概率,从而将SVMs的输出映射成一个后验概率.使一个分类器在做全局决策的一个局部决策时,考虑到全面分类,从而决策更具有合理性。实验结果表明该方法较单纯的SVMs方法具有好的效果。  相似文献   

7.
针对不良文本的特殊性,提出一种两步特征选择方法。首先对训练文本用有限自动机识别其中的特殊词作为特征加入特征集,同时将原文还原为不含特殊词的文本。对还原后文本用“组合特征选择方法”选择特征加入特征集。实验结果表明利用两步特征选择方法能有效提高非法文本识别精度。  相似文献   

8.
基于SVM的维吾尔文文本分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
文本自动分类技术在提高文本信息利用的有效性和准确性上具有重要的现实意义和广阔的应用前景。随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型表示下的高维性,本文采用词干提取和χ2统计量相结合的方法对表示空间进行降维。采用SVM算法构造了维吾尔文文本分类器。针对维吾尔文文本分类语料进行的实验结果表明,SVM分类器的MacroF1值达到了84.6%,明显好于kNN方法。  相似文献   

9.
基于SVM的哈萨克语文本分类   总被引:1,自引:0,他引:1  
介绍了支持向量机(SVM)和k-最近邻法(kNN)分类算法的思想和两种哈萨克语特征提取方法。对SVM、kNN和Bayes算法在哈萨克语文本分类的实验进行了比较。实验结果表明:在处理哈萨克语文本分类问题上,SVM较kNN和Bayes有较好的分类效果。由于哈萨克文单词的语素和构形的特点,若对哈萨克语词缀进行切分,则会降低文本分类的准确率和查全率。  相似文献   

10.
SVM用于文本分类的适用性   总被引:3,自引:0,他引:3       下载免费PDF全文
本文从统计的角度描述了文本分类的关键性质,给出了相应的文本文档集的统计分类模式,并将其与支持向量机的模型结合,说明了为什么支持向量机(SVM)能够很好地进行文本分类。本文主要是从理论角度说明SVM用于文本分类的适用性,模型构造简单,并且是高度抽象、无噪音的。  相似文献   

11.
复杂环境中存在大量的混沌现象,难以用传统的预测方法进行准确预测.针对这一问题,本文利用信息几何理论、支持向量机理论与重构相空间理论,提出混沌支持向量机CSVM,对含有混沌现象的时间序列进行预测;针对混沌环境下核函数难于构造,从信息几何角度,提出在混沌环境下,如何方便准确得进行构造核函数;最后将CSVM应用于Henon混沌系统实验.实验结果表明,误差随嵌入维数变化和延迟时间变化趋于恒定;与BP、RBF和SVM相比,CSVM具有所需支持向量少,收敛速度快,准确性高等特点.  相似文献   

12.
支持向量机是在模式分类中表现优秀的一种分类方法。对现有的基于SVM的文本多类分类方法进行了介绍和比较.研究了分类器特征空间模式问题,在这些工作基础上,提出了并行SVM的模型。  相似文献   

13.
陈婷  陈卫 《计算机工程》2011,37(10):179-181
传统的支持向量机(SVM)多值分类算法在构造多个二值分类器时存在计算量较大和分类速度较低的问题。为此,将覆盖思想引入SVM分类算法中,提出一种基于覆盖的SVM多分类算法,通过构造覆盖集寻找更紧致的优化区域,从而提高分类速度。将该算法应用到雷达辐射源识别中,仿真结果表明,该算法能够获得较好的识别效果。  相似文献   

14.
支持向量机是在模式分类中表现优秀的一种分类方法。对现有的基于SVM的文本多类分类方法进行了介绍和比较,研究了分类器特征空间模式问题,在这些工作基础上,提出了并行SVM的模型。  相似文献   

15.
设计一种基于核函数支持向量机(SVM)的穿戴式姿态识别系统。采集嵌入用户服装中的倾角传感器的数据,提取相应的特征参数,利用2种分类算法对样本进行姿态分类评估。测试实验结果表明,核函数SVM算法对日常姿态的分类效果较好,姿态识别系统对用户日常的多种姿态识别率较高。  相似文献   

16.
首先讨论支持向量机(SVM)的基本思想和实现过程,随后着重对SVM核函数进行探讨,从理论上研究常用核函数的选择优化问题。采用UCI数据库中的玻璃识别数据、菖蒲植物数据以及汽车评估数据分别对选择不同的核函数情况进行实验仿真分类和比较。仿真结果表明,同类数据选择不同核函数会产生不同的分类效果,选取合适的核函数对分类效果有很大的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号