共查询到18条相似文献,搜索用时 109 毫秒
1.
为进一步提高SVM增量训练的速度,在有效保留含有重要分类信息的历史样本的基础上,对当前增量训练样本集进行了约简,提出了一种基于类边界壳向量的快速SVM增量学习算法,定义了类边界壳向量。算法中增量训练样本集由壳向量集和新增样本集构成,在每一次增量训练过程中,首先从几何角度出发求出当前训练样本集的壳向量,然后利用中心距离比值法选择出类边界壳向量后进行增量SVM训练。分别使用人工数据集和UCI标准数据库中的数据进行了实验,结果表明了方法的有效性。 相似文献
2.
3.
一种SVM增量学习淘汰算法 总被引:1,自引:1,他引:1
基于SVM寻优问题的KKT条件和样本之间的关系,分析了样本增加后支持向量集的变化情况,支持向量在增量学习中的活动规律,提出了一种新的支持向量机增量学习遗忘机制--计数器淘汰算法.该算法只需设定一个参数,即可对训练数据进行有效的遗忘淘汰.通过对标准数据集的实验结果表明,使用该方法进行增量学习在保证训练精度的同时,能有效地提高训练速度并降低存储空间的占用. 相似文献
4.
为了提高支持向量机处理大数据集的性能,在研究MapReduce编程模型的基础上结合增量学习及迭代技术提出了改进算法MRII-SVM。该算法采用增量学习方式,在Map阶段并行求解各数据切片的支持向量集,并利用KKT条件削减增量数据集,在Reduce阶段执行联合重训练使算法收敛于当前最优解。基于UCI标准数据集的实验结果显示,MRII-SVC在保持SVM算法分类精度的基础上,提高了数据处理能力和运行效率。 相似文献
5.
王亚兵 《数字社区&智能家居》2014,(7):4417-4420
提出了一种聚类学习与增量SVM训练相结合的的入侵检测方法,采用聚类分析、样本修剪与增量学习相结合的方式,通过聚合相似的训练样本以支持多类别分类,通过去除相似的样本而只取其代表点,从而减少参加训练的样本数量,提高学习效率,同时采用基于广义KKT判决的增量学习方法,有效改善了多类别入侵检测场合下样本数据集过于庞大,学习速度过慢且难以保障SVM入侵检测能力持续优化的问题。 相似文献
6.
提出一种新的基于向量投影的支持向量机增量式学习算法.该算法根据支持向量的几何分布特点,采用向量投影的方法对初始样本及增量样本在有效地避免预选取失效情况下进行预选取.选取最有可能成为支持向量的样本形成边界向量集,并在其上进行支持向量机训练.通过对初始样本是否满足新增样本集KKT条件的判断,解决非支持向量向支持向量转化的问题,有效地处理历史数据.实验表明,基于向量投影的支持向量机增量算法可以有效地减少训练样本数,积累历史信息,提高训练的速度,从而具有更好的推广能力. 相似文献
7.
王亚兵 《数字社区&智能家居》2014,(19):4417-4420,4432
提出了一种聚类学习与增量SVM训练相结合的的入侵检测方法,采用聚类分析、样本修剪与增量学习相结合的方式,通过聚合相似的训练样本以支持多类别分类,通过去除相似的样本而只取其代表点,从而减少参加训练的样本数量,提高学习效率,同时采用基于广义KKT判决的增量学习方法,有效改善了多类别入侵检测场合下样本数据集过于庞大,学习速度过慢且难以保障SVM入侵检测能力持续优化的问题。 相似文献
8.
在如何从海量的数据中提取有用的信息上提出了一种新的SVM的增量学习算法.该算法基于KKT条件,通过研究支持向量分布特点,分析了新样本加入训练集后,支持向量集的变化情况,提出等势训练集的观点.能对训练数据进行有效的遗忘淘汰,使得学习对象的知识得到了积累.在理论分析和对旅游信息分类的应用结果表明,该算法能在保持分类精度的同时,有效得提高训练速度. 相似文献
9.
经典的支持向量机(SVM)算法在求解最优分类面时需求解一个凸二次规划问题,当训练样本数量很多时,算法的速度较慢,而且一旦有新的样本加入,所有的训练样本必须重新训练,非常浪费时间.为此,提出一种新的SVM快速增量学习算法.该算法首先选择那些可能成为支持向量的边界向量,以减少参与训练的样本数目;然后进行增量学习.学习算法是一个迭代过程,无需求解优化问题.实验证明,该算法不仅能保证学习机器的精度和良好的推广能力,而且算法的学习速度比经典的SVM算法快,可以进行增量学习. 相似文献
10.
针对SVM方法在大样本情况下学习和分类速度慢的问题,提出了大样本情况下的一种新的SVM迭代训练算法。该算法利用K均值聚类算法对训练样本集进行压缩,将聚类中心作为初始训练样本集,减少了样本间的冗余,提高了学习速度。同时为了保证学习的精度,采用往初始训练样本集中加入边界样本和错分样本的策略来更新训练样本集,迭代训练直到错分样本数目不变为止。该文提出的基于K均值聚类的SVM迭代算法能在保持学习精度的同时,减小训练样本集及决策函数的支持向量集的规模,从而提高学习和分类的速度。 相似文献
11.
一种SVM增量学习算法α-ISVM 总被引:56,自引:0,他引:56
基于SVM(support vector machine)理论的分类算法,由于其完善的理论基础和良好的试验结果,目前已逐渐引起国内外研究者的关注.深入分析了SVM理论中SV(support vector,支持向量)集的特点,给出一种简单的SVM增量学习算法.在此基础上,进一步提出了一种基于遗忘因子α的SVM增量学习改进算法α-ISVM.该算法通过在增量学习中逐步积累样本的空间分布知识,使得对样本进行有选择地遗忘成为可能.理论分析和实验结果表明,该算法能在保证分类精度的同时,有效地提高训练速度并降低存储空间的占用. 相似文献
12.
一种SVM增量训练淘汰算法 总被引:8,自引:0,他引:8
基于KKT条件分析了样本增加后支持向量集的变化情况,深入研究了支持向量分布特点,提出了一种新的支持向量机增量训练淘汰机制——挖心淘汰算法。该算法只需设定一个参数,即可对训练数据进行有效的遗忘淘汰。通过对标准数据集的实验结果表明,使用该方法进行增量训练在保证训练精度的同时,能有效地提高训练速度并降低存储空间的占用。 相似文献
13.
针对基于支持向量机的Web文本分类效率低的问题,提出了一种基于支持向量机Web文本的快速增量分类FVI-SVM算法。算法保留增量训练集中违反KKT条件的Web文本特征向量,克服了Web文本训练集规模巨大,造成支持向量机训练效率低的缺点。算法通过计算支持向量的共享最近邻相似度,去除冗余支持向量,克服了在增量学习过程中不断加入相似文本特征向量而导致增量学习的训练时间消耗加大、分类效率下降的问题。实验结果表明,该方法在保证分类精度的前提下,有效提高了支持向量机的训练效率和分类效率。 相似文献
14.
基于支持向量机的中文娱乐新闻词语的识别 总被引:1,自引:0,他引:1
在应用基本的支持向量机算法的基础上,提出了一种新的分布增量学习方法,利用主动学习策略对训练样本进行选择,逐步增大提交给学习器训练样本的规模,以提高学习器的识别精确率.实验表明,采用主动学习策略的支持向量机算法是有效的,中文娱乐新闻词语识别的正确率和召回率分别达到了78.92%和86.42%,收到了良好的效果. 相似文献
15.
为了提高人脸识别率,本文提出了一种增量学习支持矢量机(SVM)人脸识别方法,有效地对SVM的参数进行更新。提出的方法采用高斯概率模型描述SVM的参数统计特征,在无需额外存储训练数据的前提下,采用增量学习SVM的方式实现参数的更新;并通过最小化分类误差准则最大化SVM两类输出值概率分布间的距离。详细的实验以及与现有方法的比较结果表明,提出的识别方法具有更好的识别性能。 相似文献
16.
17.
提出了一种改进的支持向量机增量学习算法。分析了新样本加入后,原样本和新样本中哪些样本可能转化为新支持向量。基于分析结论提出了一种改进的学习算法。该算法舍弃了对最终分类无用的样本,并保留了有用的样本。对标准数据集的实验结果表明,该算法在保证分类准确度的同时大大减少了训练时间。 相似文献