面向大数据流的半监督在线多核学习算法 |
| |
引用本文: | 张钢,谢晓珊,黄英,王春茹.面向大数据流的半监督在线多核学习算法[J].智能系统学报,2014(3):355-363. |
| |
作者姓名: | 张钢 谢晓珊 黄英 王春茹 |
| |
作者单位: | 广东工业大学自动化学院 |
| |
基金项目: | 国家自然科学基金资助项目(81373883) |
| |
摘 要: | 在机器学习中,核函数的选择对核学习器性能有很大的影响,而通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核函数参数进行有监督的调整,同时以无监督的方式通过流形学习对核函数参数进行修改,以使得核函数所体现的等距面尽可能沿着数据的某种低维流形分布。算法的创新性在于能同时进行有监督和无监督的核学习,且不需要对历史数据进行再次扫描,有效降低了算法的时间复杂度,适用于在大数据和高速数据流环境下的核函数学习问题,其对无监督学习的支持有效解决了大数据流中部分标记缺失的问题。在MOA生成的人工数据集以及UCI大数据分析的基准数据集上进行算法有效性的评估,其结果表明该算法是有效的。
|
关 键 词: | 大数据流 在线多核学习 流形学习 数据依赖核 半监督学习 |
本文献已被 CNKI 等数据库收录! |
|