首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 305 毫秒
1.
经典数据驱动型TSK模糊系统在利用高维数据训练模型时,由于规则前件采用的特征过多,导致规则的解释性和简洁性下降.对此,根据模糊子空间聚类算法的子空间特性,为TSK模型添加特征抽取机制,并进一步利用岭回归实现后件的学习,提出一种基于模糊子空间聚类的0阶岭回归TSK模型构建方法.该方法不仅能为规则抽取出重要子空间特征,而且可为不同规则抽取不同的特征.在模拟和真实数据集上的实验结果验证了所提出方法的优势.  相似文献   

2.
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度。  相似文献   

3.
随着信息技术的飞速发展和大数据时代的来临,数据呈现出高维性、非线性等复杂特征。对于高维数据来说,在全维空间上往往很难找到反映分布模式的特征区域,而大多数传统聚类算法仅对低维数据具有良好的扩展性。因此,传统聚类算法在处理高维数据的时候,产生的聚类结果可能无法满足现阶段的需求。而子空间聚类算法搜索存在于高维数据子空间中的簇,将数据的原始特征空间分为不同的特征子集,减少不相关特征的影响,保留原数据中的主要特征。通过子空间聚类方法可以发现高维数据中不易展现的信息,并通过可视化技术展现数据属性和维度的内在结构,为高维数据可视分析提供了有效手段。总结了近年来基于子空间聚类的高维数据可视分析方法研究进展,从基于特征选择、基于子空间探索、基于子空间聚类的3种不同方法进行阐述,并对其交互分析方法和应用进行分析,同时对高维数据可视分析方法的未来发展趋势进行了展望。  相似文献   

4.
高维数据挖掘由于特征空间占用开销较大,挖掘的复杂度较高,挖掘精度不高,为了提高对高维数据挖掘的准确性能,提出一种基于相空间重构和K-L变换特征压缩的高维数据挖掘数学建模方法。采用集成学习技术,对高维数据信息流进行相空间重构处理,考虑类间的数据不平衡性,求得高维数据的关联维特征参量,根据数据的链距离进行稀疏性融合,计算高维数据流模型的最大Lyapunove指数谱,根据谱分析方法实现数据聚类,对聚类后的数据采用K-L特征压缩方法进行降维处理,降低数据挖掘的内存及计算开销。仿真结果表明,采用该方法进行高维数据挖掘,数据挖掘的准确概率较高,占用内存消耗较少,计算开销较小。  相似文献   

5.
为了提高客服中心的智能管理和信息调度能力,结合大数据分析方法进行客服中心实时数据监测和自动采集设计。提出一种基于模糊规则特征量挖掘和层次分析聚类的客服中心实时数据流自动监测方法。建立客服中心的网格分布结构模型并进行客服中心实时数据流监测统计特征分析,进行客服中心实时监测数据属性集的向量量化特征分解,对客服中心实时数据采用信息融合和模糊层析性分析方法实现信息融合,进行关联数据自适应特征提取,挖掘客服中心实时监测数据信息流的正相关性特征量。在层次性聚类算法基础上采用自回归分析进行客服中心实时数据流的模糊聚类和信息预测,提高客服中心实时数据监测的准确性,同时降低了客服服务中心数据流监测的风险。仿真结果表明,采用该方法进行客服中心实时数据监测的聚类性较高,预测性较好,能降低数据聚类的误分率,提高了客服中心实时数据监测能力。  相似文献   

6.
传统人机交互状态数据模拟过程数据视域特征采集不准确、数据模拟不连续,导致人机交互状态数据检测能力偏低,提出基于模糊关联聚类分析的人机交互状态数据模拟及挖掘方法。采用定量递归分析法完成数据模糊关联聚类。利用关联特征分布序列调度法,得到人机交互状态数据的规则训练集。在模糊扰动约束下,得到人机交互状态数据的聚类目标函数。采用相关性检测方法进行数据的人机交互设计,采用替代数据法对工业环境下的人机交互状态数据进行复指数检测,提取人机交互状态数据的弱关联性指数特征,分离工业环境下人机交互状态数据的信息,实现对工业环境下的人机交互状态数据仿真。仿真结果表明,采用上述方法进行人机交互状态数据模拟数据视域特征采集准确,且具有连续性,提高了研究方法的可应用性。  相似文献   

7.
传统方法在对高维稀疏数据进行检测的过程中,受到高维特征扰动的影响,数据误差较大,因此提出一种基于深度学习的高维稀疏数据组合推荐算法。采用相空间重构方法进行高维稀疏数据的特征重构,根据重构结果结合非线性统计序列分析方法进行高维稀疏数据的回归分析和点云结构重组,在此基础上提取高维稀疏数据的组合特征量;依据特征量提取结果采用特征提取技术抽取高维稀疏数据的平均互信息特征量,并结合关联规则挖掘方法进行高维稀疏数据的主成分分析,挖掘高维稀疏数据的相似度属性类别成分,最终采用深度学习方法进行高维稀疏数据组合推荐过程中的自适应寻优,实现高维稀疏数据的组合推荐。仿真结果表明,采用该算法进行高维稀疏数据推荐的属性归类辨识性较好,特征分辨能力较强,提高了数据的检测和识别能力。  相似文献   

8.
与在所有特征空间寻找聚类不同,子空间聚类的目标是找到嵌在不同子空间的簇,是实现高维数据聚类的有效途径.传统聚类算法主要采用基于距离测量的方法进行聚类,难以处理高维数据.提出一种能够处理高维数据的子空间聚类算法(Attribute relevancy-based subspace clustering algorithm,ARSUB),将属性转化为频繁模式中的项集,将聚类问题转化为频繁模式挖掘问题,然后基于项目对间强相关的关系建立关系矩阵,以衡量任意两个项集之间的相关度,进而得到强相关的候选子空间.最后利用候选子空间进行聚类得到存在于不同子空间中的簇.在合成数据集与真实数据集的实验结果表明,这种方法具有较高的准确度和效率.  相似文献   

9.
谢川 《计算机科学》2016,43(6):229-232
大数据聚类过程是一个随机的非线性处理过程,具有很高的不确定性。 由于传统方法需要先验知识进行学习,不能很好地适应大数据的实时变化情况,无法有效实现大数据聚类,因此提出一种基于混沌关联特征提取的大数据聚类算法。分析了传统方法的弊端,通过重构相空间建立了一个多维的状态空间向量与混沌轨迹,使原系统中很多几何特征量保持不变,为分析原系统的混沌特征提供有效依据。将平均互信息量取第一个最小值时的横坐标所指的时间延迟作为重构相空间的最佳时间延迟,采用虚假最近邻点算法对最佳嵌入维数进行选择。将提取的关联维数这一特征量作为大数据聚类的混沌特征量,依据提取的混沌关联维特征对大数据进行聚类。仿真实验表明,所提算法能够有效提高数据的聚类效率,减少能耗,是一种有效的数据聚类方法。  相似文献   

10.
高维数据的稀疏性和"维灾"问题使得多数传统聚类算法失去作用,因此研究高维数据集的聚类算法己成为当前的一个热点.子空间聚类算法是实现高维数据集聚类的有效方法之一.介绍并实现了基于可变加权的高维数据子空间聚类算法SCAD和EWKM,并分别对人造数据、现实数据等数据集进行测试,根据测试结果进行分析,对比两种算法的性能及适用场合.  相似文献   

11.
为了提高异构多核平台大数据精准挖掘能力,提出一种基于语义分割的异构多核平台大数据精准挖掘方法。构建异构多核平台大数据的模糊信息检测模型,采用关联特征提取方法进行异构多核平台大数据的模糊指向性聚类分析。构建异构多核平台大数据的输出自相关特征匹配模型,结合语义特征提取方法进行异构多核平台大数据的特征提取和统计分析。建立异构多核平台大数据的语义动态特征分析模型,提取异构多核平台大数据的统计特征量。根据异构多核平台大数据的特征提取结果采用模糊C均值聚类方法进行大数据聚类,采用语义分割进行异构多核平台大数据挖掘过程中的自适应寻优,实现异构多核平台大数据的优化挖掘。仿真结果表明,采用该方法进行异构多核平台大数据挖掘的精度较高,特征分辨能力较好,可提高异构多核平台大数据的挖掘和检测能力。  相似文献   

12.
研发机构作为运营商研发与推广相关项目的重要责任单位,其产生的科研数据是组织资产一部分,为避免被竞争者窃取,及时掌握入侵信息,研究多源通信研发机构入侵监测大数据挖掘方法。根据研发机构特性,从信息资产方面分析入侵风险;将采集到的入侵痕迹信息转换为频域信号,分析频谱特征,完成入侵行为特征提取;结合提取的特征,利用改进的k-Means聚类方法做迭代运算,获取质心坐标,将训练样本与质心以向量形式引入到欧式距离中,计算二者空间关联度,达到降维目的;为减小运算量,确定挖掘约束条件,综合分析入侵监测大数据位置、方向、长度关联度,利用关联度公式实现大数据聚类,获得最终挖掘结果。仿真结果表明,所提方法在提高挖掘速率的同时,保证大数据挖掘完整性。  相似文献   

13.
为了提高电力四表合一数据智能集抄能力,提出一种基于灰色分析的电力四表合一数据智能集抄系统设计方法,采用多维传感器进行电力四表合一数据智能采集,对采集的电力四表合一数据进行智能信息融合处理,提取电力四表合一数据的灰色关联特征量,根据特征提取结果进行电力四表合一数据的智能融合和传输控制,结合嵌入式设计方法,进行电力四表合一数据的智能集抄系统设计,采用模糊集成控制方法,进行电力四表合一数据智能集抄系统的输出稳定性调节,结合灰色分析方法,实现电力四表合一数据智能集抄系统的大数据信息处理和智能开发设计。测试结果表明,设计的电力四表合一数据智能集抄系统具有很好的数据信息融合处理能力,系统的输出稳定性较高,可靠性较好。  相似文献   

14.
为了有效改善高光谱图像数据分类的精确度,减少对大数目数据集的依赖,在原型空间特征提取方法的基础上,提出一种基于加权模糊C均值算法改进型原型空间特征提取方案。该方案通过加权模糊C均值算法对每个特征施加不同的权重,从而保证提取后的特征含有较高的有效信息量,从而达到减少训练数据集而不降低分类所需信息量的效果。实验结果表明,与业内公认的原型空间提取算法相比,该方案在相对较小的数据集下,其性能仍具有较为理想的稳定性,且具有相对较高的分类精度。  相似文献   

15.
为了提升社交网络个性化推荐能力,结合用户行为分布进行个性化推荐设计,文中提出基于用户行为特征挖掘的个性化推荐算法,构建社交网络的用户行为信息特征挖掘模型,采用显著数据分块检测方法对社交网络用户特征的行为信息进行融合处理,提取反映用户偏好的语义信息特征量。从情感、关键词和结构等方面根据用户行为特征组,结合模糊信息感知方法进行社交网络个性化推荐过程中的信息融合处理,在关联规则约束控制下,构建社交网络用户偏好特征的混合推荐模型,实现用户偏好特征挖掘,根据语义分布和用户的行为偏好实现社交网络的个性化信息推荐。仿真结果表明,采用所提方法进行社交网络个性化推荐的特征分辨能力较好,对用户行为特征的准确识别能力较强,提高了社交网络推荐输出的准确性。  相似文献   

16.
基于PCA-KFCM的船舶柴油机故障诊断   总被引:1,自引:0,他引:1  
为提高船舶柴油机故障诊断的准确率和深刻反映船舶柴油机的运行状况,结合主元分析(PCA)的特征提取优势和模糊核聚类(KFCM)具有较好聚类效果的特点,提出了一种新的船舶柴油机故障诊断方法。该方法首先利用主元分析对船舶柴油机故障的训练和测试数据集进行特征提取,消除了故障征兆之间的相关性;然后对经特征提取后的训练样本进行模糊核聚类,并用网格法确定其中的参数,得到聚类中心。通过计算测试样本集中各样本与聚类中心在高维特征空间中的欧氏距离,得出最终的故障诊断结果。对MAN B&W 10L90MC型船用柴油机的故障诊断结果验证了该方法的有效性。因此,应用提出的方法对船舶柴油机进行故障诊断具有重要的实际意义。  相似文献   

17.
为提高船舶柴油机故障诊断的准确率和深刻反映船舶柴油机的运行状况,结合主元分析(PCA)的特征提取优势和模糊核聚类(KFCM)具有较好聚类效果的特点,提出了一种新的船舶柴油机故障诊断方法。该方法首先利用主元分析对船舶柴油机故障的训练和测试数据集进行特征提取,消除了故障征兆之间的相关性;然后对经特征提取后的训练样本进行模糊核聚类,并用网格法确定其中的参数,得到聚类中心。最后通过计算测试样本集中各样本与聚类中心在高维特征空间中的欧氏距离,得出最终的故障诊断结果。对MAN B&W 10L90MC型船用柴油机的故障诊断结果验证了该方法的有效性。因此,应用提出的方法对船舶柴油机进行故障诊断具有重要的实际意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号