共查询到20条相似文献,搜索用时 0 毫秒
1.
属性约减是粗糙集理论的重要研究内容之一。由于Z.Pawlak经典粗糙集模型在处理集合间隶属关系过于简单的缺陷,文章提出了以集合间距离作为集合隶属关系的判别依据,对属性依赖度和重要度重新进行了定义,从而对属性约减算法进行改进。最后,通过一个数据模型的验证,改进后的算法能够更有效地滤除冗余属性,保留关键属性。 相似文献
2.
针对公安机关使用的信息系统普遍存在"数据壁垒",不利于侦查办案的实际问题,设计并实现了多源异构大数据平台.该平台能够实现侦查、治安、交管等多类业务系统结构化、非结构化、半结构化异构数据的有效汇集整合,通过数据处理、目录管理、分析研判等功能,解决由于数据无法有效利用而导致"信息孤岛"、无法服务于侦查破案的问题.该平台应用... 相似文献
3.
为了减少航天器特征值属性的冗余性并提高其权重的准确性,提出了一种基于邻域粗糙集的属性约简及权重计算方法。通过对不同重要度下限分类精度的对比分析,给出了确定邻域半径的新规则。在信息观权值最优计算公式的基础上,提出了一种基于信息熵的特征值权重计算方法;给出了代数观和信息观最优组合权值确定方法,解决了代数观和信息观方法的权衡问题。将其应用于某卫星姿控系统特征值分析中,与其他方法的比较表明该方法能有效减少特征值的数目,提高特征值权重的准确性。 相似文献
4.
多源异构传感通信大数据的融合调度算法 总被引:2,自引:0,他引:2
《软件》2017,(10):29-38
本文研究了在能量受限条件下服务于多种类型的数据处理和传输的多源异构通信簇交通传感器节点系统的最优大数据的融合调度控制问题。传统方法需要大量关于系统动态的统计信息,并且求解效率低。使用针对更新帧的李雅普诺夫优化技术,本文设计了一种新的在线多源传感通信大数据融合调度算法来克服以上困难。仿真实验表明所设计算法稳定、鲁棒,为后续利用交通传感器网络传输大规模数据奠定基础。 相似文献
5.
6.
《计算机工程》2017,(7):175-181
为有针对性地区分入侵攻击类别,提高入侵检测系统(IDS)整体的分类准确率,提出一种层次属性约减模型。该模型采用文化算法的双层进化思想,结合粗糙集和遗传算法进行属性约减。对数据进行预处理并分层划分子空间,形成决策子表规则集f_D。运用文化算法在信念空间进行知识更新,并将层次评价知识库的进化数据传入种群空间。在种群空间利用粗糙集和遗传算法进行进化和约减,得到各层的优选属性集f_(opt),设计出层次Bayes分类器验证模型性能。实验结果表明,该模型可将属性约减前的Bayes分类正确率提高至98.21%,并能较好地识别出流量特征不明显的R2L,U2R类别的入侵攻击。 相似文献
7.
8.
近年来,针对多源异构数据的实体匹配问题,已经有诸多学者提出不同的解决方法。然而,这些方法几乎都集中在RDFS或OWL等语义框架下进行实体匹配,不具有通用性。此外,针对多数据源实体匹配问题,目前主流解决方式是将其转换为多组两两数据源的实体匹配问题,该种方式直接进行两两匹配的计算复杂度过高,且没有从多数据源全局的角度分析问题。从这些问题出发,提出了一种的实体匹配方法,利用了实体中普遍存在的名称、属性和上下文信息,构建多种索引,缩减计算空间同时生成高质量的候选集;还定义了度量实体相似度的计算方法,有效地判别了实体对是否匹配。并根据实体间边的权重以及互斥关系,提出一种基于图划分的优化算法,划分多个等价实体构成的集合。从互联网中抓取商业领域下品牌和人物类别的真实数据进行实验测试,实验结果表明该方法取得了良好的效果。 相似文献
9.
基于邻域属性熵的隐私保护数据干扰方法 总被引:2,自引:1,他引:2
隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的. 相似文献
10.
针对多源异构数据不平衡分类问题,论文建立了自适应多目标群交叉优化(AMSCO)算法来处理并行采样两个类时的类不平衡数据集。以重新平衡数据集时间最优为目标,采用两种群优化算法逐步找出特定分类器的最佳性能。将少数类样本合成过抽样技术(S MOTE)扩展为OSMOTE用于将少数多源异构数据扩充到适当的数量,结合群实例选择(S IS)有用的实例来过滤大部分多源异构数据。实验结果表明,所提出的算法能够提高多源异构数据分类模型的可信度并保持较高的准确性。 相似文献
11.
随着各行各业信息系统的不断建设发展,信息资源总量急剧膨胀,不同行业、不同部门之间的数据壁垒现象也越来越严重,大大增加了数据信息整编工作量以及复杂程度。分析了多源异构数据的特点及导致数据壁垒的原因,结合数据整编业务的实际需求,提出了一种面向多源异构数据的整编系统,并阐述了该整编系统的模型框架及实现方式。 相似文献
12.
异构云计算中的数据多源化严重,传统数据共享方法难以统一数据的格式,导致共享过程中学习泛化能力较弱,影响了最终的数据共享结果。对此设计一种异构云计算海量多源数据在线共享方法,为使异构云计算中海量多源数据实现精准在线共享,首先将多源数据的格式进行归一化转换,提取数据的特征矩阵进行坡度归一化,设计数据在线共享接口,实现异构云计算中海量多源数据的在线共享。共享方法性能测试结果表明,相同测试环境下,设计的数据在线共享方法共享数据量最高,ER与F1的平均值最低,说明设计的异构云计算海量所有数据的在线共享方法在数据共享的过程中泛化能力更好。 相似文献
13.
孙瑜 《计算机测量与控制》2024,32(3):286-292
目前常规的多源异构数据治理方法主要通过对数据属性进行判断,从而实现分区域数据清洗,由于缺乏对非线性数据的分析,导致治理性能不佳;对此,提出基于云数据中心的多源异构数据治理技术;采用关系型数据库中的ETL功能对数据进行清洗,对数据转换模式以及数据清洗规则进行定义;引入互信息系数对数据相关程度进行判定,并进行非线性数据相关性分析;以云数据中心作为载体,对多源异构数据治理体系进行构建;在实验中,对提出的数据治理技术进行了治理性能的检验;最终的实验结果表明,提出的数据治理技术具备较高的查准率,对云数据中心多源异构数据具备较为理想的数据治理效果。 相似文献
14.
15.
王玲 《自动化与仪器仪表》2021,(5):13-16
异构网络存在多源目标数据,因此需要融合其中的重复性数据、同属性数据,但由于传统方法构建的模型跟踪效果较差,导致挖掘技术遗失了部分数据特征,影响多源目标数据融合,因此研究基于时序挖掘的异构网络多源目标数据融合方法.该方法利用构建的跟踪模型,搜索异构网络全局多源目标;并对搜索结果进行标准化处理后,规约标准数据;采用时序挖掘... 相似文献
16.
17.
19.