共查询到18条相似文献,搜索用时 937 毫秒
1.
数据样本集作为人工智能不可缺少的部分,应是全面的,有效的集合。当所提供的数据样本集残缺不全时,会影响人工智能的有效应用,针对这一问题,该文提出了一种基于决策算法的数据样本集补全方法,能科学、正确、有效地补全数据样本集。为提高人工智能的决策推理铺平了道路。 相似文献
2.
张士林 《计算机工程与应用》2006,42(30):227-228
数据样本集是人工智能发展需要的主要要素,所以要求提供的数据样本集,应该是全面的、有效的集合。当所提供的数据样本集残缺不全,会影响人工智能的有效应用。针对此问题,论文提出一种基于粗糙集理论的数据样本集补全方法,能科学的、正确的、有效的补全数据样本集,为提高人工智能的决策推理,铺平了道路。 相似文献
3.
研究了压力传感器输入/输出特性样本集结构和样本集的实时校正。首先,通过加速试验获得了传感器特性的时漂以及受温度影响的变化规律,并据此构建了样本集。基于BP神经网络模型,对样本集的融合精度进行了动态对比试验,进而验证了样本集构建的合理性。此外,提出一种对样本集进行实时校正的方法,校正过程由程序控制。将实时校正后的数据与初始标定样本数据、加速试验600 h后的标定数据对比,最大偏差仅为0.08 kPa,样本集经校正后,数据准确度提高了近1个数量级。 相似文献
4.
针对不平衡数据集分类效果不理想的问题,提出了一种新的基于混合采样的不平衡数据集算法(BSI)。通过引进“变异系数”找出样本的稀疏域和密集域,针对稀疏域中的少数类样本,提出了一种改进SMOTE算法的过采样方法(BSMOTE);对密集域中的多数类样本,提出了一种改进的欠采样方法(IS)。通过在六种不平衡数据集上的实验表明,该算法与传统算法相比,取得了更高的G-mean值、F-value值、AUC值,有效改善了不平衡数据集的综合分类性能。 相似文献
5.
不平衡数据集问题从20年前就已经引起人们的重视, 提出的相关解决方法层出不穷. Mixup是这几年比较流行的数据合成方法, 其相关变体比比皆是, 但是针对不平衡数据集提出的Mixup变体寥寥无几. 本文针对不平衡数据集分类问题, 提出了Mixup的变体——Borderline-mixup, 其使用支持向量机选择边界样本, 增加边界样本在采样器中被采样的概率, 构建两个边界采样器, 替代了原有的随机采样器. 在14个UCI数据集以及CIFAR10长尾数据集上的实验结果表明, Borderline-mixup相比于Mixup在UCI数据集中都有提升, 最高能达到49.3%的提升, 在CIFAR10长尾数据集中, 也能达到3%–3.6%左右的提升. 显然, 我们提出的Mixup变体在不平衡数据集分类中是有效的. 相似文献
6.
现实世界中存在着非平衡数据集,即数据集中的一类样本数量远大于另一类。而少数类样本的识别通常是人们首要关心的,将少数类样本误分为多数类要比将多数类样本误分为少数类付出更高的代价。传统的机器学习算法可能会产生偏向多数类的结果,因而对于少数类而言,预测的效果会很差。在对目前国内外非平衡数据集研究现状深入分析的基础上,针对非平衡数据集数据复杂度研究和失衡解决方法研究两个方向相对孤立及缺乏系统性的缺陷,提出了一种非平衡数据集整体解决框架,以满足日益迫切的应用需求。 相似文献
7.
8.
杜晓明赵晔蕾张媛玥李一明 《互联网天地》2023,(9):53-56
近来,大模型已成为人工智能产业的焦点所在,Al三驾马车之一的数据集重要性凸显.本研究收集了国内大模型数据集的相关信息,总结发现当前国内大模型数据集主要来源包括公开、自有、合作、采购;目前数据集存在公开数据量不足、数据管理分散、数据私域化问题.针对相关问题,建议电信运营商培养输出高质量数据集能力,并加强产业合作,打造数据开源环境. 相似文献
9.
针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域、降低算法复杂度的目的。在6种不平衡数据集上的大量实验表明,改进算法与传统算法相比,算法消耗时间大幅减少,取得更高的G-mean值、F-value值和AUC值。 相似文献
10.
基于模型诊断是人工智能领域中具有挑战性的问题,包含了很多人工智能中的关键问题,其研究对整个人工智能领域起着重要推动作用。在基于模型诊断中,候选诊断结果通常由所有极小冲突集对应的所有极小碰集所描述,求出所有极小碰集是其核心问题之一。提出一种将极小碰集问题转换为约束满足问题的方法,该方法调用成熟的CSP求解器进行求解,扩展了约束可满足问题的应用领域。首次提出hard‐冲突集和sof t‐冲突集的概念,并给出利用所提的方法分别求解具有一些特征的极小碰集:小于固定长度、不含特定元素及包含hard‐冲突集和sof t‐冲突集。实验结果表明,提出的方法易于实现、扩展性强,对于特定类型极小碰集问题的求解效率较高。 相似文献
11.
介绍了人工智能技术的相关概念、发展概述及其在煤炭行业发展中的应用,指出目前人工智能技术在矿山应用只是点状结合和浅度结合,没有实现人工智能技术和矿山某个生产或管理系统层面的深度融合。概述了智能矿山的发展历程,指出智能矿山是人工智能技术、大数据技术、物联网技术和矿山实体的深度融合体,利用智能通信、智能控制和智能计算技术实现数字化矿山的计算、处理,构建数字孪生矿山,通过数字孪生矿山和物理矿山的智能交互演化,达到对煤矿安全、高效、绿色的生产控制。构建了将人工智能技术和矿山深度融合的包括设备层、智能层、应用层的智能矿山三层构架:应用层处于智能矿山的最高层,其中的数字孪生矿山子层相当于“数字大脑”,实现矿山最高层次的智能控制;智能层中的智能体要求子系统不仅仅是应用人工智能技术处理子系统所产生的数据,而是从架构上就要将智能计算、智能通信、智能控制融为一体。展望了智能矿山建设的发展趋势:智能化矿山需要加强人工智能技术和矿山融合度的深入研究,将现有的基于人工智能的故障检测、诊断及超前干预技术应用到机器人系统中,智能计算、智能通信、智能控制融合的巡检机器人将是最早能推广的井下智能体之一;智能化矿山需要进一步加强复杂巨系统建模技术的研究,只有建立了矿山的复杂巨系统模型,才能实现采矿活动和环境的协同互动,实现采煤活动的精准控制,复杂巨系统模型的缺乏将是未来智能矿山建设亟需解决的问题。 相似文献
12.
于顺森 《电脑编程技巧与维护》2013,(8):44-45
Java开发智能软件的发展和应用已有很多年了,在其软件系统中所具有的对信息搜索处理的功能和对庞大数据进行分析处理的能力让其软件在银行的服务系统上得到了广泛地运用,经过不断的发展和创新,可以预测在未来社会的发展中,Java开发智能软件在银行服务系统的应用中一定会将它的优点得以全部的发挥出来,在各个行业都能得到广泛的使用。 相似文献
13.
采用分布式系统保证银行数据中心的灾难恢复,通过分布在各地的服务器,保证当灾难发生后恢复的自动化。通过数据中心网络整合、数据中心应用智能、数据中心虚拟化、数据存储和灾难恢复策略提高了银行数据中心的灾难恢复能力。 相似文献
14.
介绍了一个基于数据挖掘的人工智能神经网的应用 ,给出了利用神经网络方法及神经网络模型来计算诊断实际症状结果。探讨了基于人工 Application的数据挖掘方法在故障诊断建模领域的应用 ,其他的数据挖掘方法及其结合有待进一步研究 相似文献
15.
16.
17.
18.
对于粗糙集应用中数据不全的解决方法研究 总被引:1,自引:0,他引:1
该文针对在粗糙集理论的应用中,由于本身存在或者经过粗糙集理论处理后,所得到的数据不全、短缺的情况,为了发现新的规则,使整个规则系统完备,能够根据以往的数据给决策者提供全面的决策依据,提出了修正唐建国补全法。修正唐建国补全法弥补了唐建国补全法中事先未考虑数据规则的完整性和盲目地进行数据补全的不足,同时对于其决定规则的决策属性的概率计算进行了修改,从而使规则的决策属性的预测性有了明显的提高。 相似文献