首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
将数据挖掘技术应用于高速公路系统中,利用挖掘得到的模式对高速公路管理提供有效支持,数据预处理关系到收费数据的挖掘质量,针对丢卡、坏卡、回头车等存在的问题,对数据预处理进行了改正,并给予算法实现。  相似文献   

2.
一种面向数据挖掘预处理过程的领域知识的分类及表示   总被引:6,自引:0,他引:6  
本文强调了领域知识应用于数据预处理过程的特点和意义,给出了面向数据预处理技术的领域知识的分类和表示,设计了面向数据预处理技术的领域知识的存储结构和将领域知识应用于数据预处理过程的算法.  相似文献   

3.
基于MapX的空间数据挖掘模型及其应用   总被引:7,自引:0,他引:7  
利用Mapx控件对GIs数据强大的操作与处理功能,将Mapx应用到空间数据挖掘中,构建了基于MapX的空间数据挖掘模型。通过该模型可以方便的对空间数据与非空间数据进行操作处理,以及空间对象之间的拓扑关系与距离信息等进行判定,从而解决了空间数据挖掘中数据整合与数据预处理的问题。概念泛化技术应用于数据预处理中,构建了概念层次树。关联规则算法有效应用于空间数据挖掘中.荻取了有用的知识。  相似文献   

4.
遥感图像BNs分类分为预处理、BNs模型构建和分类3个前后联系的过程。其中对预处理技术是后面两个步骤的基础,其算法实现过程对分类结果的影响很大,预处理的目标是高效、准确地提取图像分类所需要的重要特征,剔除干扰因素。该文介绍了一种简单数据预处理技术和其算法实现过程。针对遥感数据的特点和BNs方法的需要,将该预处理过程分成波谱空间分割和关系信息计算两个部分,分别介绍了两部分的原理并给出了实现的算法。对于遥感数据分类预处理技术的研究和实现具有很强的借鉴作用。  相似文献   

5.
编译预处理是C/C++语言提供的一种重要而又特殊的功能。,文章在总结了编译预处理优缺点的基础上,结合实例介绍了利用编译预处理在可执行文件中嵌入大批量数据的一种方法,并讨论了这种方法实现数据嵌入程序的优点,  相似文献   

6.
高速公路挖掘数据预处理的研究   总被引:1,自引:1,他引:1  
将数据挖掘技术应用于高速公路系统中,利用挖掘得到的模式对高速公路管理提供有效支持,数据预处理关系到收费数据的挖掘质量,针对丢卡、坏卡、回头车等存在的问题,对数据预处理进行了改正,并给予算法实现。  相似文献   

7.
多维2型糖尿病实测数据的预处理技术   总被引:1,自引:1,他引:0  
罗森林  成华  张铁梅  曾平  陈峰 《计算机工程》2004,30(17):178-181
多年积累的实测糖尿病数据是一项重要的不可再生资源,对其数据的有效管理、处理、利用是一项非常必要和有意义的工作。该文就经过长期积累的2万多人次的调查和实测数据进行了有效的前期处理,其中涉及健康调查表内容以及原始数据的正确录入,对存入数据库的原始数据实施的数据清理、数据变换和数据规约3项预处理技术。2型糖尿病数据的预处理可以消除数据中的噪声、不完整和不一致性,实现数据的归一化和有效压缩,从而形成高质量的数据,可使数据的再处理(统计、数学建模、数据挖掘等)更加有效。此外,经预处理过的数据还可以作为一种重要的资源加以长期保存。  相似文献   

8.
针对常见的图像预处理系统中由上位机实现图像预处理的过程。利用FPGA并行处理的特点,提出了将基于摄像头的图像获取与基于FPGA的图像预处理技术相结合的方法。在图像获取阶段,通过摄像头进行图像数据的获取并将图像数据传输给SDRAM存储,同时在FPGA中实现图像预处理,以及使用以太网将图像数据传输给上位机,最终实现图像获取、预处理与传输。仿真结果表明,该方法相较于传统的图像预处理与传输方法能够实现稳定,实时的图像预处理与传输。  相似文献   

9.
田臣  周丽娟 《计算机应用》2019,39(6):1707-1712
针对信用评估中最为常见的不均衡数据集问题以及单个分类器在不平衡数据上分类效果有限的问题,提出了一种基于带多数类权重的少数类过采样技术和随机森林(MWMOTE-RF)结合的信用评估方法。首先,在数据预处理过程中利用MWMOTE技术增加少数类别样本的样本数;然后,在预处理后的较平衡的新数据集上利用监督式机器学习算法中的随机森林算法对数据进行分类预测。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在UCI机器学习数据库中的德国信用卡数据集和某公司的汽车违约贷款数据集上的仿真实验表明,在相同数据集上,MWMOTE-RF方法与随机森林方法和朴素贝叶斯方法相比,AUC值分别提高了18%和20%。与此同时,随机森林方法分别与合成少数类过采样技术(SMOTE)方法和自适应综合过采样(ADASYN)方法结合,MWMOTE-RF方法与它们相比,AUC值分别提高了1.47%和2.34%,从而验证了所提方法的有效性及其对分类器性能的优化。  相似文献   

10.
利用数据预处理技术,将脑卒中发病病例信息数据中的大量信息进行处理,去除了数据中的数据不一致、冗余、错误信息等,提高了数据质量,有助于筛选出相对可靠的数据,从而有利于得出真实、准确的数据分析结果.  相似文献   

11.
锌精馏塔的混合故障诊断方法   总被引:1,自引:0,他引:1  
丁云飞  许维东  潘峰 《计算机工程》2004,30(23):171-173
以锌精馏塔为研究对象,在利用小波分析进行数据预处理的基础上,将专家系统、模糊控制、神经网络等先进的理论和技术有机的结合起来,提出了模块化的混合故障诊断系统,实现对整个锌精馏塔生产系统的状态监测和故障诊断。  相似文献   

12.
大数据时代网络数据库存储内容与类型呈海量增长,数据库访问用户与访问量数以万亿、亿计。文章利用云计算等先进技术对网络数据库进行优化,基于云计算等技术重新设计一种面向大数据的网络数据库,实现平台操作设计、集群模块搭建以及数据整合与预处理等。基于云计算等技术对网络数据库进行优化,是实现网络数据库存储容量提升,全面优化大数据时代网络数据库并发性、提高海量数据状态下网络数据库利用率的重要举措。  相似文献   

13.
异构数据库数据集成的研究与实现   总被引:6,自引:1,他引:6  
由于企业间数据的交互和共享越来越广泛,迫切需要对异构数据库数据进行集成。根据异构数据集成的需要.提出了利用XML技术集成异构数据库数据源的一个框架。框架核心部分由3层结构组成,综合管理层负责数据抽取和数据交互,XML数据库层负责数据预处理和查询,装配管理层根据需要过滤和组装数据,最终得到需要的数据。用Java编程实现了一个原型系统,对Oracle和SOL server实际数据源做了数据集成测试。实验结果证明该架构是一个较优的解决方案。  相似文献   

14.
数据挖掘中的数据预处理模型与算法研究   总被引:10,自引:0,他引:10  
本文首先介绍了数据预处理的概念,然后将数据预处理无缝集成于数据仓库的构建过程中,提出了一种数据预处理过程模型。对于不同阶段所使用的数据预处理技术和算法,本文也进行了总结分析,并以粗糙集的属性约简为例给出了一种算法的具体实现步骤。  相似文献   

15.
数据源是数据挖掘应用的关键,目前数据库技术的不断发展使得在建立数据源时必须面对异构数据库问题。该文主要对如何在异构数据库中建立数据源进行研究,并利用XML技术在异构数据库中建立数据源模型,且提出了提出了数据转换和预处理技术,利用这两个技术解决在数据库中异构数据如何建立数据源的问题。  相似文献   

16.
基于Web挖掘的网页清洗技术   总被引:1,自引:0,他引:1  
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。  相似文献   

17.
嵌入式零树编码在天气雷达回波数据压缩中的应用   总被引:1,自引:0,他引:1  
本文研究基于小波零树编码的天气雷达立体扫描数据压缩算法。根据雷达回波数据的特点,提出了一种有效的雷达数据预处理方案,然后利用Shapiro的嵌入式小波零树算法对预处理后的图像数据进行压缩实验。实验结果表明,该雷达回波数据压缩算法,在低比特率情况下,仍有很高的PSNR值和满意的主观效果。  相似文献   

18.
通过分析Web日志数据源的不准确性,提出了对Web日志数据源进行数据预处理的技术。结合实例详细介绍了数据净化、用户识别、会话识别、路径补充和事务识别等数据预处理技术。  相似文献   

19.
电子病历数据预处理技术   总被引:3,自引:0,他引:3  
多年积累的电子病历是一项重要的不可再生资源,对其数据的有效处理、利用是一项非常必要和有意义的工作。本文研究了电子病历数据前期处理的相关技术,涉及从电子文档资料到基础数据库的转换,对存入数据库的数据实施数据清理和数据变换等。通过数据预处理可以消除数据中的噪声、不完整和不一致性,实现数据的规范化和有效压缩,从而形成高质量的数据,可使数据的再处理(统计、数学建模、数据挖掘等)更加有效。  相似文献   

20.
殷美桂 《现代计算机》2023,(20):104-108
大数据背景下,构建网络舆情系统能有效、及时地对舆情进行监督和引导。利用Python Django+Vue前后端分离技术方案搭建基于B/S的网络舆情系统。服务器端采用Scrapy框架爬取新浪微博的学校舆情数据,数据预处理后进行情感倾向分析;客户端展示网络舆情分析的结果。系统具有扩展性强、操作简单等特点,解决了学校网络舆情监管问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号