首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
研究基于关联度挖掘的海量网络文本挖掘方法;随着计算机和网络技术的快速发展,网络上的文本呈现海量增长的趋势,传统的网络文本挖掘方法采用基于特征提取的方法实现,能够实现小数据量下的文本挖掘,但是在信息量的快速增长下,传统方法已经不能适应;提出一种基于关联度挖掘的海量网络文本挖掘方法,首先采用特征提取的方法对海量文本进行初步的分类和特征识别,然后采用关联度挖掘的方法对各个文本特征之间的关联度进行计算处理,根据关联度的大小最终实现文本挖掘,由于关联度可以很好的体现特征文本之间的相互关系;最后采用一组随机的网络热门词汇进行测试实验,结果显示,算法能够很好适应海量文本下的挖掘实现,具有很好的应用价值。  相似文献   

2.
针对在云计算环境下海量音乐资源挖掘的定位检索准确性不高的问题,对云计算环境下海量音乐资源的定位挖掘方法进行改进设计,提出基于自适应级联检索控制的海量音乐资源的高精度定位挖掘方法。首先对海量音乐资源库的数据信息按关键词和音乐类型进行语义特征分割和时间序列状态空间重构,然后进行云计算环境下海量音乐资源的自相关特征提取,以提取的自相关特征为信息素导引进行高精度定位挖掘,采用自适应级联检索控制模型进行挖掘精度控制。最后进行仿真分析,结果表明,该方法能提高音乐资源的定位挖掘精度,提高资源利用率和检索的数据查准率。  相似文献   

3.
《现代电子技术》2017,(24):34-36
为了提高大数据的分类识别和检索性能,需要进行大数据优化挖掘,故提出一种基于弱关联性指数特征分布提取的大数据分类挖掘方法。对大数据信息流采用稀疏性融合方法进行聚类空间划分,通过自相关特征匹配方法进行大数据高维分形特征重组,采用向量量化方法进行大数据的基元分类的收敛性控制,提取大数据信息流的弱关联性指数特征,实现大数据的优化分类和挖掘。仿真结果表明,采用该方法进行大数据分类挖掘,提高了大数据挖掘检索的查准性和查全性,挖掘的准确性较高,抗干扰能力较好。  相似文献   

4.
《现代电子技术》2018,(6):137-140
传统支持向量机挖掘方法可以对领域数据实现挖掘,但在复杂多变环境下数据挖掘离散程度较大。提出海量数据的支持向量机优化挖掘方法,构造静态粒子空间,局限海量数据挖掘离散程度,形成小规模的、多簇团的粒子挖掘数据集;将单粒子挖掘数据进行离散性拟合,以多簇团粒子整合离散运算,保证挖掘计算进行周期性运行;对同轨挖掘计算进行条件约束,实现小离散程度的数据挖掘。仿真实验验证结果表明,支持向量机优化挖掘方法在复杂多变环境下具有较高的稳定性,并且挖掘离散度小、挖掘信息精度较高。  相似文献   

5.
《现代电子技术》2017,(1):53-56
针对传统的图像挖掘算法对小差异性图像特征挖掘精度不高的难题,提出一种基于不变矩特征提取的海量小差异图像高精度挖掘算法,通过构建图像的边缘检测和种子点分割模型,再采用小波降噪进行抗干扰处理,通过曲面约束进行相似图像的解释散点特征提取,根据海量小差异图像的旋转平移和尺度的不变性,实现对小差异图像的特征分辨和高精度挖掘。实验测试结果表明该算法能提高海量小差异图像挖掘的精度。  相似文献   

6.
《现代电子技术》2017,(24):18-20
在大型Web网络数据中心构架中包含海量的多媒体信息资源,为了高效挖掘资源,提高资源的调度能力,提出一种基于模糊语义本体映射的大型Web网络数据中心资源高效挖掘技术。对大型Web网络数据中心的资源信息流进行信息流重建,采用泛化学习方法进行资源信息流的模糊聚类处理,结合语义本体映射方法实现互信息特征提取,以提取的特征为训练集,进行数据迭代,实现资源优化挖掘。仿真结果表明,采用该方法进行大型Web网络数据中心资源挖掘的准确性较好,资源调度的效率得到提高。  相似文献   

7.
4G时代的到来,各大通信运营商业务迅速发展,客户投诉量也飞速增长。不同于传统投诉只是为了收集客户反馈,为客户提供更好的服务,如今大数据时代的到来,海量的投诉数据更是一个宝藏库,不但可以使得运营商对于客户的投诉做出更快的反应,而且能挖掘出新的业务增长点,寻求更大的商业价值。在此背景下,本中挖掘技术得以发挥巨大作用。文本挖掘技术是数据挖掘技术的一种。要进行文本挖掘首先需要对海量投诉数据进行建模。文中通过对非结构化的运营商海量投诉数据利用向量空间模型进行数据建模并利用关联规则进行优化从而实现向量降维,达到了建立并简化向量空间模型的目的,提高了文本挖掘的效率。  相似文献   

8.
为解决常用光纤网络异常节点数据挖掘方法耗时长、精度低的问题,提出一种可应用于大规模光纤网络的异常节点数据深度挖掘方法。预处理光纤网络节点数据,提取信息熵特征,并对数据进行降维操作,引入随机森林算法,通过自助采样形成多个随机样本空间,通过投票机制合并处理并输出树群中各棵子树光纤网络异常节点数据深度挖掘结果,实现光纤网络异常节点挖掘。实验结果表明,所提方法的精确度高达99.8%,耗时仅为9.2 min,漏检率为0.12%,因此,该方法可以获取高效率、高精度的光纤网络异常节点数据深度挖掘结果。  相似文献   

9.
《现代电子技术》2017,(13):178-180
针对传统云端计算过程中的数据特定信息提取不精确的问题,提出一种云计算环境下的海量数据特定特征挖掘方法。采用矩阵节点差分模型进行数据的有序排列,避免传统方法中的数据混乱造成提取数据不精确,庞大的云端数据量致使数据的定位不精准,为了避免此类问题的产生,使用多维数据定位计算,能够有效地解决定位不准的问题,最终可以成功的对数据信息进行有效提取。为了验证设计云计算环境下的海量数据特定特征挖掘方法的有效性,设计了对比仿真实验,实验结果充分证明了该方法能够有效地解决数据提取不精确的问题。  相似文献   

10.
在移动互联网发展背景下逐渐呈现出海量数据传输特点,同时,在海量数据传输过程中数据深度、广度均得到发展,为此,在数据价值多元化发展领域中,应注重针对信息通信网络运营管理环境中网络告警关联规则挖掘进行分析,然后,在群体智能视角下,优化挖掘算法,满足信息通信网络中数据资源管理需求,打造良好的数据传输空间,提供良好的信息通信网络环境。本文从通信网络告警关联规则分析入手,并详细阐述了挖掘算法的具体应用。  相似文献   

11.
充分研究新型的数据前期预处理及金融数据联系的一些时间变量的预处理方法,提出一种基于清洗关联规则的金融数据挖掘算法.引入关联规则的分析在一定支持度的约束下研究和金融紧密相关的一些因素,在应用过程中随着算法的开展,对重点部门与重点功能进行观测与预警.实验证明,该方法可以更加准确的进行金融数据状态的跟踪,挖掘效率更高.  相似文献   

12.
近年来,随着经济的飞速发展,社会逐渐步入信息化社会。相比传统数据挖掘系统,基于云计算的数据挖掘平台是新时代的科技产物,具有得天独厚的优势,其处理海量数据的能力、面向服务、高度扩展性等特点受到各行各业广泛的关注和认可。文章首先概述了云计算的概念以及服务范围,之后分析基于云计算的数据挖掘平台架构,并且提出相关的技术指导建议。  相似文献   

13.
在云计算环境下,Web数据挖掘技术得到了快速发展。由于云计算的应用,Web数据挖掘体系已体现出新的特点。分析云计算环境下Web数据挖掘技术的特点,可以明确应用要点,可以实现云计算在数据存储中的突破,实现存储的能力与安全性的提高。从海量数据中高效挖掘有价值的资源,属于信息技术要解决的关键问题。云计算技术支持下的数据挖掘实现了资源的优化配置,体现出实用性、虚拟性的特点,可以保证数据挖掘的高效、精准。因此,有必要构建基于云计算的数据挖掘模式,保证数据挖掘具有更高的精准度,并实现挖掘成本的降低。  相似文献   

14.
本文基于4G/5G数据挖掘分析给出了一种NSA组网下5G Massive MIMO天线权值智能优化方法。该方法结合4G MDT和5G MR数据,采用聚类和成形算法分析得到待优化小区理想权值集合,可以在海量权值因子中快速寻优得到最优权值组合,采用基于风险控制的调整算法实现Massive MIMO天线权值智能自动化迭代寻优。  相似文献   

15.
王素珍 《信息技术》2022,(2):156-160,166
为了提升财务管理预警精确度,构建基于数据挖掘的财务管理预警模型.首先利用财务管理预警指标体系,然后通过数据挖掘技术中的决策树算法实现财务环境和财务活动中财务风险的有效预警,最后进行了财务管理预警仿真实验,试验结果表明,该模型的预警精准度可达98%,可清晰判断财务指标异常情况,具有较高的实际应用价值.  相似文献   

16.
文章指出,大数据技术现在越来越成熟,大大提高了数据信息的利用率,尤其是大数据挖掘技术可以从海量的数据中挖掘具有价值的信息,为社会的生产生活提供更大的助力.基于大数据自身所具有的数量大、多样性突出等特点,在进行数据挖掘时,想要达到较高处理速度、效率以及实时性效果,还需要不断地进行研究.Spark平台是一个针对超大数据集合...  相似文献   

17.
在分析多功能雷达数据特点的基础上,提出基于大数据开展多功能雷达性能阵地现场优化的基本框架,分析大数据应用在数据获取、数据存储、数据处理等方面对雷达的需求,给出大数据应用需重点解决的环境感知与自适应学习、海量数据管理、高价值信息挖掘、基于评估结果反馈的系统参数优化等关键技术问题,为未来大数据在多功能雷达性能阵地现场优化中的工程应用提供借鉴和支撑。  相似文献   

18.
运用大数据挖掘原理,对海量3G终端MR数据进行深入研究。从解决用户感知、用户体验方面入手,寻找网络质量规律,并在优化实例中予以应用。丰富了优化手段,取得良好效果,提高了优化效率,为深度优化提供了新思路。  相似文献   

19.
The massive scale and variability of microarray gene data creates new and challenging problems of signal extraction, gene clustering, and data mining, especially for temporal gene profiles. Many data mining methods for finding interesting gene expression patterns are based on thresholding single discriminants, e.g. the ratio of between-class to within-class variation or correlation to a template. Here a different approach is introduced for extracting information from gene microarrays. The approach is based on multiple objective optimization and we call it Pareto front analysis (PFA). This method establishes a ranking of genes according to estimated probabilities that each gene is Pareto-optimal, i.e., that it lies on the Pareto front of the multiple objective scattergram. Both a model-driven Bayesian Pareto method and a data-driven non-parametric Pareto method, based on rank-order statistics, are presented. The methods are illustrated for two gene microarray experiments.  相似文献   

20.
随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有支持频繁更新的索引树性能大都深受处理器缓存失效率的影响,提出了一种新颖的基于双Memo的量化R*索引树-QDM-Tree(Quantized R*-tree with Double Memos),并给出了相应的插入、删除、更新和范围查询算法,理论分析表明:与已有R*树及其变种相比,该索引树能成倍地压缩树结点,具有更强支持频繁更新的能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号