共查询到20条相似文献,搜索用时 171 毫秒
1.
彭其华 《微电子学与计算机》2013,(10)
研究基于关联度挖掘的海量网络文本挖掘方法;随着计算机和网络技术的快速发展,网络上的文本呈现海量增长的趋势,传统的网络文本挖掘方法采用基于特征提取的方法实现,能够实现小数据量下的文本挖掘,但是在信息量的快速增长下,传统方法已经不能适应;提出一种基于关联度挖掘的海量网络文本挖掘方法,首先采用特征提取的方法对海量文本进行初步的分类和特征识别,然后采用关联度挖掘的方法对各个文本特征之间的关联度进行计算处理,根据关联度的大小最终实现文本挖掘,由于关联度可以很好的体现特征文本之间的相互关系;最后采用一组随机的网络热门词汇进行测试实验,结果显示,算法能够很好适应海量文本下的挖掘实现,具有很好的应用价值。 相似文献
2.
3.
4.
5.
6.
7.
《信息技术》2016,(12)
4G时代的到来,各大通信运营商业务迅速发展,客户投诉量也飞速增长。不同于传统投诉只是为了收集客户反馈,为客户提供更好的服务,如今大数据时代的到来,海量的投诉数据更是一个宝藏库,不但可以使得运营商对于客户的投诉做出更快的反应,而且能挖掘出新的业务增长点,寻求更大的商业价值。在此背景下,本中挖掘技术得以发挥巨大作用。文本挖掘技术是数据挖掘技术的一种。要进行文本挖掘首先需要对海量投诉数据进行建模。文中通过对非结构化的运营商海量投诉数据利用向量空间模型进行数据建模并利用关联规则进行优化从而实现向量降维,达到了建立并简化向量空间模型的目的,提高了文本挖掘的效率。 相似文献
8.
为解决常用光纤网络异常节点数据挖掘方法耗时长、精度低的问题,提出一种可应用于大规模光纤网络的异常节点数据深度挖掘方法。预处理光纤网络节点数据,提取信息熵特征,并对数据进行降维操作,引入随机森林算法,通过自助采样形成多个随机样本空间,通过投票机制合并处理并输出树群中各棵子树光纤网络异常节点数据深度挖掘结果,实现光纤网络异常节点挖掘。实验结果表明,所提方法的精确度高达99.8%,耗时仅为9.2 min,漏检率为0.12%,因此,该方法可以获取高效率、高精度的光纤网络异常节点数据深度挖掘结果。 相似文献
9.
10.
在移动互联网发展背景下逐渐呈现出海量数据传输特点,同时,在海量数据传输过程中数据深度、广度均得到发展,为此,在数据价值多元化发展领域中,应注重针对信息通信网络运营管理环境中网络告警关联规则挖掘进行分析,然后,在群体智能视角下,优化挖掘算法,满足信息通信网络中数据资源管理需求,打造良好的数据传输空间,提供良好的信息通信网络环境。本文从通信网络告警关联规则分析入手,并详细阐述了挖掘算法的具体应用。 相似文献
11.
刘丽峰 《微电子学与计算机》2012,29(5):174-177
充分研究新型的数据前期预处理及金融数据联系的一些时间变量的预处理方法,提出一种基于清洗关联规则的金融数据挖掘算法.引入关联规则的分析在一定支持度的约束下研究和金融紧密相关的一些因素,在应用过程中随着算法的开展,对重点部门与重点功能进行观测与预警.实验证明,该方法可以更加准确的进行金融数据状态的跟踪,挖掘效率更高. 相似文献
12.
近年来,随着经济的飞速发展,社会逐渐步入信息化社会。相比传统数据挖掘系统,基于云计算的数据挖掘平台是新时代的科技产物,具有得天独厚的优势,其处理海量数据的能力、面向服务、高度扩展性等特点受到各行各业广泛的关注和认可。文章首先概述了云计算的概念以及服务范围,之后分析基于云计算的数据挖掘平台架构,并且提出相关的技术指导建议。 相似文献
13.
曾展挺 《智能计算机与应用》2021,11(1):167-169
在云计算环境下,Web数据挖掘技术得到了快速发展。由于云计算的应用,Web数据挖掘体系已体现出新的特点。分析云计算环境下Web数据挖掘技术的特点,可以明确应用要点,可以实现云计算在数据存储中的突破,实现存储的能力与安全性的提高。从海量数据中高效挖掘有价值的资源,属于信息技术要解决的关键问题。云计算技术支持下的数据挖掘实现了资源的优化配置,体现出实用性、虚拟性的特点,可以保证数据挖掘的高效、精准。因此,有必要构建基于云计算的数据挖掘模式,保证数据挖掘具有更高的精准度,并实现挖掘成本的降低。 相似文献
14.
本文基于4G/5G数据挖掘分析给出了一种NSA组网下5G Massive MIMO天线权值智能优化方法。该方法结合4G MDT和5G MR数据,采用聚类和成形算法分析得到待优化小区理想权值集合,可以在海量权值因子中快速寻优得到最优权值组合,采用基于风险控制的调整算法实现Massive MIMO天线权值智能自动化迭代寻优。 相似文献
15.
为了提升财务管理预警精确度,构建基于数据挖掘的财务管理预警模型.首先利用财务管理预警指标体系,然后通过数据挖掘技术中的决策树算法实现财务环境和财务活动中财务风险的有效预警,最后进行了财务管理预警仿真实验,试验结果表明,该模型的预警精准度可达98%,可清晰判断财务指标异常情况,具有较高的实际应用价值. 相似文献
16.
文章指出,大数据技术现在越来越成熟,大大提高了数据信息的利用率,尤其是大数据挖掘技术可以从海量的数据中挖掘具有价值的信息,为社会的生产生活提供更大的助力.基于大数据自身所具有的数量大、多样性突出等特点,在进行数据挖掘时,想要达到较高处理速度、效率以及实时性效果,还需要不断地进行研究.Spark平台是一个针对超大数据集合... 相似文献
17.
18.
运用大数据挖掘原理,对海量3G终端MR数据进行深入研究。从解决用户感知、用户体验方面入手,寻找网络质量规律,并在优化实例中予以应用。丰富了优化手段,取得良好效果,提高了优化效率,为深度优化提供了新思路。 相似文献
19.
The massive scale and variability of microarray gene data creates new and challenging problems of signal extraction, gene clustering, and data mining, especially for temporal gene profiles. Many data mining methods for finding interesting gene expression patterns are based on thresholding single discriminants, e.g. the ratio of between-class to within-class variation or correlation to a template. Here a different approach is introduced for extracting information from gene microarrays. The approach is based on multiple objective optimization and we call it Pareto front analysis (PFA). This method establishes a ranking of genes according to estimated probabilities that each gene is Pareto-optimal, i.e., that it lies on the Pareto front of the multiple objective scattergram. Both a model-driven Bayesian Pareto method and a data-driven non-parametric Pareto method, based on rank-order statistics, are presented. The methods are illustrated for two gene microarray experiments. 相似文献
20.
随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有支持频繁更新的索引树性能大都深受处理器缓存失效率的影响,提出了一种新颖的基于双Memo的量化R*索引树-QDM-Tree(Quantized R*-tree with Double Memos),并给出了相应的插入、删除、更新和范围查询算法,理论分析表明:与已有R*树及其变种相比,该索引树能成倍地压缩树结点,具有更强支持频繁更新的能力. 相似文献