排序方式: 共有12条查询结果,搜索用时 15 毫秒
1.
文本聚类算法的分析与比较 总被引:8,自引:0,他引:8
聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法 ,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。对聚类算法的应用有一定的指导意义 相似文献
2.
《钢铁冶炼》2013,40(1):5-9
AbstractBlast furnace operators mostly depend on the measurements taken from the inputs and outputs in the control of the process to interpret the information available for vertical and radial distribution of variables, such as, heat load on the boundary and the distribution of the gas across the section of the furnace. Gas distribution inside the furnace is largely dependent on the distribution of the burden inside the furnace and its estimation is a challenge to the blast furnace operators. However, the measurement from the above burden probes gives some insight to the radial gas distribution in the shaft. Design of methods for automatic classification of above burden probe (ABP) profile is thus warranted. The self-organising map (SOM) is an excellent tool in the exploratory phase of data mining. It projects input space on prototypes of a low dimensional regular grid that can be effectively utilised to visualise and explore properties of the data. When the number of SOM units is large, to facilitate quantitative analysis of the map and the data, similar units need to be grouped, i.e. clustered. In the present investigation, a model for classification, visualisation and interpretation of ABP profiles has been developed by two stage procedure, i.e. SOM followed by k-means clustering. This classifier has the potential to be a useful tool for operator guidance in daily practice. 相似文献
3.
4.
用户细分可以掌握不同电动汽车用户充电行为的特征及其之间的差异性,对充电服务运营企业具有重要意义。基于运营管理系统迅速积累的大量充电服务数据,对全量数据进行探索性分析,筛选出细分模型关键变量,给出了基于数据挖掘技术和K均值(K_MEANS)聚类算法的电动汽车用户细分方法,提出了电动汽车用户价值评价方法。针对北京地区电动汽车用户开展分析并得到用户行为特征及价值评价结果。相关结论可为运维管理机制优化和精准营销策略制定提供数据支撑。 相似文献
5.
6.
7.
王祥斌 《计算机测量与控制》2012,20(2):321-323,348
随着以太网的快速发展,基于网络的攻击方式越来越多,传统的入侵检测系统越来越难以应付;将数据挖掘技术引入到入侵检测系统中来,分析网络中各种行为记录中潜在的攻击信息,自动辨别出网络入侵的模式,从而提高系统的检测效率;将K- MEANS算法及DBSCAN算法相综合,应用到入侵检测系统,并针对K- MEANS算法的一些不足进行了改进,提出了通过信息嫡理论的使用解决K- MEANS算法选择初始簇中心问题,然后利用其分类结果完善DBSCAN算法两个关键参数(Eps,Minpts)的设置,通过DB-SCAN算法,进一步地分析可疑的异常聚类,提高聚类的准确度. 相似文献
8.
9.
随着互联网内容的快速增长,对于网络内容的快速识别压力越来越大。本文进行基于聚类算法的内容识别研
究,为维护网络安全、网络内容健康,具有非常重要的意义。目前的互联网内容识别方式主要以关键字检索方法进行识别,但
是面对日益丰富的网络内容和不同方式存储在服务器的内容,这种方式已经无法满足实际的需求。从实际问题出发针对互联
网内容中以图形、图像、音频等非结构化数据形式存储在服务器中的内容进行识别,依据互联网内容的发展规律对现有的聚类
算法进行改进,以求能够最大程度地对互联网内容进行筛选和甄别,维护互联网安全。 相似文献
10.
本文研究了视频网站内容监播、监控的规律,并且依据新的规律改进了现有的K-MEANS聚类算法。受互视频内容数据非结构化因素的影响,K-MEANS聚类算法进行聚类识别和计算效率上存在明显的缺陷。K-MEANS聚类改进算法的优势在考虑到了视频帧序列关系,并保持了可接受的检索速度。 相似文献