首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
Zipf定律与汉字字频分布   总被引:7,自引:0,他引:7  
本文证明了在以Zipf定律描述整个汉字字频分布时,不管如何精心挑选参数a和c ,一些累计拟合频率都有明显的误差。针对这一现象,本文提出了一个解决办法,那就是以Zipf定律仅描述汉字字频分布的尾部的方法。  相似文献   

2.
基于属性相关性的属性约简新方法   总被引:7,自引:0,他引:7  
文章给出了一个基于粗糙集理论的属性相关性的新定义,并在此基础上给出了基于属性相关性的属性约简新方法。本算法不但能过滤掉属性集合中的无关属性,而且能有效地找到属性集合中的冗余属性,从而得到满意的属性约简。对UCI机器学习数据集的测试结果也验证了算法的有效性。  相似文献   

3.
网格密度峰值聚类在兼顾密度峰值聚类算法可识别任意形状类簇的基础上,通过数据集的网格化简化整体计算量,成为当前备受关注的聚类方法.针对大规模数据,如何进一步区分稠密与稀疏网格,减少网格密度峰值聚类中参与计算的非空网格代表点的数量是解决“网格灾难”的关键.结合以网格密度为变量的概率密度分布呈现出类Zipf分布的特点,提出一种基于Zipf分布的网格密度峰值聚类算法.首先计算所有非空网格的密度并映射为Zipf分布,根据对应的Zipf分布筛选出稠密中心网格和稀疏边缘网格;然后仅对稠密中心网格进行密度峰值聚类,在自适应确定潜在聚类中心的同时减少欧氏距离的计算量,降低算法复杂度;最后通过对稀疏边缘网格的处理,进一步优化类簇边界并提高聚类精度.人工数据集和UCI数据集下的实验结果表明,所提出算法对大规模、类簇交叉数据的聚类具有明显优势,能够在保证聚类精度的同时降低时间复杂度.  相似文献   

4.
作为文献计量学重要定律的Zipf定律已在许多领域得到较广泛的应用,网络信息计量学伴随着网络信息的激增而受到人们越来越大的关注。该文结合搜索结果数量的分布情况,提出了在网络信息计量学中仍然存在Zipf定律的猜想,并采用公开的词语集在几个代表性的搜索引擎中进行实验验证,证实了搜索结果数目近似服从Zipf定律的结论,其中Baidu与So搜索结果的Zipf指数为0.003。  相似文献   

5.
许可  雷建军 《计算机应用》2015,35(12):3341-3343
针对无线传感器网络(WSN)中感知数据易缺失问题,提出了一种基于感知数据属性相关性的缺失值估计方法。该方法采用多元线性回归模型,对属性相关的感知数据的缺失值进行估计;同时,为提高算法估计的鲁棒性,提出了基于感知数据属性的数据交织传送策略。仿真结果表明,所提出的估计方法能有效估计无线传感器网络中的缺失值,相比基于时空相关性的线性插值模型(LM)算法和传统的最近邻插值(NNI)算法具有更高的精度和稳定性。  相似文献   

6.
阚峻岭  李锋刚 《计算机工程》2010,36(24):167-168
属性的选择和评价是知识基系统设计中的重要任务和影响系统性能优劣的关键因素。为此,利用遗传算法的遗传算子搜索机制和相关性分析的启发式作为评价机制,提出一种新颖的属性选择策略,用于从属性集中选择给定案例最优的属性子集。实验结果表明,该方法可以确定与分类和预测最相关的属性子集,同时在几乎不降低分类准确性的情况下,极大地减小属性的表示空间。  相似文献   

7.
曹猛  田青  马廷淮  陈松灿 《软件学报》2019,30(7):2188-2207
近年来,人脸属性估计因其广泛的应用而得到了大量的关注和研究,并且很多估计方法被提了出来.主要对现有相关工作进行归纳总结,为研究者提供相关参考.首先,根据是否考虑人脸性别、年龄、人种等不同属性间的内在关联,将现有的人脸面部属性研究方法划分成朴素的研究方法和自然的研究方法这两大类进行总结介绍.然后,从单一人脸数据库标记不完备、现有方法未能完备利用多属性联合估计、现有方法未能很好地利用各面部属性间关系这3个方面阐述当前方法的不足.最后,给出关于人脸面部属性估计进一步的研究方向.  相似文献   

8.
基于属性相关性的决策树规则生成算法   总被引:5,自引:0,他引:5  
范洁  常晓航  杨岳湘 《计算机仿真》2006,23(12):90-92,103
决策树方法因结构简单、便于理解和具有较高的分类精度而在数据挖掘中被广泛采用,其规则生成算法实现对决策树规则的提取和化简。属性相关性分析的基本思想是计算某种度量,用于量化属性与给定概念的相关性。提出了一种基于属性相关性的c4.5决策树规则生成算法c—c4.5rules,可替代c4.5原有的规则生成算法。c—c4.5rules在对规则进行化简时充分考虑了属性之间的关联性,实验表明该算法在保持原有分类精度的前提下,能有效提高规则生成时的计算速度和效率。  相似文献   

9.
高钰  刘国华 《计算机工程》2008,34(3):105-107
选择性估计是设计空间数据库查询优化器的基础。该文利用空间对象的MBR缓冲区和线段缓冲区,根据数据集在空间连接时的特点和特征数据的分布规律,提出了一种基于点缓冲区的选择性估计方法,用于特征数据的距离连接选择性估计。实验证明,该方法能较好地应用于特征数据的距离连接选择性估计中,较为准确地对特征线段集的距离连接作出估计,明显减少特征数据在估计时的相对误差。  相似文献   

10.
基于模糊多属性决策的目标威胁估计方法   总被引:7,自引:0,他引:7  
针对目标威胁估计的功能及特点,提出一种属性为区间数且属性权重完全未知,决策者对方案有偏好的多属性决策(MADM)方法.首先给出方案偏好度的计算公式,在综合考虑客观优化排序和决策者对方案有主观偏好的基础上,建立了一种主客观综合属性权重获取模型,使得属性权重信息更加合理地反映实际情况,模型具有较强的泛化能力.最后,通过防空目标威胁估计实例说明了该方法的实用性和有效性.  相似文献   

11.
查询选择率估计是查询处理和优化中的关键之一。提出一种基于区域分布密度的方法,用于构造直方图,使其每个桶具有均匀分布或近似均匀分布,利用直方图估计查询选择率。实验结果表明,该方法对低维数据估计得到的查询选择率精度较高,并能对高维数据进行估计。  相似文献   

12.
空间查询优化是空间数据库中的关键问题之一,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法,而估算代价的主要问题是估算查询结果(选择率)的大小。针对空间数据库中最常用的两种查询—空间选择和空间连接,阐述了几种主要用于查询选择率佑计的直方图算法,并对各算法的优缺点做了分析,最后对空间查询选择率估计的研究方向进行了展望。  相似文献   

13.
基于二次相关的时延估计方法   总被引:3,自引:0,他引:3       下载免费PDF全文
唐娟  行鸿彦 《计算机工程》2007,33(21):265-267
在研究广义相关时延估计方法和二次相关时延估计方法的基础上,将自相关和互相关结合起来,分别对不同噪声背景下的平稳窄带信号进行了时延估计,从理论上指出了二次相关法的可行性及其适用条件。实验仿真的结果表明,与一次相关法相比较,二次相关法可在更低信噪比的情况下,取得较高的时延估计精度。  相似文献   

14.
基于时空相关性的自适应运动估计方法   总被引:6,自引:0,他引:6  
洪波  庄健敏  余松煜 《计算机工程》2000,26(8):50-51,57
图象序列中,在时间和空间上相邻的运动信息之间具有很强的相关性,利用这种相关性可以得出了一个初始运动矢量,然后再根据这个初始运动矢量对当前块的运动类型进行分类,决定下一步搜索范围的大小,实验表明:这种运动估计方法性能接近全搜索方法,计算复杂度却大大降低了。  相似文献   

15.
朱红  丁世飞 《计算机科学》2016,43(2):95-97, 128
提出了一种基于属性区分能力和AP聚类的属性粒化方法(Attribute Granulation based on attribute discernibility and AP algorithm,AGAP)。该方法首先依据属性依赖度计算属性的区分能力;然后将所有属性作为潜在的聚类中心,使用AP算法聚类,得到若干个属性簇类;最后采取选用代表属性的方法得到较粗的属性粒子,从而达到属性粗粒化的要求。对高维数据的特征降维,这种算法比传统的属性约简算法大大提高了运算效率,在属性粒化精度要求不是很严格的情况下,所提算法优势明显。  相似文献   

16.
提出了一种基于鲁捧统计和相位相关法相结合的全局运动估计算法;由于相位相关法利用图像的功率谱信息,减少了对图像内容的依赖,具有一定的抗噪能力,因此该算法将块匹配法与相位相关相结合来计算图像间的运动矢量场,不仅减少了运算量而且能得到更加准确的矢量场;为了提高模型参数估计精度和运算效率,运用多分辨率鲁棒统计的方法来计算运动估计模型参数;航拍视频图像配准与独立运动检测的仿真结果均验证了算法的有效性。  相似文献   

17.
为了更好地消除视频中空间和时间冗余,快速并有效地获得足够精度的运动矢量,本文提出一种改进的自适应十字搜索算法。本文算法利用时间空间域相关来预测当前块的运动矢量,对于视频的边缘图像采取固定小步长来进行十字搜索,对于图像的非边缘部分则采取由粗到精的方式进行搜索,搜索模板的自适应臂长为预测得到的目标运动矢量的横纵坐标的最大值。通过实验仿真比较传统的自适应十字搜索算法及其他几种经典的运动估计算法,结果表明本文算法增强了搜索预测的准确性,减少了平均每块搜索的次数,提高了搜索速率。  相似文献   

18.
在分析宏块时空相关性的基础上,对双十字形运动估计算法进行改进,加入了搜索起点预测策略、自适应的搜索模式和自适应搜索终止准则,设计了一种快速运动估计算法。采用JM86算法对改进前后的算法进行比较,实验结果表明,改进后的算法没有明显降低恢复后的图像质量,但计算速度提高了4倍左右,特别适合于处理能力有限的嵌入式系统使用。  相似文献   

19.
一种基于属性重要性的变精度粗糙集属性约简算法   总被引:1,自引:0,他引:1  
结合胡可云算法中对属性重要性的描述,以条件属性在可辩识矩阵中出现的频率作为启发信息,提出一种基于变精度粗糙集模型的属性约简算法.实验证明,该方法能够有效地对决策表进行属性约简,并具有一定的抗噪声能力.  相似文献   

20.
王蓉  刘遵仁  纪俊 《计算机科学》2018,45(7):197-201, 229
作为经典Pawlak粗糙集的扩展,邻域粗糙集能有效处理数值型的数据。但是,因为引入了邻域粒化的概念,所以邻域实数空间下的计算量要比经典离散空间下的计算量大得多。对于邻域粗糙集算法而言,能够有效且快速地找到数据集的属性约简是十分有意义的。为此,针对现有算法中属性重要度定义的不足,首先提出了一种改进的投票式属性重要度,然后进一步提出了一种基于投票式属性重要度的快速属性约简算法。实验证明,与现有算法相比,在保证分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号