排序方式: 共有89条查询结果,搜索用时 15 毫秒
61.
62.
基于约简数据集的FCM聚类算法 总被引:1,自引:0,他引:1
为了解决模糊C-均值(FCM)聚类算法在使用欧氏距离计算样本与类中心点的距离时计算量大的问题,提出了一种基于属性约简的FCM聚类算法.该算法根据粗糙集理论对初始数据进行属性约简,消除数据对象中的冗余值,然后再对约简后的属性集进行模糊聚类.实验结果表明,该算法能有效减少FCM算法的距离函数计算量,在不降低聚类精度的前提下,提高了FCM算法的执行效率. 相似文献
63.
64.
“火警119”系统中通往火场最短行车路线的快速生成 总被引:1,自引:0,他引:1
“通往火场最短行车路线的确定”是”火警119系统”中要解决的问题之一。结合GIS的特点,设计了城市交通网的新的数据存储结构,并在此结构基础上实现了相应的最短路径算法,最后快速生成通往火场的最短行车路线。 相似文献
65.
针对现有算法对用户兴趣在跨网络用户身份识别中作用的忽视以及时间复杂度高的问题,提出了基于用户兴趣的跨社交网络用户身份识别算法(UI-UI)。首先利用分块思想对用户节点进行初筛选,以提升算法效率、降低时间复杂度;其次,根据用户产生内容(UGC)和用户社交关系对用户兴趣进行建模,并计算兴趣相似度作为身份识别的依据;最后利用半监督学习的方法进行跨网络用户身份识别。通过在真实社交网络中进行实验,结果表明UI-UI算法能有效识别跨网络用户,且准确率和召回率稳定,运行时间显著减少。 相似文献
66.
67.
基于内码序值聚类的相似重复记录检测方法* 总被引:4,自引:2,他引:2
检测和消除相似重复记录是数据清理和提高数据质量要解决的关键问题之一,针对相似重复记录问题,提出了基于内码序值聚类的相似重复记录检测方法。该方法先选择关键字段或字段某些位,根据字符的内码序值,利用聚类思想将大数据集聚集成多个小数据集;然后,通过等级法计算各字段的权值,并将其应用在相似重复记录的检测算法中;最后,在各个小数据集中检测和消除相似重复记录。为避免关键字选择不当而造成记录漏查问题,采用多趟检测方法进行多次检测。通过实验表明,该方法具有较好的检测精度和时间效率,能很好地应用到中英文字符集,通用性很强, 相似文献
68.
69.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。 相似文献
70.
针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。改进后的聚类算法克服了阈值选取对聚类结果影响的问题,提高了聚类精确度和时间效率。采用树形结构存储聚簇,增加了聚簇的可读性。实验结果证明了该算法的有效性。 相似文献