排序方式: 共有114条查询结果,搜索用时 15 毫秒
31.
随着图数据收集技术在许多科学领域的发展,对图数据分类已成为机器学习和数据挖掘领域的重要课题.目前已经提出许多图分类方法.其中,一些图分类方法采用3步来构筑分类模型;一些图分类方法采用2步来构筑分类模型.这些方法在挖掘频繁子图或特征子图时,只考虑到子图的结构信息,而没有考虑到子图的嵌入信息.为此,在L-CCAM子图编码的基础上,提出了一种基于嵌入集的图分类方法.该方法采用基于类别信息的特征子图选择策略,不但考虑了子图的结构信息,而且在频繁子图挖掘过程中充分利用嵌入信息——嵌入集,通过一步即直接选择特征子图以及生成分类规则.实验结果表明:在对化合物数据分类时,在分类精度上该方法优于采用3步的图分类方法;在运行效率上该方法优于采用2步和3步的图数据分类方法. 相似文献
32.
基于影响集的协作过滤推荐算法 总被引:21,自引:0,他引:21
传统的基于用户的协作过滤推荐系统由于使用了基于内存的最近邻查询算法,因此表现出可扩展性差、缺乏稳定性的缺点.针对可扩展性的问题,提出的基于项目的协作过滤算法,仍然不能解决数据稀疏带来的推荐质量下降的问题(稳定性差).从影响集的概念中得到启发,提出一种新的基于项目的协作过滤推荐算法CFBIS(collaborative filtering based on influence sets),利用当前对象的影响集来提高该资源的评价密度,并为这种新的推荐机制定义了计算预测评分的方法.实验结果表明,该算法相对于传统的只基于最近邻产生推荐的项目协作过滤算法而言,可有效缓解由数据集稀疏带来的问题,显著提高推荐系统的推荐质量. 相似文献
33.
随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于χ2统计量能很好地体现词和类别之间的相关性,因此成为特征选择中常用的评估函数.本文分析了χ2统计量在特征选择和分类决策阶段的性质,提出了一种新的基于χ2统计量的相似度定义,并结合基于两次类别判定的快速搜索算法,改进了传统的kNN算法.实验结果显示基于χ2统计量的改进kNN文本分类算法能大大减少kNN算法的分类时间,并提高了kNN算法的准确率和召回率. 相似文献
34.
35.
Web使用挖掘技术研究综述 总被引:10,自引:0,他引:10
Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程.该介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术;对将来Web使用挖掘领域的研究问题作了展望. 相似文献
36.
基于矢量量化的层次分形编码方法 总被引:3,自引:0,他引:3
文中提出了一种新的分形图像压缩方法,该方法将矢量量化的概念应用于分形块编码中,对图像的平缓区进行矢量量化的线性组合编码,对图像的丰富细节区用分形编码,并且在分形编码时,采取了层次处理。实验表明,与基本的分形块编码方法相比,本文提出的矢量量化层次分形编码方法在保证一定的重建图像质量下,使图像的压缩比有了明显的提高,并且大大提高了编码和解码速度。 相似文献
37.
38.
Fuzzy(模糊)模式识别是模式识别的一个新分支。文章以Fuzzy集理论及模式识别理论为基础,根据专家提供的并用语言变量描述的CT征象,通过对数字化图象进行边检、分割和特征提取,识别出了小肺癌分叶、毛刺、空泡、星芒、瘤体密度均匀性等特征并描述了识别结果。 相似文献
39.
Fuzzy(模糊)模式识别是模式识别的一个新分支。文章以Fuzzy集理论及模式识别理论为基础,根据专家提供的并用语言变量描述的CT征象,通过对数字化图象进行边检、分割和特征提取,识别出了小肺癌分叶、毛刺、空泡、星芒、瘤体密度均匀性等特征并描述了识别结果。 相似文献
40.
在基于规则的专家系统工具中,对于Rete模式匹配算法有不同的实现方法。本文描述了一个新的证据生成算法,比较理想地实现了其思想。 相似文献