首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 937 毫秒
1.
使用Web数据挖掘技术对用户需求进行分析,其中实现Web信息个性化使用的是关联规则,这一规则能够为用户提供个性化服务,目前已成为Web应用技术的研究热点。该文分析了应用于个性化推荐的Web页面关联规则的特点,对Web数据挖掘技术常用的关联推荐算法进行探讨,内容主要涉及到Web数据挖掘技术、关联推荐算法的思路、算法分析。  相似文献   

2.
仲波  张远平 《科学技术与工程》2006,6(24):3863-38663870
基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对包含三个属性值的序数型数据进行伪装的方法.设计了在伪装的数据集上进行挖掘的算法;分析了算法的安全性及复杂度。并通过实验表明,该算法在伪装的数据集上挖掘出来的规则与原规则相比,相对误差不超过5%。  相似文献   

3.
快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
刘景春 《佳木斯大学学报》2004,22(2):151-156,177
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题.  相似文献   

4.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

5.
现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系.但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则.针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和...  相似文献   

6.
在约束子集定义的基础上,提出面向旅游景点推荐的约束关联规则挖掘算法,将最为耗时的目标项集搜索限定在约束子集中,降低了数据集搜索的规模. 同时通过约束条件提升了最终规则生成的针对性,避免大量无趣规则的生成,使得挖掘算法效率更高、挖掘结果更符合用户需求. 最后在望路者文化旅游服务数据集中开展了示范应用研究,验证了所提出的算法可为旅游景点推荐提供更为合理的信息.  相似文献   

7.
针对“挖掘不同支持度下的关联规则需要反复扫描多维数据库所带来大量的系统I/O开销”这一缺限,提出一种基于中间存储的联机分析关联规则挖掘OLAM方法.在自行开发的联机分析处理OLAP的基础上,对待分析的多维数据集利用BCTree存储谓词集频度索引数,利用改进的Apriori关联规则挖掘算法分析用户感兴趣的维度,减少挖掘维度的个数,提高了反复挖掘的系统效率和系统针对性.生产数据证明了该方案的正确性和有效性.  相似文献   

8.
在分析类Apriori算法存在效率瓶颈的基础上,提出了一个高效改进算法——基于分类树的关联规则挖掘算法.该算法只需要两次访问数据库,把数据库中的数据利用分类树来存储,减少了访问数据库的次数;并且由分类树的全部或部分来求得频繁项目集,减少了求频繁项目集的比较次数.此算法通过结合Apriori和FP—tree两种算法来提高挖掘效率,降低了挖掘算法的时间复杂度和空间复杂度.通过多次试验证明该算法比Apriori及其改良算法的挖掘效率高2到8倍.  相似文献   

9.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

10.
基于关联规则挖掘技术,结合销售数据特征,提出了一个基于SQL的多层关联规则挖掘算法,允许用户自定义概念层次.实验结果表明,该算法可行且有效,有良好的用户交互性,能够支持品类管理中高效陈列和促销的应用.  相似文献   

11.
基于Web数据挖掘的文献个性化推荐系统的设计   总被引:1,自引:0,他引:1  
基于数据挖掘的Web个性化信息推荐服务日益成为一个重要的应用技术,通过使用FP-tree关联规则挖掘算法对用户文献阅读信息进行分析,发现用户的阅读习惯和阅读兴趣,进而为用户进行个性化的文献推荐,从而提高网站对用户的吸引力。  相似文献   

12.
在关联规则挖掘中,大量的数据是多维的,且带时间性,根据实际的应用,对传统的算法进行了改进,提出了在商品推荐系统中构建的模型,并与类似算法进行了比较.采用了本文提出的算法后,能够挖掘出小概率项目中蕴涵的关联规则,并考虑到时间的因素,去除了多余的杂质数据,而Apriori算法则无法做到这点.  相似文献   

13.
传统算法计算与存储开销大,影响推荐结果准确性,不适于含大规模数据的人工智能跨境电商导购平台信息的个性化推荐的。为此,通过大数据技术研究人工智能跨境电商导购平台信息个性化算法,使得大数据技术在Hadoop平台实现,通过Map将任务分解成多个任务,采用Reduce将分解后多任务处理结果集合在一起,获取最终处理结果。通过两个MapReduce与一个map对平台中用户偏好获取算法进行并行化处理。针对用户偏好,通过关联规则挖掘获取和用户偏好相符的商品,推荐给用户。结果表明:所提算法推荐准确率、召回率和平均精度均高于其他算法;所提算法推荐商品符合用户偏好;所提算法推荐商品信息点击率与转换率最优。可见所提算法推荐精度高,推荐商品信息可满足用户偏好,应用性强。  相似文献   

14.
Web日志挖掘及AprioriAll算法的改进   总被引:2,自引:0,他引:2  
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.  相似文献   

15.
用户相似度计算的合理性直接影响到协同过滤推荐的效果。提出了一种基于时序行为关系的用户消费网络图构建方法,通过定义用户间非对称相似度计算方法,确定用户间的初始相似度矩阵,然后利用概率矩阵分解的方法重构用户的相似度矩阵,挖掘潜在的用户近邻,将近邻关系应用到目标用户的项目推荐中,同时提出了基于时序行为关系和矩阵分解的协同过滤推荐框架结构。在实际数据集上对具体参数进行实验,并和其他方法进行了比较。实验结果表明,该方法可以有效提高协同过滤推荐效果。  相似文献   

16.
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.  相似文献   

17.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

18.
赵丽坤  王于可 《科学技术与工程》2020,20(28):11647-11652
为提高社交网络个性化服务质量,研究数据周期推荐算法的重大意义,针对传统推荐算法相似度计算准确率不高,导致推荐结果精度低、召回率低和耗时长等问题,提出一种基于人工智能的社交网络用户行为数据周期推荐算法。首先依据用户行为建立评分矩阵,利用皮尔逊相关系数计算评分矩阵评分值与网络行为数据相似度,依据计算得出的相似度以协同过滤为核心来检出需要推荐的社交网络用户数据内容,其次利用Top-N法生成用户邻居集,最后实现社交网络用户行为数据内容周期推荐。实验测试结果表明,所提算法的相似度计算准确率较高,网络用户行为数据周期推荐结果精度可高达97.2%,且推荐结果召回率高、耗时低,提高了社交网络个性化服务质量。  相似文献   

19.
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品.  相似文献   

20.
针对目前多数基于位置的推荐算法中未考虑用户的实时位置和时间因素, 使得推荐缺乏实时性的问题, 提出一种基于区域活跃用户的推荐算法, 以解决传统基于位置的推荐算法中存在冷启动的问题. 首先, 发掘用户当前所在位置的区域活跃用户, 以此作为推荐标准, 为用户进行推荐. 其次, 在位置推荐中引入时间因素, 使推荐更具准确性和实时性. 实验结果表明: 该算法融入的区域活跃用户好友数可提升推荐系统的实时性; 算法融合的位置信息可使推荐更准确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号