首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
杨泽民 《计算机科学》2013,40(3):259-262
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和寿支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。  相似文献   

2.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

3.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

4.
FP-Growth算法的改进   总被引:1,自引:0,他引:1  
基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担.在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间.实验结果表明,该算法的改进优于经典算法.  相似文献   

5.
在处理战略绩效KPI关联规则挖掘的问题时,由于FP-Growth不能根据业务的需要简化计算过程,从而产生了许多冗余计算,影响了算法的效率。因此,提出了一种基于FP-Growth的战略绩效关联分析算法。通过采用基于规则的约束方法对FP-Growth算法进行改进。一方面,在挖掘的过程中添加剪枝操作,提高频繁项集的挖掘效率;另一方面,在关联规则产生过程中,添加规则约束,生成符合业务要求的关联规则,从而减少了冗余计算,提高了算法的效率。最后,以"某高校科研服务质量指标"为例,验证了该算法的可行性。  相似文献   

6.
数据挖掘是一项热门技术,该技术融合了数据库、统计学等领域知识,关联规则的挖掘则能找出商品销售中商品之间的联系。本文针对Apriori算法,及其改进算法FP-Growth进行了研究,对比了Apriori算法与FPGrowth算法的效率,得出FP-Growth算法由于只需要对数据进行一次扫描即可生成相应的数据集,使其生成数据集的整体效率要高于Apriori算法。  相似文献   

7.
信息系统产生的大量事务日志数据蕴含着潜在的伴随模式,伴随模式是指在时空上频繁共现的一组对象.由于传统的滑动窗口算法和FP-Growth算法只能调用单一线程进行计算,随着数据规模的扩张,会导致挖掘伴随模式的时间急剧增加.为此本文提出了一种基于Fork/Join并行技术的伴随模式挖掘框架,其能够实现从单线程到多线程的迁移,充分利用多核配置的加速性能.该框架由划定伴随数据集、频繁项集挖掘和关联规则挖掘三部分组成.首先,提出了基于Fork/Join的多核并行滑动窗口算法,以缩短从事务日志中划定伴随数据集的时间;然后,提出基于Fork/Join的多核并行FP-Growth算法,以并行地挖掘伴随数据集中的频繁项集;最后,引入支持度、置信度和提升度3个参数,对伴随模式中各对象间的关联规则进行挖掘.基于门禁刷卡数据的实验结果表明,相比传统算法,本文所提出的框架能够挖掘出更多的伴随模式,同时挖掘效率较高.  相似文献   

8.
关联规则挖掘过程中,为了得到侯选项集的支持度,需要将候选项集与数据库中事务逐一进行比较,影响了算法的执行效率.针对该问题,提出一种基于数据立方体的关联规则挖掘算法ABDC.该算法结合了属性分组的思想,将生成的侯选项集进行编码后,利用数据库中事务的包含关系,在数据立方体中迅速查找到包含该侯选项集的所有事务在数据库中的出现频率,依次累加后根据最小支持量得到数据库中存在的频繁项集,不仅对事务数量的递增具有不敏感性,而且提高了算法的执行效率.实验结果表明,该算法对挖掘大量事务集中存在的关联规则是快速有效的.  相似文献   

9.
增量更新关联规则挖掘主要解决事务数据库中交易记录不断更新和最小支持度发生变化时关联规则的维护问题。针对目前诸多增量更新关联规则挖掘算法存在效率低、计算成本高、规则难以维护等问题,提出一种基于倒排索引树的增量更新关联挖掘算法。该算法有效地将倒排索引技术与树型结构相结合,使得交易数据库中的数据不断更新和最小支持度随应用环境不同而不断改变时,以实现无需扫描原始交易数据库和不产生候选项集的情况下生成频繁项集。实验结果表明,该算法只需占用较小的存储空间、且检索项集的效率较高,能高效地解决增量更新关联规则难以维护的问题。  相似文献   

10.
对于经典的关联规则数据挖掘算法,其采用的重复性事务分析策略会导致频繁项集在计算中存在一定的不确定性,从而不利于算法的精简和优化。为此提出一种基于兴趣度度量函数的Web服务多类数据挖掘算法。采取差异概率兴趣度量规则对关联规则算法中的时序事务进行估计和权重的预测;基于Web服务用户兴趣度进行约束条件设计,实现数据挖掘关联规则的精简;基于支持度函数和期望函数进行事务项集的提取,结合事务项集的置信度对其规则进行导出。选取经典的Web服务UCI Web测试集作为实验对象进行算法的性能验证,结果显示该算法可有效提升数据挖掘算法的性能,对于降低用户Web访问复杂性具有非常好的效果。  相似文献   

11.
用户通话产生的详细话单数据具有丰富的时空信息和社交信息,这些信息在一定程度上反映了用户的生活习惯和社交模式,对于移动通信用户画像研究具有重要意义.我们的研究是基于中国某运营商提供的10 000名用户一个月详细话单数据,本文从用户日常移动模式方面提取移动距离、回旋半径、访问点个数和移动方向熵特征,从用户社交生活方面提取通话时长、联系人数量、主叫比率和社交熵特征,利用上述特征对用户进行群体划分和构建用户词云名片,从而完成对移动通信用户的画像研究.本文使用用户话单数据为推测用户属性、理解用户特征提供了新的视角.  相似文献   

12.
随着海量移动数据的积累,下一个兴趣点推荐已成为基于位置的社交网络中的一项重要任务.目前,主流方法倾向于从用户近期的签到序列中捕捉局部动态偏好,但忽略了历史移动数据蕴含的全局静态信息,从而阻碍了对用户偏好的进一步挖掘,影响了推荐的准确性.为此,提出一种基于全局和局部特征融合的下一个兴趣点推荐方法.该方法利用签到序列中的顺序依赖和全局静态信息中用户与兴趣点之间、连续签到之间隐藏的关联关系建模用户移动行为.首先,引入两类全局静态信息,即User-POI关联路径和POI-POI关联路径,学习用户的全局静态偏好和连续签到之间的全局依赖关系.具体地,利用交互数据以及地理信息构建异构信息网络,设计关联关系表示学习方法,利用相关度引导的路径采样策略以及层级注意力机制获取全局静态特征.然后,基于两类全局静态特征更新签到序列中的兴趣点表示,并采用位置与时间间隔感知的自注意力机制来捕捉用户签到序列中签到之间的局部顺序依赖,进而评估用户访问兴趣点概率,实现下一个兴趣点推荐.最后,在两个真实数据集上进行了实验比较与分析,验证了所提方法能够有效提升下一个兴趣点推荐的准确性.此外,案例分析表明,建模显式路径有助于提...  相似文献   

13.
基于Web日志挖掘的个性化推荐技术已在电子商务网站中广泛应用,针对现有推荐系统的准确性不高等问题,提出一种基于Web日志挖掘和相关性度量的个性化推荐系统. 首先,提取用户的访问日志,并对其进行预处理,以获得精简的结构化数据. 然后,对日志进行分析,提取出特征序列. 再后,根据特征的出现频率和页面停留时间,计算出页面与交易文本文档的相关性. 最终,利用夹角余弦公式计算出用户与页面的相关性,并以此形成推荐列表. 实验结果表明,该方案能够根据用户偏好精确的给出个性化推荐.  相似文献   

14.
针对单一层次结构实现规则提取具有规则提取准确性不高、算法运行时间长、难以满足用户使用需求的问题,提出一种基于改进多层次模糊关联规则的定量数据挖掘算法。采用高频项目集合,通过不断深化迭代的方法形成自顶向下的挖掘过程,整合模糊集合理论、数据挖掘算法以及多层次分类技术,从事务数据集中寻找模糊关联规则,挖掘出储存在多层次结构事务数据库中定量值信息的隐含知识,实现用户的定制化信息挖掘需求。实验结果表明,提出的数据挖掘算法在挖掘精度和运算时间方面相较于其他算法具有突出优势,可为多层次关联规则提取方法的实际应用带来新的发展空间。  相似文献   

15.
用户兴趣建模是个性化服务的核心,考虑到情景信息对用户偏好的影响,对融和情景信息的用户行为日志数据进行深入研究,提出了一种基于情景信息的用户兴趣建模方法.该方法首先通过计算情景相似度来获得用户当前情景的近似情景集;对“用户-兴趣项-情景”三维模型采用情景预过滤的方法降维处理.然后根据用户浏览内容得到用户兴趣主题,分析页面内容得到每种主题的兴趣关键词,建立基于层次向量空间模型的用户兴趣模型.实验结果表明,本文提出的基于情景信息的用户兴趣模型对用户兴趣的预测误差控制在9%以内,是有效的.  相似文献   

16.
在缺乏用户交互互补项目方面数据的情况下,将用户对项目的偏好融合到只考虑项目关系的互补项目推荐中,提高推荐模型的性能。提出一种基于知识图谱的互补项目推荐方法,在用户历史交互项目集中推测用户交互的互补项目,基于知识图谱提取用户对互补项目的偏好,利用图像与文本学习项目之间的互补关系,最后基于神经网络实现二者的共同学习。提出的方法在Amazon数据集上与次优的基线方法相比,ACC提升了7%,precision提升了3%,这说明提出的方法性能优异。该算法共同学习用户对项目的偏好与项目之间的互补关系,提升了推荐性能。  相似文献   

17.
为了帮助用户选择尽可能满足其个性化偏好的物流配送服务,结合配送服务的多属性评分特点,本文构建了基于多属性协同过滤的推荐算法,对传统协同过滤算法进行了延伸与改进,首先预测目标用户对候选服务各属性的评分值,通过引入服务的个性化特征因子减小热门服务对用户相似度计算的误差,考虑到用户的服务属性评分存在波动性,使用信息熵将用户历史评分均值与协同过滤得到的预测值相结合进行修正,然后基于同一用户对不同属性评分波动性的差异,计算得到用户对服务所有属性的评分预测权重,将各属性的评分预测值与对应权重加权求和进行服务推荐.对配送服务交易的评分数据样本进行实验验证,在准确率和平均绝对误差指标上有较好的表现,将算法应用于物流配送服务平台,构建推荐系统,能够提高平台个性化服务能力.  相似文献   

18.
现有基于多兴趣框架的序列推荐方法仅从用户近期交互序列中学习得到用户多兴趣表示,忽略了数据集中项目间的关联信息。针对这一问题,提出了一种关联项目增强的多兴趣序列推荐方法IAMIRec(item associations aware multi-interest sequential recommendation method)。首先通过数据集中用户交互序列计算得到项目关联集合和对应的项目关联矩阵,然后根据项目关联矩阵通过多头自注意力机制建模用户的近期交互序列,最后使用多兴趣框架学习得到用户的多个兴趣向量并进行top-N推荐。在三个数据集上对该方法进行了测试与分析,IAMIRec在recall、NDCG(normalized discounted cumulative gain)和hit rate指标上的表现均优于相关方法。实验结果说明 IAMIRec可以实现更优的推荐性能,也表明引入项目关联信息可以有效增强用户的多兴趣表示。  相似文献   

19.
移动运营商搭建的基站能够记录智能终端的活动,蕴涵着用户的移动行为以及基站的语义信息.针对城市中基站语义以及活动模式难以获取的问题,提出一种基于用户轨迹的基站语义及城市活动模式可视分析方法.该方法首先根据终端用户的轨迹构建基站序列,接着采用文本分析中的词嵌入技术对基站语义信息进行提取,对城市中的手机用户进行聚类以发现其移动模式.为了帮助用户对结果进行探索和分析,设计了基于用户轨迹以及基站语义的城市活动模式可视分析系统,能够根据用户的轨迹特征、基站的地域特征、用户访问基站的时空特征,对手机用户的行为以及城市的活动模式进行发现和解释.基于真实数据的实验结果表明,在系统用户的迭代交互中该方法能够帮助系统用户有效地结合基站轨迹及其基站语义信息,对城市居民行为模式以及城市整体的活动模式进行探索.  相似文献   

20.
Awareness of the user's current context, that is, the task the user resides in, can allow for various ways of supporting their work. In this article we present a novel approach for mining user's regular tasks on the basis of temporal proximity of users’ desktop actions without user intervention in a completely automatic, unobtrusive, and unsupervised manner. The proposed method is based on time-based clustering of a user's desktop actions and, in contrast to previous approaches, it does not enforce fixed time constraints on the mined actions, and typical transition times, when they exist, emerge from the logged activity data for that specific user. The performance of our technique was evaluated on a large data set of 724 days of desktop work by five knowledge workers. The results showed that our approach performed very well and was able to cluster those temporally proximate user actions that commonly used fix time window techniques fail to deal with. Notably, the main improvement is in the recall of the tasks, where our approach recalled 10.18% more actions than the predefined time window technique.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号