首页 | 官方网站   微博 | 高级检索  
     

基于海量搜索历史数据的用户兴趣模型
引用本文:詹天晟,陈德华,乐嘉锦,王梅. 基于海量搜索历史数据的用户兴趣模型[J]. 计算机应用, 2014, 0(Z2): 126-129,139
作者姓名:詹天晟  陈德华  乐嘉锦  王梅
作者单位:东华大学 计算机科学与技术学院,上海,201620
基金项目:东华大学励志计划项目(B201312)。
摘    要:针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型。该模型根据用户搜索的历史数据,结合向量空间模型( VSM )和TF-IDF算法,递归地回溯出用户兴趣权重列表。为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行实现。实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50',具有较好的可行性和可用性。

关 键 词:向量空间模型  TF-IDF  Hadoop  MapReduce  用户兴趣模型

User interest model based on mass historical search data
ZHAN Tiansheng , CHEN Dehua , LE Jiajin , WANG Mei. User interest model based on mass historical search data[J]. Journal of Computer Applications, 2014, 0(Z2): 126-129,139
Authors:ZHAN Tiansheng    CHEN Dehua    LE Jiajin    WANG Mei
Abstract:
Keywords:Vector Space Model ( VSM)  TF-IDF  Hadoop  MapReduce  user interest model
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号