首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 113 毫秒
1.
深入讨论了基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据,通过一个实验样例阐述向量空间模型和潜在语义分析的处理过程。新浪微博现有排序方法通常不能提供按照相关性排序的满意结果。利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对博文进行分词和向量化。衡量博文和查询的相关度转化成计算博文向量和查询向量之间的相似度。把对博文和查询的处理简化为向量空间中向量的运算。由实验得知基于潜在语义分析的微博搜索排序算法有效地提高了博文的检索效率。  相似文献   

2.
目前新浪微博的好友推荐机制存在一些缺点,通过研究微博社区结构和权威用户对好友推荐的影响,提出了一种改进的基于新浪微博的好友推荐算法。在同一微博社区中,通过查找权威用户,并结合用户之间的兴趣相似度和信任度进行好友推荐,推荐过程中两次计算了用户的兴趣相似度并引入用户间信任度传播模型。选取微博社区中目标用户进行实验的结果表明,权威用户在好友推荐中起了重要作用,提高了好友推荐的效果。同时通过将该算法推荐的好友列表和原新浪微博推荐的好友列表作对比,实验表明该算法具有较好的推荐效果。  相似文献   

3.
随着微博注册用户的增长,探测不活跃账号,自动判定用户活跃度有重要的商业价值。该文提出了一种自动检测算法并通过实验验证。算法核心是提出的影响用户活跃度的4个判定因子,可由用户行为计算得到。算法包含用户活跃度概率层次模型(ADPHM)和用户评分模型(USM)。ADPHM模型计算用户是不活跃用户的概率;USM模型计算用户活跃度得分。实验数据集包含了新浪微博2 316 281个用户信息和141 322 019条微博内容。实验结果表明,该算法能在线性时间复杂度下自动检测出不活跃账号,完善用户可信度评估体系。  相似文献   

4.
针对传统研究大多基于影响个体挖掘而忽略了影响群落的发现,本文考虑用户之间的频繁传播模式,提出了一种基于频繁传播模式的影响群落挖掘方法。针对群落内部传播模式的多样化,给出了一种信息传播树扩展方法,通过松弛信息传播树有向特性与图扩展方法,将信息传播树转换为连通无向无环图。结合支持度与影响强度,提出了一种新的频繁子图挖掘算法Tribe-FGM,减小模式增长的规模,提高频繁子图挖掘效率。实验采用新浪微博真实数据,在约90万条博文以及对应约64万左右用户的"地震"话题与约31万条博文以及对应约21万左右用户的"两会"话题的数据集上验证了算法的性能和有效性。  相似文献   

5.
提出了一个基于文本上下文信息和用户社会结构的组合信任模型CStrust,给出了置信模型框架,提出搜索内容的置信值函数,设计出根据置信度排序的算法。通过在新浪微博进行实验,该算法在可信度上明显优于新浪微博的默认搜索算法,且能充分兼顾用户喜好、用户自身的影响力等因素,优于传统的LDA算法。  相似文献   

6.
HITS算法和MASEL算法分别实现针对用户的查询进行WEB结构挖掘和WEB使用挖掘,从而提供给用户查询所得信息.为了针对用户的某一查询搜索出更符合用户需求的信息,提出了一种新的挖掘算法.该算法是对HITS算法和MASEL算法的融合应用和改进,可以解决在HITS算法中所产生的主题偏移问题以及MASEL算法中不能很好的查找出中枢网页和权威网页的问题.模拟实验结果表明:针对某一查询,基于HITS和MASEL算法的融合算法具有更高的准确率,查询的结果路径更接近用户的经验兴趣路径.  相似文献   

7.
HITS算法和MASEL算法分别实现针对用户的查询进行WEB结构挖掘和WEB使用挖掘,从而提供给用户查询所得信息。为了针对用户的某一查询搜索出更符合用户需求的信息,提出了一种新的挖掘算法.该算法是对HITS算法和MASEL算法的融合应用和改进,可以解决在HITS算法中所产生的主题偏移问题以及MASEL算法中不能很好的查找出中枢网页和权威网页的问题。模拟实验结果表明:针对某一查询,基于HITS和MASEL算法的融合算法具有更高的准确率,查询的结果路径更接近用户的经验兴趣路径。  相似文献   

8.
目前,对微博转发行为预测主要是对所有微博用户的历史数据进行学习,从而得到转发模型.但是这类模型需要对所有用户的转发行为进行全局预测,存在同质性且无法对具体用户进行个性化预测的缺陷.针对这些问题,提出了基于多任务学习的个性化微博转发行为预测算法.对新浪微博进行了数据抓取、分析和特征选择,根据社会学中影响力的理论,针对微博用户之间进行社交信息交流而导致相互影响的特点,引入了多任务学习方法,以逻辑回归预测模型作为基准算法,将预测模型分为全局模型与个性模型进行学习.预测模型把对每个用户转发行为的预测对应为多个任务,根据微博用户间的社交交互对这些任务进行关联.实验结果表明,所提出的模型能够有效地对单个用户的微博转发行为进行预测,并且提高了转发行为预测的准确率.  相似文献   

9.
提出了一种基于移动社交环境的用户行为多重分析与最优预测算法.首先,针对目标用户所属的各个社交群组,分别建立基于代表度的最优化模型,选择出任一社交群组内最具代表的关联用户,以分析目标用户在不同社会属性下的业务行为;特别地,代表度由基于Kendall系数的相似度和基于交互统计的交互度联合构成;其次,借助Apriori理论分别对目标用户和各最具代表的关联用户进行关联分析,并提出基于最小二乘模型的加权融合方法,以最优地融合上述关联分析结果且实现用户行为的精准预测.仿真结果验证了该算法的有效性.  相似文献   

10.
提出了一种基于深度图卷积神经网络的社交机器人识别方法。首先,在元数据特征的基础上,引入RoBERTa模型进行博文情绪分类,进一步提取更能区分社交机器人和普通人的情绪多样性特征;同时采用single-pass进行博文聚类,构造博文相似图;在此基础上,提出了在GCNII模型上增加Attention机制的A-GCNII模型,通过捕捉用户元数据特征和社交网络中同一话题下的用户关系结构特征识别社交机器人。在真实新浪微博数据集上进行对比实验的结果表明,该方法在识别准确性和效果上均表现良好。  相似文献   

11.
为了提高网站访问效率并得到有价值的个性化网页推荐,针对Web日志的新特性,提出了一种新的基于竞争凝聚的聚类算法.新算法对K-paths聚类算法进行了扩展和改进,按照路径的相似性进行聚类,采用竞争凝聚的思想,自动确定最佳的聚类数目.由于算法考虑了用户的访问兴趣,个性化网页推荐不打扰用户且不需要用户注册信息.利用关联规则得到个性化网页推荐集.用户推荐集和页面推荐集的结合大大提高了推荐效果,具有较好的扩展性.实验结果表明,与其他聚类方法相比该算法具有更高的推荐精度.  相似文献   

12.
通过分析蛛网态微博关系网的特点,指出识别蛛网态微博关系网中有影响力用户的重要意义.重点探讨微博用户自身属性对用户影响力的作用,结合PageRank算法原理,提出一种蛛网态微博关系网中有影响力用户发现方法 (Influential User Discovering Algorithm,IUDA),并基于新浪微博的真实用户数据将该方法与另外两种方法进行对比实验.结果显示,结合用户本身影响值的IUDA方法可以更高质量地发现蛛网态微博网中有影响力用户,客观反映用户的影响力.  相似文献   

13.
Location based social networks (LBSNs) provide location specific data generated from smart phone into online social networks thus people can share their points of interest (POIs).POI collections are complex and can be influenced by various factors,such as user preferences,social relationships and geographical influence.Therefore,recommending new locations in LBSNs requires to take all these factors into consideration.However,one problem is how to determine optimal weights of influencing factors in an algorithm in which these factors are combined.The user similarity can be obtained from the user check-in data,or from the user friend information,or based on the different geographical influences on each user's check-in activities.In this paper,we propose an algorithm that calculates the user similarity based on check-in records and social relationships,using a proposed weighting function to adjust the weights of these two kinds of similarities based on the geographical distance between users.In addition,a non-parametric density estimation method is applied to predict the unique geographical influence on each user by getting the density probability plot of the distance between every pair of user's check-in locations.Experimental results,using foursquare datasets,have shown that comparisons between the proposed algorithm and the other five baseline recommendation algorithms in LBSNs demonstrate that our proposed algorithm is superior in accuracy and recall,furthermore solving the sparsity problem.  相似文献   

14.
Location based social networks (LBSNs) provide location specific data generated from smart phone into online social networks thus people can share their points of interest (POIs).POI collections are complex and can be influenced by various factors,such as user preferences,social relationships and geographical influence.Therefore,recommending new locations in LBSNs requires to take all these factors into consideration.However,one problem is how to determine optimal weights of influencing factors in an algorithm in which these factors are combined.The user similarity can be obtained from the user check-in data,or from the user friend information,or based on the different geographical influences on each user's check-in activities.In this paper,we propose an algorithm that calculates the user similarity based on check-in records and social relationships,using a proposed weighting function to adjust the weights of these two kinds of similarities based on the geographical distance between users.In addition,a non-parametric density estimation method is applied to predict the unique geographical influence on each user by getting the density probability plot of the distance between every pair of user's check-in locations.Experimental results,using foursquare datasets,have shown that comparisons between the proposed algorithm and the other five baseline recommendation algorithms in LBSNs demonstrate that our proposed algorithm is superior in accuracy and recall,furthermore solving the sparsity problem.  相似文献   

15.
内部用户安全行为评估方法由于较少考虑用户操作行为的前后关联性,导致用户操作行为评估的准确率受到影响。针对该情况,结合长短期记忆网络(LSTM)适合处理时间序列问题的特性,提出了一种基于LSTM的内部用户安全行为评估方法。该方法首先对数据作向量化处理;然后按照N vs 1方案进行数据划分,利用LSTM算法对已知用户操作行为习惯进行统一建模;最后使用双峰阈值(bimodal threshold)机制来确定判决阈值,并对用户操作行为进行评估。实验结果表明,该方法的数据划分方案提升了其检测未知用户操作异常的能力,而且通过引入双峰阈值机制,提高了其检测未知用户异常操作的查准率与查全率。  相似文献   

16.
针对现有基于信任的推荐方法通常直接利用社交网络的二值信任关系来提高推荐质量,较少考虑用户间信任强度的差异和潜在影响的问题,提出结合用户信任和影响力的混合推荐算法进行top-N项目推荐. 采用自动编码器对用户行为进行无监督的初始特征优化,将高维、稀疏的用户行为压缩成低维、稠密的用户及项目特征向量;提出融合用户交互信息、偏好度和信任的新型信任度量模型,发掘社交网络中用户间的隐含信任关系,重构社会信任网络;将社会信任网络的拓扑结构和用户的交互信息融入结构洞算法,通过改进的结构洞算法来识别网络中的影响力用户,提高top-N项目推荐性能. 实验在FilmTrust、Epinions、Ciao这3个标准数据集上进行对比验证,实验结果证明了所提算法的有效性.  相似文献   

17.
视频搜索是目前信息检索领域研究的热点.提出一种利用协同过滤技术来实现个性化的视频搜索.该算法根据用户项目兴趣相似度来计算目标项目的得分,从而为每个用户产生一个推荐列表.实验结果表明该排名算法较IMDB搜索和Google搜索的结果在用户满意度上有很明显的提高.  相似文献   

18.
基于信任网络的重构问题,提出一种新颖的推荐算法。将用户相似值与信任关系相结合构建初始信任网络,对用户未评分项进行初始预测;利用一种基于可靠性度量方法评价预测评分的质量,对于未评分项目根据新组建的用户信任网络进行最终评分预测。在两个真实数据集Epinions和Flixster上进行了性能验证,试验结果表明,信任网络的重构可以有效解决推荐系统中的数据稀疏问题,在查全率和查准率上优于传统的推荐算法。  相似文献   

19.
针对博文内容包含多主题、类别归属不明显,以及传统的文本分类方法直接应用于博文效果不理想等问题,提出了一种基于标签的博客文章分类方法.该方法将文本分类问题转化为图优化问题,并提出了一种利用迭代算法计算图中节点属于各类别的概率值.实验结果表明,与传统的文本分类方法相比,所提出的分类方法有效地提高了博文的分类性能.  相似文献   

20.
为了提高搜索引擎的准确度,以达到对用户查询进行优化,缩小用户查询的范围,使用户得到更准确查询结果的目的,在考虑到用户兴趣的基础上,提出了一种用户查询到用户兴趣类的映射技术.介绍了采用该技术所建用户个性化模型的总体结构和各个模块并进行了实验.结果表明,该技术的应用能实现对用户查询的优化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号