首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 916 毫秒
1.
微博信息溯源通过分析在平台采集的话题数据集,挖掘相关话题的真正源头,即发布时间较早且影响力大的微博集合,实现网络舆论的管控与引导。提出一种基于用户兴趣的微博溯源算法,该算法根据博主的兴趣计算博主影响力,同时根据评论人、转发人的兴趣计算评论人、转发人的影响力,结合博主关注度和发表时间等因素,利用网页排序算法对微博评分,根据微博得分进行排序溯源。实验结果表明,该算法相较于传统溯源算法在查全率上提升了约21%。  相似文献   

2.
提出了基于传统的PageRank算法的改进模型评估微博社区博主的影响力。微博社区中博主的影响力反映其话语权的大小,是研究微博社区的核心概念之一。通过对平均度、聚类系数和平均路径长度等网络特征指标的统计,验证了微博社区网络具有"小世界"的显著特性。从用户活跃度和博文质量两个角度出发,构建了博主影响力的评价指标,引入了博主传播能力这个因子,利用PageRank算法的思想设计了新的影响力排名(Influence Rank)算法模型来评估博主影响力。通过实验对比发现Influence Rank算法在考虑节点间的关系之外还考虑了节点本身的特性,能够更加准确客观地反映博主的影响力排名。  相似文献   

3.
《计算机工程》2017,(5):179-184
针对传统PageRank算法存在主题漂移、网页权值均分等问题,提出一种改进的PageRank算法。为提高用户查询效率和搜索质量,结合时间反馈因子对用户转发、用户评论和微博提及行为进行综合分析,采用统计分析方法对用户行为在微博用户影响力排序中的贡献进行度量,并利用改进的TF-IDF算法计算主题相似度权值使用户能够选择相关度较高的网页,从而获得相对应的PageRank权值。实验结果表明,与微博常用排序算法相比,改进PageRank算法具有更好的用户影响力排序效果。  相似文献   

4.
微博作为一种重要的社交媒体,许多学者都对微博中用户的影响力进行研究,但大多数影响力的评价算法都是根据微博话题中用户的静态属性或微博话题发生后用户的行为特征对用户影响力进行评价。从用户的转发、评论和点赞三种行为入手,结合突现计算模型,提出一种基于Swarm模型的用户影响力排序算法,SMRank算法可以在微博话题发生的过程中对用户每个时间段的影响力进行计算,给出了一种计算微博话题用户影响力的新方法。通过使用真实的微博话题数据进行实验,结果表明提出的SMRank算法可以有效地发现微博话题中影响等级较大的用户,并能计算出不同用户不同时刻的影响力。  相似文献   

5.
提出了一个基于文本上下文信息和用户社会结构的组合信任模型TCtrust, 给出了置信模型, 分别从显式和隐式信任对置信值进行了度量, 设计出根据置信度排序的算法。通过对新浪微博热门话题“美国总统大选”进行实验, 该算法在可信度上优于新浪微博的默认搜索算法, 且能充分兼顾用户喜好、用户自身的影响力等因素, 优于传统的LDA算法。  相似文献   

6.
近年来,微博用户都凭借其自身在社区中的影响力来对信息传播做出贡献,尤其是活跃的大V用户能够引起信息广泛的传播。为了在微博社区中提高用户影响力衡量的准确性,提出了一种基于传统的PageRank算法和用户交互行为的用户影响力改进算法(IUIR算法),此算法通过直接质量指数和间接质量指数来构建微博用户的质量指数,再结合近期用户的活跃度来构造用户影响力评价公式。在新浪微博数据集上进行实验,并与传统的PageRank算法作比较,结果表明,该算法能够更有效地反映微博用户影响力的排名。  相似文献   

7.
罗芳  徐阳 《计算机应用研究》2020,37(5):1354-1358,1367
以新浪微博为研究对象,提出一种适用性更广、考虑因素更全面的微博用户影响力度量算法,将用户基本属性、用户交互行为和用户博文内容三个维度因素融入传统PageRank算法中,提出了一种多维度微博用户影响力度量算法——MDIR(multi-dimension influence rank)。实验结果表明,MDIR算法相较于其他常用的五种影响力度量算法,能更加全面、真实地反映微博用户的实际影响力。  相似文献   

8.
针对Sina微博博文的转发关系,建立起用户转发博文之间的演化网络,从而利用SMO SVM(sequential minimal optimization support vector machine)分类算法对博文进行分类,筛选出恶意博文、垃圾广告、垃圾营销信息,使用户能够精确地屏蔽不想要的博文和博主。第一步基于微博转发关系的演化网络和SVM分类算法对整个Sina微博进行分类;第二步利用复杂网络等技术对经常发送恶意广告的博主进行标注,从而在网络中对他们进行屏蔽;最后找出垃圾信息的来源以及分辨出博主是不是恶意转发者,在宏观上能更好地遏制垃圾信息的传播。与用户从UCI数据集中实际反馈情况进行比较,实验结果表明,机器学习分类的实验结果吻合度达到89%。  相似文献   

9.
由于微博高影响力用户在商品营销、社会舆论引导等方面起着重要的作用,因此挖掘高影响力用户成为了微博社交网络中的热点研究问题。针对微博用户影响力计算中存在交互行为与用户自身因素分析不全面的问题,提出了微博用户影响力计算方法MBUI-SFIM(Micro-blog userinfluence based on user’s self-factors and interaction computing model)。该方法考虑了微博用户直接影响力和间接影响力两个方面:在用户直接影响力计算中,通过对用户的自身因素如微博用户粉丝数、用户活跃度、近期微博质量等的分析,计算出用户的初始影响力,然后分析用户互动行为如用户的微博可见率、微博用户互动系数,计算出用户传播能力,最后将初始影响力与用户传播能力相结合,基于改进PageRank算法计算出用户直接影响力;在用户间接影响力计算中,通过对用户网络图连接结构进行分析,根据不相邻用户连接路径的不同,将用户间接影响具体分为简单路径、重复路径、复杂路径3种情况进行讨论,从而计算出用户间接影响力。实验结果表明,相比PageRank算法和MR-UIRank算法,所提算法在用户排名准确性上分别提高了14.8%和8.3%。  相似文献   

10.
为快速、准确地识别微博网络中具有较大影响力的节点,提出了一种基于用户关系、行为以及社团结构的影响力评价算法。首先,根据模块度对加权有向微博网络进行社团划分;接着综合微博网络中用户的粉丝数量、粉丝质量以及跨社团数目等特性度量节点的影响力。同时,对粉丝质量进行深入的分析,利用粉丝对用户的关注度作为粉丝质量的分配标准,最终完成用户传播影响力的评价。实验结果表明,该算法显著提高了评估用户传播影响力的准确性。  相似文献   

11.
微博网络测量研究   总被引:9,自引:0,他引:9  
随着移动通信和Web技术的不断突破,以微博为代表的在线社会网络在中国广泛发展起来,越来越多的人开始使用微博进行信息分发和舆论传播.为了了解中国微博网络中的拓扑结构特征和用户行为特征等内在信息,对国内最大的微博系统——新浪微博——开展了主动测量,并结合已有的在线社会网络测量结果,对新浪微博的网络拓扑和用户行为特征进行了分析和比较.主要发现包括:1)新浪微博网络具有小世界特性;2)新浪微博网络的入度分布属于幂次分布,而出度分布表现为某种分段幂率函数;3)与类似社会网络相比,新浪微博网络的出入度不具有相关性;4)新浪微博网络属于同配网络;5)新浪微博用户发博时间具有明显的日分布和周分布模式;6)新浪微博用户博文数目分布表现为威布尔分布;7)新浪微博用户博文的转发和评价行为具有很强的相关性,且博文转发概率要高于评价概率.这些测量研究和发现不仅有助于设计出符合中国微博网络结构特征的数学模型和计算模型,也是实现对微博舆论的监测、引导、控制等方面的重要依据和基础.  相似文献   

12.
高明霞  陈福荣 《计算机应用》2016,36(8):2071-2075
针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。  相似文献   

13.
在全部微博内容中,由用户转发而产生的信息占有非常大的比例。同时,内容的转发也是微博中信息传播的主要途径。因此,用户的转发行为有着重要的研究价值,可应用于社交营销、微博检索、热点事件预测等领域中。该文中,我们通过分析所收集的大量真实的新浪微博数据,发现影响用户转发行为的一些因素: 微博作者、用户兴趣以及微博热度。基于这些发现,该文提出了一种新颖的基于LDA模型的方法,综合利用以上3个特征预测用户转发行为。为了对该方法进行评价,我们利用收集的大量的微博数据及对应的社交网络结构模拟真实用户环境。实验表明,该方法的性能优于目前最好的方法,F值比其他基线方法高出35%—45%。  相似文献   

14.
周中华  张惠然  谢江 《计算机应用》2014,34(11):3131-3134
目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析。为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具。该工具可以实时抓取微博中指定用户的粉丝信息、微博正文等内容;该工具利用关键字匹配技术,匹配符合规定条件的微博,并抓取相关内容;该工具支持并行抓取,可以同时抓取多个用户的信息。最后将串行微博爬虫工具和其并行版本进行对比,并使用该工具对部分微博数据作了一个关于流感问题的分析。实验结果显示:并行爬虫拥有较好的加速比,可以快速地获取数据,并且这些数据具有实时性和准确性。  相似文献   

15.
该文主要研究在微博社交网络中怎样评价用户的影响力。在影响用户影响力的众多因素中,该文认为用户的传播能力越强,用户的信息便可以更快地在网络中扩散,其影响力也越大。和传统的用户影响力评价方法相比,该文综合考虑用户的活跃度和用户所发微博质量两个方面的因素,得到用户的影响力权重,然后把每一个用户作为社交网络中的节点,计算其在社交网络中的影响力。通过在公开语料集和真实数据中的实验,表明该方法是可行的,比传统的用户影响力评价方法更能客观、真实地反映用户的实际影响力。  相似文献   

16.
社会网络信息的可信度问题近年来受到了相当大的关注。谣言的散播可能造成社会恐慌,引发信任危机。在国内,新浪微博用户量的快速增长,使其成为了谣言传播的温床。及时清理在新浪微博中传播的谣言,对于社会的和谐发展有着现实的意义。该文以新浪微博为背景,将谣言检测任务作为分类问题,首次提出将微博评论的情感倾向作为谣言检测分类器的一项特征。实验结果表明,引入评论的评论情感倾向特征后,使得谣言检测的分类结果得到了可观的提升。  相似文献   

17.
王臻皇  陈思明  袁晓如 《软件学报》2018,29(4):1115-1130
随着微博的发展,其影响力日益增大,对微博主题内容进行分析具有重要的价值.主题模型技术能够从文本数据中提取主题,但是,由于微博文本短、随意性大、信息量小等特点,微博主题的分析具有一定的难度.提出了一个微博主题可视分析系统,利用多种互相关联的视图与丰富的交互手段,支持用户对主题模型结果进行分析与探索.系统结合了微博数据的特点,引入微博用户与时间因素,支持分析者从多角度对微博主题进行全面分析.系统支持用户在主题可视分析的基础上,通过交互操作对主题进行编辑,从而改进主题模型,提高模型的准确性和可靠性.案例分析结果表明,提出的系统可以有效地帮助用户分析微博主题和修正主题.  相似文献   

18.
为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-UserTTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-UserTTM分别获得较高的微博话题追踪准确率.  相似文献   

19.
Recent years have shown us the quick development of social network. For companies, microblog platform is more and more important as one source to disseminate brand information and monitor their development. Compared with the frequently used text information existing in traditional media, microblog platform provides information about brands in more types such as images and other related information forms. According to the statistics, microblogs posted on social network contain more and more percentage of images. Hence how to recognize logos in images from social network is of high value. To address this problem, we propose a novel learning-based logo detection method with social network information assistance. A new dense histogram type feature is proposed to classify logo and non-logo image patches. To increase the detection precision, social network content is analyzed and employed to do filtering to reduce detection window candidates. Through the evaluation on large-scale data collected from Sina Weibo platform, the proposed method is demonstrated effective.  相似文献   

20.
随着社交网络的普及,新浪微博逐渐成为中国最大且最有价值的社交平台。然而网络的隐蔽性导致网络暴力事件层出不穷,大学生在社交平台发表看法和释放压力的同时却有可能不自觉中产生网络暴力的传播行为。本文以大学生为调查对象,基于新浪微博,进行网络暴力事件中信息传播行为的研究,设计了关于网络暴力事件信息传播行为的调查问卷,并构建用户传播行为回归模型,分析不同因素对信息传播行为的影响。本文通过因子分析与回归分析的方法,对大学生的信息传播行为进行研究,以期提高大学生对网络暴力事件的理性认知意识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号