排序方式: 共有78条查询结果,搜索用时 12 毫秒
71.
基于关系图特征的微博水军发现方法 总被引:1,自引:0,他引:1
随着网络水军策略的不断演变,传统的基于用户内容和用户行为的发现方法 对新型社交网络水军的识别效果不断下降.水军用户可以变更自身的博文内容与转发行为, 但无法改变与网络中正常用户的连结关系,形成的结构图具有一定的稳定性, 因此,相对于用户的内容特征与行为特征,用户关系特征在水军识别中具有更强的鲁棒性与准确度. 由此,本文提出一种基于用户关系图特征的微博水军账号识别方法. 实验中通过爬虫程序抓取新浪微博网络数据; 然后,提取用户的属性特征、时间特征、关系图特征;最后,利用三种机器学习算法对用户进行分类预测. 仿真结果表明,添加新特征后对水军账号的识别准确率、召回率提高5%以上, 从而验证了关系图特征在水军识别中的有效性. 相似文献
72.
以新浪微博为研究对象,基于用户特征将用户对微博转发量的影响力进行量化,提出了一种微博预警算法。首先,分别研究了大转发量与小转发量的微博作者的用户基本特征,获得其中对关键用户与非关键用户具有良好区分度的特征,并基于信息增益的特征选择法获得用户特征对用户关键性的区分度。随后,基于特征加权模型,提出了一种用户对微博转发量的影响力的量化算法。最后,提出了一种微博预警算法,该算法对给定的新发布的微博,以其作者及已有转发用户的特征就用户对该微博转发量的影响力进行量化,当影响力超过一定阈值时,输出预警信息。该算法可以有效控制敏感微博在网络上的传播及扩散。 相似文献
73.
微博社交媒体营销的兴起使得快速准确地在微博中定位行业信息变得越来越重要。提出一种基于关键词的行业信息个性化推荐方法以帮助用户快速准确地获得行业相关信息。从基于行业用户历史微博的关键词提取与基于词语共现信息的关键词扩展两个角度生成行业关键词向量,关键词提取与扩展的结果将根据用户自定义权重进行线性合并。最后,据此合并向量对用户订阅微博进行相关度计算,为用户推荐相关信息。该方法在新浪微博平台上以若干具有代表性的企业微博数据进行实验,证明了方法的有效性。 相似文献
74.
75.
76.
传统搜索引擎需要用户从返回网页中提炼有用知识;社交网络搜索根据人物的社会关系、共同爱好,提供人物和兴趣间的关系等方面的搜索结果。当前,社交网络搜索主要存在2个问题:不能从语义上理解用户查询词;仅局限于人物、兴趣搜索,限制了查询范围。为解决微博搜索中存在的一些问题,并主动返回更多知识,基于微博这一社交网络的重要平台,研究微博社区知识图谱构建方法,重点提出5方面的研究:微博社区中概念提取,其概念包括人物、事物、地点、事件和话题等5种类型;微博社区概念间的关系提取,其关系包括上述5种概念间的组合关系;知识图谱是带有语义的网络图谱,将概念作为顶点并将概念间关系作为边,研究知识图谱的构建方法;分析微博社区知识图谱,包括构建效果、演化特征、应用效果分析;研发基于微博知识图谱的应用系统等内容。 相似文献
77.
针对现有中文微博观点分类方法对上下文利用不足、数据表示稀疏和特征依赖于人工设计等问题,提出基于卷积神经网络的中文微博观点分类方法.首先利用交互上下文扩充不同主题下的微博内容,使用低维密集向量初始化微博文本.然后构造卷积神经网络模型,实现特征抽取和组合.最后基于softmax分类函数估计中文微博观点类别.实验表明,相比基准方法,文中方法在精确度和F1值上的效果更好. 相似文献
78.
基于隐主题分析和文本聚类的微博客中新闻话题的发现 总被引:1,自引:0,他引:1
提出一种在大规模微博客短文本数据集上发现新闻话题的方法。利用隐主题分析技术,解决短文本相似度度量的问题。在每个时间窗口内,根据新闻的特点选取出最有可能谈论新闻事件的微博客文本,然后用两层的K均值和层次聚类的混合聚类方法,对这个时间窗口内的那些最有可能谈论新闻事件的微博文本进行聚类,从而检测出新闻话题。此方法能较好地解决微博客短文本的数据稀疏性及数据量巨大的问题。实验证明该算法的有效性。 相似文献