首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
受潜在的商业利益的驱动,微博水军横行于话题与评论之间,对人们了解真实的结果产生不良影响,成为正常用户了解事实真相的障碍。分析了正常用户和水军的关系图,以此为切入点,分析了水军的特点,从用户属性中抽取了8个特征数据(粉丝数、关注数、好友粉丝比、注册时间、活跃度、关注速率、双向关注比和互粉数)基于学习数据集R训练逻辑回归分类模型,得到可靠的回归系数后,使用识别样本集R进行识别,水军识别率高达98.770%。为验证抽取的8个特征是否能有效识别水军,使用Scikit-Learn机器学习库中4种分类方法对同一识别样本集进行水军识别,水军识别准确率均在98.688%以上。研究结果表明,选取的8个特征能有效地进行水军判别,逻辑回归分类模型在进行水军识别研究中具有高准确性和可靠性。  相似文献   

2.
随着微博研究的深入,对微博用户可信度的评价成为一个研究热点。针对微博用户可信度评价的问题,提出了一种基于关联关系的用户可信度分析方法。以新浪微博为研究对象,首先从用户的资料信息、交互信息和行为信息三个方面出发,分析了用户的7个相关特征,利用层次分析法(AHP),进而得到用户自评价可信度;然后以用户自评价作为基点,以用户关系网络作为载体,结合用户之间潜在的用户互评关系,通过改进PageRank算法,提出了用户可信度评价模型User-Rank,进而,利用关系网络中其他用户对待分析用户的可信度进行综合评价。大规模的微博真实数据的实验表明,所提方法能够取得良好的用户可信度评价效果。  相似文献   

3.
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类.对于原本就信息过载,信息质量层次不齐的社交网络,具有一定的借鉴意义.  相似文献   

4.
汉字识别中,候选字可信度是对识别结果正确性的一种量化估计.从统计学的角度出发,提出一种利用逻辑回归模型LRM的候选字可信度估计方法.首先介绍LRM的基本原理;然后分别给出LRM估计首选字可信度及非首选字可信度的方法;最后给出候选字可信度在识别率估计和识别后处理中的应用实例.脱机手写汉字识别中的实验结果表明了LRM估计候选字可信度的有效性.  相似文献   

5.
随着微博的日趋流行,微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博用户及其转发内容的挖掘进行转变,该文提出了一种新的方法挖掘微博用户评论和所转发微博的文字信息,将被用户关注的层面发掘出来,从而并产生推荐。  相似文献   

6.
针对现有微博可信度评估中缺少对传播信息的分析,提出一种基于数据起源的微博可信度评估方法,对微博的信息来源和传播过程进行研究。以新浪微博为研究对象,分析信息传播的场景,建立微博的PROV模型,记录信息的来源以及传播的数据起源信息并验证其有效性。结合传播过程中用户的可信度,利用数据起源信息,完善微博可信度评估的参考依据,弥补了现有一般评估方法中传播信息缺失的不足。  相似文献   

7.
微博用户可以分为个人用户和非个人用户两种类型。在微博中对这两种用户类型进行自动分类是智能广告、用户个性分析等应用的一项基本任务。针对该任务,提出了一种基于机器学习的自动分类方法。该方法的特色在于,不需要人工标注样本,而是利用微博中认证用户类型的语料作为训练样本构建分类器,用于对非认证用户类型进行分类。具体实现中,将用户名和用户发表的微博文本作为表示用户的样本,使用基于最大熵算法进行用户分类。实验表明这种利用认证用户对非认证用户进行类型分类的方法能够获得较好的效果。  相似文献   

8.
罗芳  徐阳 《计算机应用研究》2020,37(5):1354-1358,1367
以新浪微博为研究对象,提出一种适用性更广、考虑因素更全面的微博用户影响力度量算法,将用户基本属性、用户交互行为和用户博文内容三个维度因素融入传统PageRank算法中,提出了一种多维度微博用户影响力度量算法——MDIR(multi-dimension influence rank)。实验结果表明,MDIR算法相较于其他常用的五种影响力度量算法,能更加全面、真实地反映微博用户的实际影响力。  相似文献   

9.
为提高微博话题中关键人识别的准确性, 提出了一种基于个人属性特征的用户影响力分析方法——PBF方法。该方法利用信息传播特征对用户影响力进行度量, 结合个人属性特征对其进行回归分析, 找出最能反映用户影响力的属性特征, 进而利用这些特征对用户影响力进行预测。实验结果表明, PBF方法的识别效率要明显高于RNF方法, 有效提高了关键人识别的准确性。  相似文献   

10.
本文采用惩罚逻辑回归方法,利用威斯康星大学的乳腺癌数据对乳腺肿瘤进行预测。首先选取与乳腺癌相关的10个指标作为自变量,接着采用逻辑回归、LASSO惩罚逻辑回归、L2惩罚逻辑回归和弹性网惩罚逻辑回归作为分类器,利用75%的数据集作为训练集建立模型,最后利用25%的测试集、混淆矩阵和ROC曲线评估不同模型的预测精度。结果表明,LASSO惩罚逻辑回归的预测表现最好,预测精度达到97.18%;弹性网惩罚逻辑回归的预测表现随着α的增大发生变化,特别当α=0.9时,预测精度达到97.18%,与LASSO惩罚逻辑回归的预测表现一样好;L2惩罚逻辑回归的预测表现排第3,逻辑回归表现最差。因此,在乳腺肿瘤诊断中可借助LASSO惩罚逻辑回归和弹性网惩罚逻辑回归提高诊断精度。  相似文献   

11.
用户影响力度量是目前微博研究的基础和热点方向,为了提高微博传播影响力度量的准确性,提出一种基于行为权值的微博用户影响力度量算法。对网络用户的转发、评论和提及等行为进行分析,将数据输入到最小二乘支持向量机中进行学习找到最合理的权值,并建立传播影响力度量模型,采用具体数据对算法的性能进行仿真测试。结果表明,相对于其他微博用户影响力度量算法,该算法不仅提高了微博用户影响力的度量准确性,而且可以准确刻画各种用户行为对网络传播力贡献。  相似文献   

12.
微博网络中的每一个节点代表一个微博用户,微博用户之间除了存在一定的社会关系外,用户本身也具有一定的特性。用户之间明显的链接关系可以为社区发现提供重要的线索,但两个用户之间如果有相似的兴趣,那么即使用户之间没有明显的链接关系他们也可能加入到同一个社区,而传统的社区发现方法大多基于单个方面进行考虑。所以,提出一种结合链接分析和用户兴趣的微博社区发现方法。真实数据集上的仿真实验验证了该方法的合理性和有效性。  相似文献   

13.
针对当前的马尔可夫毯学习算法会引入不正确的父子节点和配偶节点的问题,提出了一种基于逻辑回归分析的马尔可夫毯学习算法RA-MMMB.利用MMMB算法得到候选的马尔可夫毯,建立目标变量与候选马尔可夫毯的逻辑回归方程,通过回归分析在保留与目标变量相关性很强的变量的同时,去掉MMMB等算法所引入的弱相关性的错误变量以及其他的弱相关性变量;然后利用G2测试去掉回归分析后候选马尔可夫毯中的兄弟节点,得到目标变量的马尔可夫毯.RA-MMMB算法通过回归分析,减少了条件独立测试的次数,提高了学习的精度.实验比较和分析表明,RA-MMMB算法能有效地发现变量的马尔可夫毯.  相似文献   

14.
为了解决在电费回收的过程中,遇到的回收不及时、回收难度大、电费回收不全等难点,严重影响了供电企业生产的最终经营成果。本文结合各个用户在近一年的各种生产活动产生的数据,建立与用户行为相关的模型。首先采用聚类的方法,根据最终得到的簇类,对重庆地区所有用户电费回收风险的类型有大致的认知。然后采用逻辑回归模型,并且针对高压、低压居民、低压非居民三种不同类型的用户分开进行分析建模,最终得到用户电费回收风险的得分。本文针对电费风险防控业务提出一种基于概率聚类逻辑回归模型,用于实现欠费风险精细化。分析、定位客户群体,提炼、归纳、总结客户特征,实现客户细分。基于客户细分结果提供精准的差异化服务。实践证明,该模型可为电网企业客户的风险评估实用化推广提供有效支撑。  相似文献   

15.
社交网络给每个社会中的人提供了自由表达个人情感、观点、兴趣、建议等言论的平台。用户在这些平台上发表的言论、所做的行为以及用户在平台上建立的社交圈子也给数据挖掘带来了新的数据和机会。提出了一种利用用户在微博上的公开数据信息实现对该用户的MBTI个性维度进行分类分析的方法。在该方法中,基于对用户微博数据的分析,提出了能够表征用户心理和行为的文本和非文本特征,然后采用三种机器学习的分类方法—提升决策树、支持向量机和贝叶斯逻辑递归来对微博用户的个性进行分类分析。实验结果表明,通过对微博数据的挖掘可以在不同MBTI个性维度上达到75%~90%的准确率。  相似文献   

16.
The sparsity driven classification technologies have attracted much attention in recent years, due to their capability of providing more compressive representations and clear interpretation. Two most popular classification approaches are support vector machines (SVMs) and kernel logistic regression (KLR), each having its own advantages. The sparsification of SVM has been well studied, and many sparse versions of 2-norm SVM, such as 1-norm SVM (1-SVM), have been developed. But, the sparsification of KLR has been less studied. The existing sparsification of KLR is mainly based on L 1 norm and L 2 norm penalties, which leads to the sparse versions that yield solutions not so sparse as it should be. A very recent study on L 1/2 regularization theory in compressive sensing shows that L 1/2 sparse modeling can yield solutions more sparse than those of 1 norm and 2 norm, and, furthermore, the model can be efficiently solved by a simple iterative thresholding procedure. The objective function dealt with in L 1/2 regularization theory is, however, of square form, the gradient of which is linear in its variables (such an objective function is the so-called linear gradient function). In this paper, through extending the linear gradient function of L 1/2 regularization framework to the logistic function, we propose a novel sparse version of KLR, the 1/2 quasi-norm kernel logistic regression (1/2-KLR). The version integrates advantages of KLR and L 1/2 regularization, and defines an efficient implementation scheme of sparse KLR. We suggest a fast iterative thresholding algorithm for 1/2-KLR and prove its convergence. We provide a series of simulations to demonstrate that 1/2-KLR can often obtain more sparse solutions than the existing sparsity driven versions of KLR, at the same or better accuracy level. The conclusion is also true even in comparison with sparse SVMs (1-SVM and 2-SVM). We show an exclusive advantage of 1/2-KLR that the regularization parameter in the algorithm can be adaptively set whenever the sparsity (correspondingly, the number of support vectors) is given, which suggests a methodology of comparing sparsity promotion capability of different sparsity driven classifiers. As an illustration of benefits of 1/2-KLR, we give two applications of 1/2-KLR in semi-supervised learning, showing that 1/2-KLR can be successfully applied to the classification tasks in which only a few data are labeled.  相似文献   

17.
逻辑回归已广泛应用于财务危机建模,但是一定程度存在过拟合问题.为了避免建模出现上述问题,提出了基于L1正则化逻辑回归的财务预警模型.该模型是一种稀疏模型,能同时实现变量选择和参数估计,具有较强的鲁棒性.同时,针对L1正则化逻辑回归问题的求解,提出了一种高效的基于内点法的求解算法.结合沪深股市A股制造业上市公司进行实证分析,分析结果表明,L1正则化逻辑回归模型在预报精度、经济解释性等方面明显优于其他逻辑回归模型,并且提出的内点法与其它求解算法相比具有一定的优越性.  相似文献   

18.
针对Logistic回归模型中的参数估计计算复杂难题,提出一种基于粒子群优化算法(PSO)的估计方法。以最大似然准则作为粒子群优化算法的适应度函数,建立了Logistic回归模型中的参数估算模型。数值仿真分析表明,粒子群优化算法可以更精确地计算出相关参数。  相似文献   

19.
20.
Semantic Web service matchmaking,as one of the most challenging problems in Semantic Web services (SWS),aims to filter and rank a set of services with respect to a service query by using a certain matching strategy.In this paper,we propose a logistic regression based method to aggregate several matching strategies instead of a fixed integration (e.g.,the weighted sum) for SWS matchmaking.The logistic regression model is trained on training data derived from binary relevance assessments of existing test collections,and then used to predict the probability of relevance between a new pair of query and service according to their matching values obtained from various matching strategies.Services are then ranked according to the probabilities of relevance with respect to each query.Our method is evaluated on two main test collections,SAWSDL-TC2 and Jena Geography Dataset(JGD).Experimental results show that the logistic regression model can effectively predict the relevance between a query and a service,and hence can improve the effectiveness of service matchmaking.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号