首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合产品真实特性的评论.这些虚假评论语言上模仿真实评论,消费者很难识别出来.国内外学者综合运用自然语言处理技术来研究虚假评论检测问题.从特征工程的角度分析,虚假评论检测方法可以分为三类:基于语言特征和行为特征的方法、基于图结构的方法、基于表示学习的方法.主要描述了检测的一般流程,归纳了三类研究方法常用的特征,比较了方法的优缺点,并且介绍了研究常用的数据集.最后探讨了未来研究方向.  相似文献   

2.
随着社交网络的普遍应用,故意构建大量链接关系以提高自身影响力的作弊行为将给社交网络造成极大的安全隐患。针对这种作弊现象,本文首先提出社交网络用户的4类特征,并利用关系强度模型,提出一种信任和非信任同时双向传播的反作弊改进算法。实验表明采用信任及非信任双向传播的反社交网络链接作弊算法具有良好的对抗性能。  相似文献   

3.
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和基于网络图的链接特征,分别建立两个独立的基本分类器;使用Co-Training半监督式学习算法,借助大量未标记数据来改善分类器质量。在WEB SPAM-UK2007数据集上的实验证明:算法改善了SVM分类器的效果。  相似文献   

4.
随着互联网技术的发展,邮件作为通信和传输文件的方式越来越普遍,伴随着垃圾邮件也出现在工作中。垃圾邮件对企业和用户的危害极大,该文主要讨论垃圾邮件的检测技术和绕过技术。  相似文献   

5.
指出基于全局优化的社区挖掘方法的不足,给出OSNs网络及其社区挖掘的形式定义,提出一个启发式社区挖掘框架,在此框架下对包括LWP,Clauset,Schaeffer,Papadopoulos,Bagrow与Chen在内的6种启发式社区挖掘算法进行分析比较.通过3个真实OSNs网络的实验比较,验证了启发式社区挖掘框架的可行性,在结果社区有效性与时间效率上对6种启发式算法进行比较,实验结论为网络社区挖掘的工程实践与理论研究提供了借鉴.  相似文献   

6.
社交网络中隐式事件突发性检测   总被引:2,自引:0,他引:2  
介飞  谢飞  李磊  吴信东 《自动化学报》2018,44(4):730-742
社交网络与人们的生活息息相关,其上的用户行为可用于检测社交网络中的事件突发性,进而准确定位事件的发生区间.但用户行为易受主观及外部因素的影响,有时会出现隐式事件突发性,给事件突发性检测带来困难.本文针对社交网络中的隐式事件突发性问题,在以社交行为特征进行事件突发性检测的基础上,引入关键词特征,动态调整各个时间窗口的候选关键词,将不同事件与不同的关键词特征绑定,避免事件之间及噪音带来的干扰,实现对隐式事件突发性的准确识别.相关实验表明,本文提出的算法可有效改善现有社交网络中事件突发性检测任务的效果.  相似文献   

7.
社交网络数据的高度复杂性给数据挖掘研究带来了巨大的挑战,而社交网络数据挖掘更注重实体之间相互关联的特点,使得图数据挖掘技术的研究与应用逐渐成为该领域的热点。传统数据挖掘,如聚类、分类、频繁模式挖掘等技术逐渐拓展到图数据挖掘领域。文中首先介绍了现阶段图数据挖掘算法(其中包括图查询、图聚类、图分类和图的频繁子图挖掘)的研究内容和存在的问题;其次介绍了图形数据库研究现状,以及对比了主流图形数据库管理系统的优劣;最后介绍了图挖掘技术在社交网络中的应用。  相似文献   

8.
一种有效的社会网络社区发现模型和算法   总被引:6,自引:0,他引:6  
社会网络的社区发现存在划分效果较好的算法时间复杂度过高、现有快速划分算法划分质量不佳、缺乏表达和充分利用个体和链接属性信息的模型和机制等问题.针对这些问题,提出了一种边稳定系数模型和一种能表达个体间关系紧密度的完全信息图模型,在此基础上设计和实现了一种有效的社区发现算法.提出的完全信息图模型具有较高通用性,适用于需要融合个体和链接属性的社区发现算法.通过系列实验表明,所提出的以边稳定系数模型和完全信息图为基础的算法,对社会网络中的社区发现问题是有效的.算法不仅具有较快的速度,也能适用于带权与不带权的网络,得到的社区划分结果也具有较高的划分质量.  相似文献   

9.
基于目的分析的作弊页面分类   总被引:3,自引:1,他引:3  
随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法。本文主要基于作弊目的的分析,给出作弊页面另一种体系的分类,为基于目的的作弊页面识别起到良好的导向作用。  相似文献   

10.
基于签名的近似垃圾邮件检测算法   总被引:1,自引:1,他引:0  
针对垃圾邮件短小、一定时间内在网络上重复、大量地散发的特点,提出了基于签名的近似垃圾邮件检测算法(ASD)。该算法以句为基本单位,求取邮件所含的全部句子的摘要,垃圾邮件的近似检测转变为两个摘要集近似度的比较。通过与近似文本查询算法DSC、DSC-SS、I-Match的比较,ASD算法在近似垃圾邮件查询中,表现出样本集的存储空间大小适中、运算时问短、鲁棒性高、高准确率、高召回率的特征。  相似文献   

11.
In this paper,we propose a balanced multi-label propagation algorithm(BMLPA) for overlapping community detection in social networks.As well as its fast speed,another important advantage of our method is good stability,which other multi-label propagation algorithms,such as COPRA,lack.In BMLPA,we propose a new update strategy,which requires that community identifiers of one vertex should have balanced belonging coefficients.The advantage of this strategy is that it allows vertices to belong to any number of communities without a global limit on the largest number of community memberships,which is needed for COPRA.Also,we propose a fast method to generate "rough cores",which can be used to initialize labels for multi-label propagation algorithms,and are able to improve the quality and stability of results.Experimental results on synthetic and real social networks show that BMLPA is very efficient and effective for uncovering overlapping communities.  相似文献   

12.
随着手机短消息服务的发展,垃圾短信呈爆炸性的增长趋势,给人们的日常生活带来了不便,也给通信运营商带来了损失.本文利用短信用户之间的联系构建短信社会网络,分析用户在短信社会网络中的关系及其行为模式,从中抽取出具有类别区分度的社会网络特征,提出了一种新的离线垃圾短信过滤模型.模型针对海量短信数据处理时存在的时空效率的瓶颈问题,提出了线性特征统计算法LFSA,并结合高斯核密度估计和贝叶斯分类器,对短信进行分类过滤.我们使用某省通信运营商提供的30亿条短信数据对模型进行测试,做实验分析.实验结果表明,我们提出的模型能满足运营商的各项性能指标要求,并已部署和应用.  相似文献   

13.
社会网络上的模式挖掘是近年来的研究热点之一,合作模式是社会网络上个体间的合作方式,这种模式可以通过社会网络的子结构表示。已有的基于频繁模式的挖掘算法主要考虑合作关系的结构特征,并且往往需要给定支持度阈值来控制结果的规模。在本文中,我们认为社会网络中的模式不一定需要是频繁的,模式与社区也并不需要精确匹配。我们在合作模式中考虑节点的社会地位,并在加权图上给出了一种模式的定义方法,和一种基于互相似性的模式匹配衡量标准,目的在于找出网络中具有"代表性"的合作模式。我们设计了一种基于距离的聚类方法用于抽取这种模式,并在一个大规模的真实数据集上进行了验证。  相似文献   

14.
产品垃圾评论检测研究综述   总被引:2,自引:2,他引:2  
互联网上的产品垃圾评论混淆视听,误导了潜在消费者。产品垃圾评论检测的目的就是将垃圾评论从评论文本中找到并去除,保留真实的产品评论供用户参考。首先将产品垃圾评论和互联网上其它常见的垃圾信息进行了对比,并把产品垃圾评论的检测和产品评论的质量判断、产品评论的情感分析等相关的工作进行了比较分析。然后从产品垃圾评论检测的数据集、检测方法两个角度对相关工作做了概述和分析。最后,在上述工作的基础上提出了一些产品垃圾评论检测研究中值得进一步关注的问题。  相似文献   

15.
随着微博平台的快速发展,垃圾信息检测与过滤也面临着巨大的考验,实时精确地识别垃圾信息对于提高用户的体验以及微博平台的可持续发展意义重大.本文根据新浪微博的真实数据,提出了一种基于多特征的垃圾微博检测方法.首先,提取微博的显式特征(用户特征、内容特征);然后利用文档主题生成模型(LDA)提取微博中的隐含主题特征;最后根据所提取的微博特征利用支持向量机(SVM)构建分类器.实验结果表明,该方法相比于现有方法在准确率和F1值方面都有一定的提升.  相似文献   

16.
随着信息技术飞速发展,社交网络逐渐占领了人们日常交往、娱乐和购物等主要平台。因此,大量围绕社交网络展开的研究也变得非常热门.现有的围绕社交网络用户行为展开的研究热点主要有:基于社交网络用户行为的用户影响力研究、基于用户行为的推荐系统研究、以及社交网络用户隐私方面的研究等。社交网络是互联网的主要组成模块之一,同时也是大数据时代的主要数据提供者之一,未来对于社交网络的研究会越来越受到学术界以及工业界的更多投入,本文对社交网络用户行为挖掘的研究现状、热点展开论述,并作出展望,提出一些目前尚缺深入研究的方向,以期对读者有所帮助。  相似文献   

17.
传统的垃圾短信过滤方案,以垃圾短信中出现的敏感词作为判断的依据,却忽略了正常短信中出现的词对分类的贡献,并且由于短信用语的灵活性,特征提取难度较大。提出了一种基于svm算法对垃圾短信进行监控和过滤的方案,该方案根据短信内容、短信长度等特征,对短信文本进行向量空间的表示。通过机器学习的方式,对垃圾短信进行判断,过滤。相比传统方法而言,本系统在过滤准确度和效率两方面均获得大幅度提升。  相似文献   

18.
新兴话题检测是社交网络研究的热点问题之一。在线社交网络特别是微博的开放性,给话题的流行和爆发提供了前所未有的便利条件。新兴话题是即将流行或爆发的话题,往往伴随着重大的事件或新闻的发生,会产生重大的社会影响,如何在早期识别此类话题,是新兴话题检测研究的主要内容。该文回顾了近年来在新兴话题检测方面的主要进展,分析了新兴话题检测领域面临的挑战,阐述了相关的概念、方法和理论,重点从内容突发特征和信息传播模型两个方面对影响新兴话题检测的方法进行了分析和讨论,并对新兴话题检测的前景做了展望。
  相似文献   

19.
胡文斌  王欢  严丽平  邱振宇  聂聪  杜博 《软件学报》2017,28(10):2693-2703
社会网络特征千差万别,演化规律错综复杂.合理地分析网络演化规律,及时地检测网络事件具有重大意义.基于链路预测的社会网络事件检测方法利用有限的网络拓扑信息,能够有效地发现网络演化的异常波动,准确地检测网络事件.然而,现有方法大多受到链路预测的宏观评价指标的限制,忽略了不同节点演化波动的差异,用相同的相似性计算指标去描述所有节点的演化波动,不利于提升事件检测的表现.为了进一步提升事件检测的精确性和敏感性,提出一种面向节点演化波动的社会网络事件检测方法NodeED,由节点相似性计算指标判定算法SimJudge和网络微观演化波动检测算法MicroFluc组成.主要工作如下:(1)结合粒子群优化算法,提出SimJudge定量地比较不同的相似性计算指标对节点演化波动的描述程度,确定每个节点在不同时段的最佳相似性计算指标;(2)为了量化事件对网络演化的影响,提出了MicroFluc,充分考虑节点演化波动的差异,从节点演化波动的角度对不同时段的网络整体演化波动进行定量评估;(3)在真实社会网络VAST和ENRON中进行对比实验,其结果表明,NodeED在VAST中的事件敏感性提升了100%,在ENRON中的事件敏感性提升了50%,更有利于精确地检测社会网络中发生的事件.  相似文献   

20.
高琳  杨建业  覃桂敏 《软件学报》2013,24(9):2042-2061
静态复杂网络研究在揭示社会网络、信息网络和生物网络的形成和演化机制方面取得了重要成果,其方法和结果对系统生物学产生了重要影响.但现实世界中,很多网络是随时间发生变化的,即动态网络.以动态网络为对象,对动态网络的拓扑特性分析、动态网络相关的各种模式挖掘模型和方法进行了综述、比较和分析.特别地,将动态网络模式分析方法应用于生物网络和社会网络,分析了生物网络相关的动态功能模块和模式演化问题、科学家合作网络和社交网络的动态模式.最后指出了动态网络的模式挖掘方法及其在动态生物网络和社会网络研究中存在的问题和挑战,并对未来的研究方向进行了分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号