首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
提出一种基于词汇链的判断变异垃圾短信方法。该方法通过构造多条词汇链来表达短信文本的叙事线索,再从多条词汇链中抽取出富含内容信息的词汇链,同时消除了多个关键词序列表达同一内容信息的冗余;将构造的词汇链作为短信文本的信息相互进行比较,以对变异的垃圾短信信息进行识别。实验结果表明,该方法能较准确地识别垃圾短信的变异信息。  相似文献   

2.
由于用户标签的不准确和语义模糊使得协作式标注图像检索正确率低,而现有垃圾标签过滤方法往往关注标签本身,忽略了协作式标签与图像的关联性。本文在分析协作式标注图像视觉内容与标签的关联性的基础上,提出一种基于协作式标注图像视觉内容的垃圾标签检测方法。该方法分析同一标签下图像视觉内容,设计不同的核函数用于颜色和SIFT(Scale invariant feature transform)特征子集,同时将2种低维特征映射到高维多模特征空间形成混合核函数,对同一标签下的图像进行基于混合核的最大最小距离聚类,少数群体的标签说明与图像内容关联性小则为用户标注错误的标签,从而检测垃圾标签。实验结果表明,该方法能够提高协作式图像垃圾标签检测的正确性。  相似文献   

3.
针对Sina微博博文的转发关系,建立起用户转发博文之间的演化网络,从而利用SMO SVM(sequential minimal optimization support vector machine)分类算法对博文进行分类,筛选出恶意博文、垃圾广告、垃圾营销信息,使用户能够精确地屏蔽不想要的博文和博主。第一步基于微博转发关系的演化网络和SVM分类算法对整个Sina微博进行分类;第二步利用复杂网络等技术对经常发送恶意广告的博主进行标注,从而在网络中对他们进行屏蔽;最后找出垃圾信息的来源以及分辨出博主是不是恶意转发者,在宏观上能更好地遏制垃圾信息的传播。与用户从UCI数据集中实际反馈情况进行比较,实验结果表明,机器学习分类的实验结果吻合度达到89%。  相似文献   

4.
为满足无接触式垃圾分类要求,本项目拟设计基于物联网语音垃圾分类系统。项目利用在线语音识别,完成垃圾种类识别,同时采集垃圾重量信息,测量溢满程度,进行烟雾检测。信息通过 WiFi 模块上传至云数据库,搭建 PC 监控系统平台对云数据库中的垃圾桶参数进行读取与整合,实现网络云监护。本系统的设计和开发便于城市垃圾分类的普及并...  相似文献   

5.
社会化问答系统为人们提供知识共享的平台,然而网站上存在着诸如推广信息的隐性垃圾内容,这些内容在包含诸多有用的内容的基础上含有虚假的推广信息,这些虚假信息可能会带来更严重的后果,因此,如何检测及识别这些隐性的垃圾内容尤为重要。本文在任务型的网上交易平台上搜集实验数据,创新地提出了一种基于物理学牛顿第二运动定律的优化的答案排序模型,旨在原有的答案序列的基础上,加入隐性垃圾内容的特征,通过将回答者提交的答案看成是受多个“力”作用的物体,答案的排序看成是物体的下落过程,来对答案进行重新排序,使虚假信息沉淀到答案序列下方。实验证明,此模型能够快速有效地完成对答案的排序,实现按照质量对答案进行排序。  相似文献   

6.
文章针对传统网络社区挖掘的注重用户之间链接关系而忽略网络中内容信息的不足,引入了主题社区的概念,利用LatentDirichlet allocation主题模型,通过计算博主所发表博文内容的主题相关性计算博主之间的主题相关性,并重新定义博主之间的链接关系,最后进行主题社区划分。实验结果表明,引入主题空间的社区发现聚类性更好。  相似文献   

7.
为了识别商品垃圾评论,基于垃评论员发表的多为垃圾评论这一基本思想,提出一种基于评论员评论行为来判定其是否为垃圾评论员的方法。分析定义了垃圾评论员常见的三类评论行为,分别是针对同类商品发表垃圾评论,针对同品牌商品发表垃圾评论和针对同一卖家商品发表垃圾评论;在对这三类评论行为建模的同时提出一种依据重复性过高或过低打分的评论数量来计算评论员垃圾指数(spam score)的方法。实验数据为在当当网摄影摄像商品区发表过评论的评论员的所有评论信息。实验结果通过人工评判和计算NDCG(normalize discounted cumulative gain)值的方法来检验,实验结果准确有效。  相似文献   

8.
在协作式认知无线电频谱感知中,恶意节点会通过向数据融合中心传送虚假的感知信息来降低整个网络的频谱感知性能.为了提高协作感知对虚假感知信息攻击的免疫力,提出一种基于加权序贯似然比检测技术的鲁棒协作式频谱感知方案.通过采用信誉记录,权值分配和多线程检测三种机制,能够做到有效判别和剔除恶意节点,提高了协作式频谱感知的鲁棒性.  相似文献   

9.
逆向工程中反射植入的研究   总被引:17,自引:0,他引:17  
逆向工程辅助程序理解,而动态分析是理解面向对象软件系统的一种重要手段,通过植入,才能准确提取系统运行时的信息,常见的植入方法中,植入代码和目标代码处于同一计算层次,在植入过程中,需要对目标代码进行除编译分析之外的额外语法分析。该文提出反射植入思想,将植入的软件触发器和被植入的目标系统作为两个计算层次来处理,通过反射层元对象干预编译过程,实现源代码的植入;首先详细描述反射植入核心算法及识别调用方元信息和对象标识的思路,然后在扩充开放编译器的基础上实现了全局函数和系统调用语句前植入代码的算法,最后对该植入机制进行系统的实验研究。结果表明,反射植入机制不会破坏源代码本身的执行逻辑,能正确有效地植入代码并收集到系统运行时的信息。同时,多次植入的对比数据也证明了反射植入算法的收敛性。  相似文献   

10.
张建  严珂  马祥 《计算机应用》2022,42(3):770-777
垃圾信息的识别是自然语言处理方面主要的任务之一.传统方法是基于文本特征或词频的方法,其识别准确率主要依赖于特定关键词的出现与否,存在对关键词识别错误或对未出现关键词的垃圾信息文本识别能力较差的问题,提出基于神经网络的方法.首先,利用传统方法针对这一类垃圾信息文本进行识别训练和测试;然后,利用从垃圾短信、广告和垃圾邮件数...  相似文献   

11.
基于神经网络的"垃圾"邮件过滤系统设计   总被引:2,自引:0,他引:2  
为了对垃圾邮件进行有效地过滤,以神经网络作为分类器,采用由垃圾邮件发送者进行确认的邮件认证方法设计了邮件过滤系统。神经网络的自学习、自适应能力解决了垃圾邮件特征不断变化而过滤方法相对固定的矛盾。新的垃圾邮件认证方法使发送垃圾邮件比接收垃圾邮件更费时间,减少了用户收到垃圾邮件的数量。  相似文献   

12.
林冬茂 《计算机仿真》2012,29(2):120-123
研究垃圾邮件检测准确性问题,提高网络安全。邮件特征具有高维、冗余量大,传统检测模型无法降低特征维数,冗余信息难以消除,导致计算时间长,空间复杂度大,垃圾检测正确率低等缺陷,为提高垃圾检测正确率,提出一种白名单和支持向量机相结合的两层垃圾邮件检测模型。采用聚类特征技术对特征进行聚类,降低特征维数,消除特征间冗余信息,将白名单检测技术作为垃圾检测系统第一道防线,检测已知地址垃圾邮件,支持向量机作为第二道防线,检测新的垃圾邮件,提高网络安全。采用垃圾邮件数据对模型性能进行检验,实验结果表明,两层垃圾邮件检测模型有效提高了垃圾邮件检测效率和正确率,为通信邮件管理提供了有效的手段。  相似文献   

13.
改进ReliefF算法在图像型垃圾邮件检测中的应用研究*   总被引:1,自引:0,他引:1  
图像型垃圾邮件的传播给社会和人民生活造成了极大的负面影响。一些垃圾图像过滤技术的应用在一定程度上遏制了它的泛滥,但是在时间消耗和精确度方面很难兼顾。在对垃圾邮件图像的特征数据深入分析后,提出一种基于特征冗余度的ReliefF特征选择算法(R-ReliefF算法)。本算法首先获取图像特征,结合数据特征进行离散化,并对这些离散化后的特征集合进行优化,最后应用在垃圾图像识别上。对比发现,优化后提取的特征子集在识别垃圾邮件图像方面既减少了时间消耗,又提高了垃圾图像识别的精确度。  相似文献   

14.
产品垃圾评论检测研究综述   总被引:4,自引:2,他引:2  
互联网上的产品垃圾评论混淆视听,误导了潜在消费者。产品垃圾评论检测的目的就是将垃圾评论从评论文本中找到并去除,保留真实的产品评论供用户参考。首先将产品垃圾评论和互联网上其它常见的垃圾信息进行了对比,并把产品垃圾评论的检测和产品评论的质量判断、产品评论的情感分析等相关的工作进行了比较分析。然后从产品垃圾评论检测的数据集、检测方法两个角度对相关工作做了概述和分析。最后,在上述工作的基础上提出了一些产品垃圾评论检测研究中值得进一步关注的问题。  相似文献   

15.
简单贝叶斯算法在邮件过滤领域使用得比较普遍.该算法的优点是简单、对特征较为恒定的垃圾邮件较为有效,但其适应性较差.谨提出一种以贝叶斯公式为基础的自适应垃圾邮件过滤方法,它采用基于词熵的特征提取方法,在过滤过程中不断地进行自学习,具有较强的自适应能力.  相似文献   

16.
随着电子邮件的广泛应用,邮件系统的安全性对整个系统的安全起到了很重要的作用。配置不安全的邮件服务器,可能会受到从拒绝服务、入侵到邮件中继、垃圾邮件之类的攻击。针对垃圾邮件问题,介绍了在Linux平台下Postfix中实现SMTP阶段的垃圾邮件的过滤和通过SMTP的认证来防止垃圾邮件的方法。  相似文献   

17.
Web spam has become one of the most exciting challenges and threats to web search engines. The relationship between the search systems and those who try to manipulate them came up with the field of adversarial information retrieval. In this article, we set up several experiments to compare HostRank and TrustRank to show how effective it is for TrustRank to combat web spam, and we report a comparison on different link-based web spam detection algorithms.  相似文献   

18.
本文首先提出链接分析法中存在的垃圾页面问题并将其形式化描述出来;再从两个角度分别介绍了挑选种子页面集的思想;然后在改进现有PageRank算法的基础上提出了垃圾页面检测算法;同时给出了几个表征检测算法效率的性能指标,最后简要阐述了基于信任指数的对抗web垃圾页面方案。  相似文献   

19.
一种抵抗链接作弊的PageRank改进算法   总被引:3,自引:0,他引:3  
大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性。该文在分析多种作弊方法对传统PageRank算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法-TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值。  相似文献   

20.
基于P2P协作的垃圾邮件发送行为识别技术研究   总被引:1,自引:0,他引:1       下载免费PDF全文
在分析目前垃圾邮件过滤技术的基础上,并根据垃圾邮件大量发送行为特征,提出了一种基于P2P协作的垃圾邮件发送行为识别技术。该技术将各邮件服务器组成一个反垃圾邮件(Anti-Spam)P2P网络,每个邮件服务器储存可疑邮件信息并将这些信息共享在Anti-Spam P2P网络上,然后根据可疑邮件信息在Anti-Spam P2P网络上进行协作识别垃圾邮件。实验结果表明,该技术是针对垃圾邮件的群发特征而不依赖于邮件内容、语言类型或格式分析,在MTA阶段就能过滤大量垃圾邮件,提高了处理速度和准确率并节省大量的系统资源,具有良好的过滤性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号