首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着移动互联网时代的到来,针对各大网站产生的海量发帖信息,该文设计了一个恶意发帖检测系统,将海量的帖子进行分析整理,找到恶意发帖信息。本系统采用文本情感分析和数据挖掘技术,对互联网中的帖子信息进行分类整理,建立帖子库,接着对帖子进行文本情感分析,聚类恶意发帖信息,最后采用SVM算法对恶意发帖进行分类,识别出具体的恶意发帖并进行预警处理,具有较高的实际应用价值。  相似文献   

2.
随着互联网快速发展,网络上的影评文本资源急速增长.面对海量的网络资源信息,应用计算机情感分析的技术进行自动文本资源分析,挖掘出影评文本中蕴含的评论人的情感动态.通过评论人的情感动态进行情感分析,得到评论人对电影评论的情感结果.影视公司根据评论分析的情感结果可以更加精确地把用户喜欢的电影推荐给用户.  相似文献   

3.
随着移动互联网的发展,以商品评论等带有主观性的短文本信息急剧增加.海量的文本信息使得人工管理越来越困难.本文以商品评论为研究对象进行情感分析.针对商品评论为短文本的特点,本文在词向量的基础上提出了词向量叠加方法和加权词向量方法进行文本特征的提取,从而更深层次的提取短文本特征.在进行评论情感分析模型性能的比较中,说明了本文所提方法的有效性.基于情感分析技术可以解决人工难以胜任的海量商品评论的分类,方便用户快速获取有效信息.  相似文献   

4.
面对大数据时代消费者评价的海量信息,为了识别消费者评价信息的情感倾向,及时掌握消费者的评价信息反馈,采用K-近邻(KNN)算法对消费者评价信息进行情感分类,但是该算法在文本分类过程中因文本特征向量的维度高,使得算法的时间复杂度和空间复杂度较高,计算的开销很大。针对这一问题,通过对获取信息的文本结构以及情感表达特点的分析,采用一种改进的KNN算法进行文本情感分类。在对消费者评价信息进行分类时,先由潜在语义分析算法对文本特征向量进行降维处理,然后利用加权KNN算法进行分类。实验结果表明,该方法在提高文本分类速度的同时保持了良好的分类效果。  相似文献   

5.
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF算法对文本褒贬倾向性分类是有效的。  相似文献   

6.
随着互联网信息的高速发展,越来越多的人参与到信息的制造者队伍中,对于信息处理提出了更高的要求。计算文本的情感描述值对于衡量文本的极性信息具有重要的意义。首先对文本内容进行预处理,挑选出可以决定文本极性的句子;然后对各个子句进行情感描述值的计算;最后将子句的情感进行综合计算,得出文本的情感描述值。并且对文本长度、句法结构等因素进行了综合分析。实验结果表明,采用该算法计算文本信息具有较高的准确率和速度,对于大规模处理流数据情况下的情感信息值的计算具有较好的适用性。  相似文献   

7.
随着网络的发展,Web论坛成为Web用户信息共享和分组合作的新平台.Web论坛上积累了海量的知识,由此成为互联网上进行数据挖掘的宝贵资源.在Web论坛上的应用常受到论坛上低质量帖子(垃圾贴)的影响.因此针对在Web论坛上进行垃圾贴过滤的问题,提出了基于隐含狄利克雷分布的CJTM和CAJTM模型,CJTM和CAJTM模型利用了论坛帖子的文本内容,帖子间的回复链接信息和作者信息,和传统的分类方法及基于规则的方法相比,CJTM和CAJTM模型不需要训练集和规则集.在实际Web论坛数据中进行的实验显示出较好的效果.  相似文献   

8.
互联网购物逐渐走进人们生活,人们在购物的同时也会留下海量评论文本,这些文本蕴含着巨大的价值和情感倾向,通过分析这些服装电商评论文本情感倾向,为推荐系统提供了参考.传统的算法难以提取到文本更深层次的情感特征,难以达到很好的效果.因此,该文提出了一种基于多层注意力机制BiGRU-SD-Attention的算法模型.首先,通...  相似文献   

9.
吴晶  陈仪香  刘道明 《计算机工程》2012,38(13):254-256,259
为更好地揣摩大众股民的心理及情感,提出一种基于网络论坛的股市分析方法。根据python实现相应的网络爬虫,利用该爬虫获取网络论坛中的所有帖子,对每日新帖子的数量进行统计分析,针对每个帖子中的文本内容设计分析工具,以进行情感分析,并将这些情感结果进行统计。实验结果表明,通过对比同一时期内的中国股市走势图,该方法能对其进行较为准确的分析。  相似文献   

10.
新闻文本情感旨在对带有情感信息的文本,通过提炼、浓缩而产生表达文本全局情感意见的情感,用以帮助人们快速获取文本的情感倾向和主旨内容。文章主要针对网络上的海量新闻文本,研究单文档的情感。首先,该方法对文本中的句子进行情感标注。其次,通过LexRank算法与情感信息计算句子相似度。最后,根据新闻标题的特殊性计算句子与标题的相似性,综合以上考虑得到情感。实验结果表明,相比于原有的LexRank算法,该文采用的方法能够更加有效的生成带有情感色彩并且最能表达文章主旨内容的情感。  相似文献   

11.
大家清楚,论坛的帖子左侧显示发帖入和回帖入的昵称、头像、身份等信息,右侧显示的才是帖子内容。在标准的1024×768分辨率下,帖子每行最多显示79个英文字符(大概39个汉字)。虽然贴文章时,论坛会自动分段,但是有时内容会莫名其妙地弄得乱七八糟。所以,这里建议发帖前使用Word对篇幅比较大的帖子文章自动分行。  相似文献   

12.
文本语言的情感分析历来是自然语言处理领域的热点研究课题,尤其是在当下互联网迈入web2.0时代,多样的社交网络平台呈现出巨量而丰富的文本情感信息,因此挖掘网络数据文本信息并作情感倾向判断对人机交互与人工智能具有重大的现实意义。传统的解决文本情感分析问题的方法主要是浅层学习算法,利用回归、分类等方案实现特征的提取及分类。以这类方法为起点,本文探索采用深度学习的方法对网络文本进行细粒度的情感分析,以期达到即时获取依附于网络世界的社会人的情感,甚至是让机器达到对人类情感表达的深度理解。对于深度学习的具体实现,本文采用的是降噪自编码器来对文本进行无标记特征学习并进行情感分类,后文中利用实验训练获得最佳的参数设置,并通过对实验结果的分析和评估论证深度学习对于情感信息的强大解析能力。  相似文献   

13.
自web进入2.0时代以来,互联网社交信息爆炸式地融入了人民生活,对海量社交网络信息的分析成为文本分析领域的一个重要研究方向.本文通过整理情感词典,制定语义规则,分析评测中文微博的情感色彩并与GIS空间分析方法相结合绘制出了情感地图.试图以客观的评价手段,对主观情绪进行科学计量化描述,并以地图为载体进行直观表达.论文将微博情感分析结果作为公民幸福指数的评价参考,同时,将地理信息科学与传统的情感分析相结合制作出情感地图,能够为国民幸福指数宏观评价及其空间分布特征提供更直观的展示和参考.  相似文献   

14.
随着互联网的快速发展,网络中充斥着海量主观性文本,如何对这些主观性语句进行情感倾向性判断是文本情感分析的关键。本文提出一种基于词向量和句法树的中文句子情感分析方法。针对目前大量网络新词的使用所带来的问题,以已有标注的情感词典为基础,采用词向量的方法判断词语之间的语义相似度,从而得到未知词语的情感极性。针对情感极性转移现象,定义相应的情感判断规则。在此基础上,利用句子的句法树结构,对句子进行情感倾向性分析。实验证明,该方法在一定程度上解决了网络新词的问题,有效提高了句子情感分析的准确率和召回率,且具有领域适用性。  相似文献   

15.
随着互联网的迅猛发展,对网络文本带有观点性内容的主观性信息的自动情感分析成为了近期Web信息处理的一个新兴研究热点.文中对英文博客文本的情感分析进行了研究.提出了以词为单位进行特征的选取,并在文本的情感分析中加入了预处理过程.使用机器学习的方法,采用电影评审文本作为语料库,选取在英文文本分类领域较好的支持向量机作为训练器,特征的选取分别采用信息增益、互信息和x2统计的方法.实验结果表明,该方法获得了较满意的结果,与传统的基于N-Gram特征选取方法及基于无监督学习的方法相比,该方法较之都有所提高.  相似文献   

16.
在当今信息爆炸的互联网时代,社交平台上的短文本已经成为一种表达情感的流行方式,且其影响力日益增长。分析短文本的情感偏好,对了解公众舆论走向起到了重要作用。基于此,通过对短文本中比较常见的一种类型,即中英文混合的短文本进行情感分析,提出了基于BERT词向量和Bi-LSTM+Attention的神经网络模型,解决了此类短文本中的情感分析问题。  相似文献   

17.
随着互联网的发展,网络论坛中蕴涵着数量巨大且质量较好的知识资源。因此对论坛信息进行有效地检索具有重要应用价值。该文研究适合于论坛数据的检索模型,以期能够充分利用论坛平台累积的海量数据来满足用户的信息需求。针对论坛页面和普通新闻页面的区别,该文提出关键帖抽取算法和论坛线索重构算法来选择论坛中信息含量丰富的帖子,并利用得到的帖子构建检索系统。实验表明该文提出的方法能够有效地提升论坛检索系统的效果。  相似文献   

18.
中文文本情感词典构建方法   总被引:1,自引:0,他引:1  
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。  相似文献   

19.
海量的观影评论包含着广大观众对影视作品各方面的偏好,可以为影视剧的拍摄和宣传提供决策支持。提出影视剧在线评论分析模型:利用Python爬取传媒平台的评论信息,经过数据预处理和分词,分别采用SVM方法和LSTM方法对短评文本和长评文本进行情感极性分析,运用统计和可视化方法研究评论词语、语义网络关系、情感倾向演化、文本内容特征和地域热度分布。以公安剧《狂飙》为例进行实证分析,结果表明所提模型可以合理揭示总体情感热度演变规律,发现观众发表评论的内容偏好、行为规律和地域特征。  相似文献   

20.
互联网话题识别与跟踪系统设计及实现   总被引:1,自引:0,他引:1       下载免费PDF全文
针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题。该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号