首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种基于朴素贝叶斯的微博情感分类   总被引:1,自引:0,他引:1  
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。  相似文献   

2.
杨鼎  阳爱民 《计算机应用研究》2010,27(10):3737-3739
基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法。这种方法利用情感词典对文本进行处理和表示,基于朴素贝叶斯理论构建文本情感分类器,并以互联网上宾馆中文评论作为分类研究的对象。实验表明,使用提出的方法构成的分类器具有分类速度快、分类准确度高、鲁棒性强等特点,并且适合于大量中文文本情感分类应用系统。  相似文献   

3.
表情符号作为一种新的网络语言,在微博中被广泛采用,在一定程度上代表了用户的情绪和思想,也将影响微博情感倾向分析的结果。该文提出基于微博统计数据为表情符号构建情感词典的思想,通过对大量微博中与表情"共现"的文本的情感倾向分析,确定表情的情感倾向,以此构建面向情感倾向分析的表情情感词典,旨在为微博乃至其它采用表情符号的Web用户生成信息的情感倾向分析提供支持。进而,该文将表情情感词典反作用于对应的微博文本,重新度量其中情感词的倾向值,改进现有的情感词典,旨在获得更准确的情感倾向分析结果。实验表明了该方法的有效性,并分析了相关阈值的设置对结果的影响。  相似文献   

4.
中文文本情感词典构建方法   总被引:1,自引:0,他引:1  
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。  相似文献   

5.
一种改进的级联AdaBoost分类器   总被引:1,自引:0,他引:1  
柳锋  朱庆生  杨世泉  张敏 《计算机应用》2007,27(12):3029-3031
在基于级联结构的AdaBoost分类器中引入了辅助判决函数。当样本被某级AdaBoost分类器判为假后,使用该级的辅助判决函数对其进行二次判决。辅助判决函数不仅考虑了当前级分类器的判决结果,还考虑前面分类器的历史判决信息。实验结果表明,该方法相对级联AdaBoost分类器以及二维级联AdaBoost具有更好的识别效果。  相似文献   

6.
微博情感研究已成为网络文本分析的重要研究领域,微博情感词典是进行微博情感分类的基础。提出一种在分析海量微博语料情感的过程中,自动构建情感词典的方法。方法自动从语料中获取情感词汇、筛选确定情感新词,使用SO-MB 算法计算新情感词的情感极性及强度,构建微博情感词典,结合规则对中文微博进行无监督情感分类。实验证明提出的微博情感词典的构建方法及微博情感分类方法是有效的。  相似文献   

7.
随着微博在网民中日益火热,社会热点问题容易快速地演变成微博热门话题。由于微博用户多、数据量大、情感复杂的特性,通过情感分析来准确地获取微博潜藏的社会价值、商业价值变得十分迫切。该文通过构建情感词典,查找语义规则,并将情感词典与规则结合,建立微博情感分析模型,实验结果表明本文方法在负向情感判别方面效果优于SVM,并且在微博语料较短时,整体分类效果也优于SVM。  相似文献   

8.
郑诚  杨希  张吉赓 《数字社区&智能家居》2014,(13):3111-3113,3123
随着微博在网民中日益火热,社会热点问题容易快速地演变成微博热门话题。由于微博用户多、数据量大、情感复杂的特性,通过情感分析来准确地获取微博潜藏的社会价值、商业价值变得十分迫切。该文通过构建情感词典,查找语义规则,并将情感词典与规则结合,建立微博情感分析模型,实验结果表明本文方法在负向情感判别方面效果优于SVM,并且在微博语料较短时,整体分类效果也优于SVM。  相似文献   

9.
现代社会网络招聘兴起,为社会、企业节省了不少物力、人力、财力,但如何快速、简捷地从众多的电子简历中找出符合要求的简历又是一个让人头疼的问题.文中在贝叶斯网络的基础上,分别从朴素贝叶斯分类器和 TAN 分类器角度,构建一个基于贝叶斯分类器的电子简历筛选模型,并通过实验验证该模型对电子简历进行分类时的准确率和查全率,且引入一个新的评价指标 f 同时考虑准确率和查全率,得出没有属性变量相互独立限制的 TAN 分类器具有较好的分类效果的结论.  相似文献   

10.
伴随着互联网的广泛流行,以微博为代表的社交网络产生了大量的数据. 从这些数据中挖掘到有用的信息成为当今研究的一项重要方向. 根据微博文本的特点,本文提出来一种基于联合分类器过滤掉噪声微博,然后利用LDA模型进行主题发现. 联合分类器模型是由朴素贝叶斯、支持向量机和决策树三种模型通过简单投票机制结合构成的,实验结果联合分类器的准确度达到87%,显然这种分类方法是可行的,也是有效的.  相似文献   

11.
基于单层标注级联模型的篇章情感倾向分析   总被引:1,自引:0,他引:1  
情感分类是目前篇章情感分析的主要方法,但该方法存在难以融入中文结构特征的问题。针对此问题,采用级联模型对篇章情感倾向进行分析,将篇章情感倾向分析分为两层 小句级和篇章级,对篇章情感倾向分析引入小句级的情感分析。该文使用最大熵模型处理小句级情感分类,小句级的输出作为上层篇章级的输入,并结合句型特征和句子位置等信息作为特征,采用支持向量机模型进行篇章级情感分类。同时对于级联模型中双层标注问题,基于交叉验证的思想提出了单层标注级联模型,避免了多层标注工作以及错误。实验结果表明,该方法的准确率较传统情感分类方法提高了2.53%。  相似文献   

12.
Multi-Domain Sentiment Classification with Classifier Combination   总被引:1,自引:0,他引:1       下载免费PDF全文
State-of-the-arts studies on sentiment classification are typically domain-dependent and domain-restricted.In this paper,we aim to reduce domain dependency and improve overall performance simultaneously by proposing an efficient multi-domain sentiment classification algorithm.Our method employs the approach of multiple classifier combination.In this approach,we first train single domain classifiers separately with domain specific data,and then combine the classifiers for the final decision.Our experiments show that this approach performs much better than both single domain classification approach(using the training data individually) and mixed domain classification approach(simply combining all the training data).In particular,classifier combination with weighted sum rule obtains an average error reduction of 27.6%over single domain classification.  相似文献   

13.
高华玲  张晶 《软件》2021,42(1):45-47,66
为研究高端酒店服务中的亮点和不足,分析酒店用户评论舆情,文章对高端酒店用户评论进行情感分析和可视化,提出酒店优势与改进策略。文章采用通用情感词典Hownet与酒店评论相关的评论领域专业词典相结合的方式构建领域情感词典。结合所构建的领域情感词典和其他特殊词典,比如短语词典、否定词词典和副词词典等进行情感分类,然后将分类完成的三个极性的情感词进行词频统计和词云绘制,最后根据词云结果,给出高端酒店在经营策略上的改进建议。  相似文献   

14.
情感分析作为文本挖掘的一个新型领域,可用于分类、归纳用户发布的产品评论,从而有助于商家改善服务,提高产品质量;同时为其他消费者提供购买决策。本文提出一种基于情感词抽取与LDA特征表示的情感分析方法,对产品评论进行褒贬二元分类。在情感词抽取中,采用人工构造的情感词典对预处理之后的文本抽取情感词;用LDA模型建立文档的主题分布,以评论-主题分布作为特征,用SVM分类器进行分类。实验结果表明,本文方法在评论褒贬分类方面有着良好的效果。  相似文献   

15.
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。  相似文献   

16.
自web进入2.0时代以来,互联网社交信息爆炸式地融入了人民生活,对海量社交网络信息的分析成为文本分析领域的一个重要研究方向.本文通过整理情感词典,制定语义规则,分析评测中文微博的情感色彩并与GIS空间分析方法相结合绘制出了情感地图.试图以客观的评价手段,对主观情绪进行科学计量化描述,并以地图为载体进行直观表达.论文将微博情感分析结果作为公民幸福指数的评价参考,同时,将地理信息科学与传统的情感分析相结合制作出情感地图,能够为国民幸福指数宏观评价及其空间分布特征提供更直观的展示和参考.  相似文献   

17.
文本情感分析是近年来迅速兴起的一个研究课题,具有显著的研究价值和应用价值。情感词典的构建在情感分析任务中发挥着越来越重要的影响力。该文对情感词典构建的研究进展进行了总结。首先重点介绍了情感词典构建的研究现状,将其归纳为四种方法,即基于启发式规则的方法、基于图的方法、基于词对齐模型的方法以及基于表示学习的方法,并对每种方法进行介绍和分析;然后对一些常见的语料库、词典资源以及评测组织进行介绍;最后,对情感词典的构建进行了总结,并对发展趋势进行了展望。
  相似文献   

18.
提出一种基于文本特征的专门面向酒店评论领域的情感分析模型,通过构建酒店评论领域专用情感词典,并结合酒店评论的句式特征、语法特点,解决了通用情感分析模型应用在酒店评论领域时,情感匹配不全面,情感值计算不精确等问题.本文实验结果表明,基于文本特征的情感分析模型能对酒店评论情感分析取得较好的分类效果.  相似文献   

19.
目前中文情感分析的主要资源以情感词典为主,缺乏针对实体或属性的情感知识资源。该文主要研究如何从大规模文本语料中自动获取实体情感知识。在该文方法中,用情感表达组合来表示实体情感知识。首先,基于二部图排序算法对情感表达组合候选集合进行排序。然后,提出了一种基于语义相似的提炼算法对于排序靠后的表达组合进行选择。在提炼选择过程中,充分考虑实体之间和情感词之间的约束。最后,该文在三种大规模不同领域的语料上进行实验,并进行人工评价。评价结果表明,从三个领域数据集上获取的实体情感表达组合正确率均高于90%。最终我们获得了一个大规模情感知识词典,包括约30万对的情感表达组合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号