首页 | 官方网站   微博 | 高级检索  
     

基于双语词典的微博多类情感分析方法
引用本文:栗雨晴,礼欣,韩煦,宋丹丹,廖乐健.基于双语词典的微博多类情感分析方法[J].电子学报,2016,44(9):2068-2073.
作者姓名:栗雨晴  礼欣  韩煦  宋丹丹  廖乐健
作者单位:1. 北京理工大学计算机学院, 北京 100081; 2. 北京市海量语言信息处理与云计算应用工程技术研究中心, 北京 100081
基金项目:国家重点基础研究发展规划(973计划)项目(No.2013CB329605);国家自然科学基金(61300178)
摘    要:现有微博文本情感分析方法多面向单一语种语料,如:中文语料.但是,中英文搭配使用的表达习惯已逐渐成为个体意见表达的重要形式.本文提出一种基于双语词典的多类情感分析方法,通过构建双语多类情感词典对微博文本进行多分类语义倾向性分析,以便更准确有效捕捉群体意见,及时发现社会舆论倾向.通过与多数投票算法、支持向量机算法、基于余弦距离的K近邻分类算法相比,本文提出的基于双语词典的多类情感分析模型具有良好的分类效果,其在分类准确率、F1值等方面都有明显提高.

关 键 词:双语语义倾向性分析  半监督高斯混合模型  相对熵  情感词典  
收稿时间:2015-02-03

A Bilingual Lexicon-Based Multi-class Semantic Orientation Analysis for Microblogs
LI Yu-qing,LI Xin,HAN Xu,SONG Dan-dan,LIAO Le-jian.A Bilingual Lexicon-Based Multi-class Semantic Orientation Analysis for Microblogs[J].Acta Electronica Sinica,2016,44(9):2068-2073.
Authors:LI Yu-qing  LI Xin  HAN Xu  SONG Dan-dan  LIAO Le-jian
Affiliation:1. School of Computer Science, Beijing Institute of Technology, Beijing 100081, China; 2. Beijing Engineering Application Research Center of High Volume Language Information Processing and Cloud Computing, Beijing 100081, China
Abstract:Most of the existing Weibo sentiment analysis focuses on monolingual corpus like Chinese.However,a mixed use of Chinese and English becomes a popular form of expression.To better capture the social attention on public e-vents,this paper proposes a bilingual lexicon based multi-class semantic orientation analysis for bilingual microblogs.We compare our proposed methodologies with majority vote,support vector machine (SVM)and K-nearest neighbor (KNN) by using cosine similarity which are competitive baseline methods.The experimental results show that our proposed methods outperform the three approaches we mentioned in terms of the accuracy and F1 score.
Keywords:bilingual semantic orientation analysis  semi-supervised gaussian mixture model (Semi-GMM)  Kull-back-Leibler divergence  sentiment lexicon
本文献已被 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号