首页 | 官方网站   微博 | 高级检索  
     

基于TSCM模型的网络短文本情感挖掘
引用本文:黄发良,李超雄,元昌安,汪焱,姚志强.基于TSCM模型的网络短文本情感挖掘[J].电子学报,2016,44(8):1887-1891.
作者姓名:黄发良  李超雄  元昌安  汪焱  姚志强
作者单位:1. 福建师范大学软件学院, 福建福州 350007;2. 广西师范学院计信学院, 广西南宁 530023
基金项目:国家自然科学基金(No.61370078,No.61363037);教育部人文社会科学研究青年基金项目(No.12YJCZH074);福建省教育厅科技项目(JA13077)
摘    要:针对网络短文本情感挖掘问题,提出一种新的基于LDA和互联网短评行为理论的主题情感混合模型TSCM,TSCM模型中的整篇评论中每个句子的主题分布是不同的,TSCM产生词的流程是先确定词的情感极性,再确定词的主题,TSCM考虑了词与词之间的联系.真实数据集Movie与Amazon上的大量实验表明,与代表性算法JST、S-LDA、D-PLDA和SAS相比较,TSCM模型能对用户真实情感与讨论主题进行更加有效的分析建模.

关 键 词:情感分析  主题情感混合模型  LDA  
收稿时间:2014-08-25

Mining Sentiment for Web Short Texts Based on TSCM Model
HUANG Fa-liang,LI Chao-xiong,YUAN Chang-an,WANG Yan,YAO Zhi-qiang.Mining Sentiment for Web Short Texts Based on TSCM Model[J].Acta Electronica Sinica,2016,44(8):1887-1891.
Authors:HUANG Fa-liang  LI Chao-xiong  YUAN Chang-an  WANG Yan  YAO Zhi-qiang
Affiliation:1. Faculty of Software, Fujian Normal University, Fuzhou, Fujian 350007, China;2. School of Computer and Information Engineering, Guangxi Teachers Education University, Nanning, Guangxi 530023, China
Abstract:For sentiment analysis of web short texts,a topic sentiment combining model (TSCM)is proposed based on LDA and web review behavioral theory,which is founded on the assumption that topic distribution of each sentence in a review is unique and different from that of other sentences.Generative process of TSCM is to first determine sentiment orien-tation of each word and then topic of each sentence in a review while taking word relation into consideration.Extensive ex-periments on real-world datasets (Movie and Amazon)show that TSCM significantly outperforms JST,S-LDA,D-PLDA and SAS in terms of the accuracy of sentiment classification and topic detection.
Keywords:sentiment analysis  topic sentiment mixture  latent dirichlet allocation(LDA)
本文献已被 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号