面向短文本情感分析的词扩充LDA模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向短文本情感分析的词扩充LDA模型

作者姓名：	沈冀马志强李图雅张力

作者单位：	内蒙古工业大学信息工程学院, 内蒙古呼和浩特 010080

基金项目：	国家自然科学基金资助项目(61650205);内蒙古自治区自然科学基金资助项目(2014MS0608)

摘要：	针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation, LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。
关键词：	短文本情感分析隐含狄利克雷分配无监督学习词扩充文档-主题生成模型
收稿时间：	2017-05-09
本文献已被 CNKI 等数据库收录！
	点击此处可从《山东大学学报(工学版)》浏览原始摘要信息
	点击此处可从《山东大学学报(工学版)》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏