首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有方法存在的领域依赖问题.通过在测试语料库上进行实验,该模型在文本情感倾向性分类任务中的准确率达到82.6%,具有和监督分类系统相当的性能;挖掘话题集合呈现层次化、语义相关的特点,证明了MG-TSJ模型对观点挖掘是可行的和有效的.  相似文献   

2.
面向目标的情感分析是细粒度情感分析的重要任务之一,旨在预测句子中给定目标实体的情感极性.当前大多数研究方法忽略了句法结构信息,在情感判别时往往会关注无关词汇,从而使分类性能下降.为此,设计了一种新的引入句法结构的模型,该模型利用双向预训练编码器和作用于依存句法树的图卷积网络分别捕获文本的上下文信息和句法结构信息,并使用多头注意力机制进行信息聚合得到目标的情感分类表征.此外,还将该模型与现有的领域自适应方法相结合,同时向模型中引入领域知识和句法结构知识,进一步提升了模型效果.在几个常用的标准数据集上的实验结果表明了上述模型的有效性.  相似文献   

3.
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation, LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。  相似文献   

4.
分析了高校网络舆情监控的现状,提出了基于高校网络舆情监控系统的设计方案。该系统通过网络爬虫将相关网络新闻、博客和论坛的信息采集下来,采用关键词和敏感词匹配的方式对信息进行过滤,将用户关注的信息呈现出来,从而实现对舆情信息及时准确的发现。  相似文献   

5.
针对在线中文评论中用户主观意见的不确定性,提出一种基于不确定理论的情感分析模型,并结合情感分析模型设计了个性化推荐算法。采用分词工具ICTCLAS和IKAnalyzer预处理在线中文评论,并基于情感词典(HowNet)计算特征词的点互信息值;应用不确定变量与不确定集设计情感分析模型;根据情感分析模型设计新的最近邻居搜索方法并产生推荐。在两个真实数据集上进行试验,试验结果表明,该方法能够有效改进推荐结果的准确率,缓解数据稀疏问题。  相似文献   

6.
无扩展的情感词识别方法对于倾向容易发生演化的社区媒体信息的召回率很低.基于此,提出了一种基于依存关联分析的情感词扩展识别方法,首先对文本进行新词和短语发现;再对句子的依存树进行剪枝和归并;然后按照给定的策略进行情感词和评价对象的扩展;最后得到情感词扩展的识别结果.该方法能同时扩展具有直接依存关系和间接依存关系的情感词. 实验结果表明该方法有效.  相似文献   

7.
针对在热点话题追踪过程中容易发生话题漂移的问题,提出了基于相关性反馈的自适应热点话题追踪模型。为准确把握话题的动态演变过程,首先,在词频-逆向文档频率(term frequency-inverse document frequency, TF-IDF)的基础上引入了相关度因子。其次,构造了报道与话题的相关度计算公式和新特征词能否反馈加入到话题词汇库的判别函数。同时,利用了话题词汇库本身的特性,构造了自适应更新阈值和自适应相关阈值的动态计算方法。最后,根据各个特征词对该话题贡献度的大小,对更新后的词汇库中的各特征词动态赋予新权重。实验结果显示,和其它3类追踪器相比,该追踪器模型的漏报率平均降低0.018、误报率平均降低0.063,这表明,该追踪模型更适合于解决话题漂移问题。  相似文献   

8.
文本情感分类是近年来自然语言处理领域的研究热点,旨在对文本蕴含的主观倾向进行分析,其中,基于特定目标的细粒度情感分类问题正受到越来越多的关注。在传统的深度模型中加入注意力机制,可以使分类性能显著提升。针对中文的语言特点,提出一种结合多跳注意力机制和卷积神经网络的深度模型(MHA-CNN)。该模型利用多维组合特征弥补一维特征注意力机制的不足,可以在没有任何先验知识的情况下,获取更深层次的目标情感特征信息。相对基于注意力机制的LSTM网络,该模型训练时间开销更小,并能保留特征的局部词序信息。最后在一个网络公开中文数据集(包含6类领域数据)上进行实验,取得了比普通深度网络模型、基于注意力机制的LSTM模型以及基于注意力机制的深度记忆网络模型更好的分类效果。  相似文献   

9.
针对LSTM网络进行主题词提取时因没有考虑中心词的下文对主题词的影响而导致提取准确率低的问题,提出了一种双向LSTM引入Attention机制模型(Att-iBi-LSTM)的主题词提取方法。首先利用LSTM模型将中心词的上文和下文信息在两个方向上建模;然后在双向LSTM模型中引入注意力机制,为影响力更高的特征分配更高的权重;最后利用softmax层将文档中的词分为主题词或非主题词。并且还提出了一种两阶段模型训练方法,即在自动标注的训练集上进行预训练之后,再利用人工标注数据集训练模型。实验在体育、娱乐和科技3种新闻文本上进行主题词提取任务,实验结果表明本文提出的Att-iBi-LSTM模型与SVM、TextRank和LSTM相比F1值分别提高了13.78%、24.31%和3.32%,使用两阶段训练方法的Att-iBi-LSTM比一阶段训练的F1值提高了1.56%。  相似文献   

10.
PageRank模型在中文情感词极性判别中的应用   总被引:1,自引:1,他引:0  
针对倾向性分析任务重的基础性工作——情感词的极性判断工作,提供了一种基于PageTank模型的情感词极性判断方法.由待判别情感词和少量中子情感词构成图中的节点,利用知网(HowNet)语义资源计算词语间的语义想死度,进而得到图中节点间边的权重.通过PageRank模型的引入,综合利用有标种子情感词和无标待判别情感词实现对无标情感词的极性判别.与传统的基于HowNet的情感词判别方法相比,PageRank模型的引入使情感词判别的准确率平均提高10%左右,充分验证了所提方法的可行性.  相似文献   

11.
微博中的意见领袖不仅在社交网络的信息传播中发挥着举足轻重的作用,而且在网络舆情演化中也表现出显著的意见代表性。针对已有的意见领袖挖掘方法仅从复杂网络或者基本图模型来建模发现意见领袖,忽略了意见领袖在具体的话题演化中的意见代表性的问题,提出了基于话题演化的意见领袖发现的方法。该方法首先根据用户之间的交互构建图模型,然后利用寻找中心节点的图论算法挖掘潜在意见领袖,再利用话题演化模型判断潜在意见领袖的演化中心度,最后发现在整体舆情上的具有意见代表性的真实意见领袖。在新浪微博的话题数据集上的试验结果表明,该算法较仅考虑网络模型的意见领袖发现方法更优。  相似文献   

12.
舆论和舆情是一对从属概念,两者既有共同点又有差异性,必须对两者进行必要的关系辨析。本文从两者的内涵界定出发,对两者的共同点进行了研究,并从四个方面解构了两者的差异性,旨在为舆论和舆情的基础研究提供新的视角。  相似文献   

13.
为实现产品意见挖掘中的隐式产品属性抽取,在传统主题建模思想的基础上,通过分析评论信息中不同产品属性对应的意见词分布以及意见词的主题依赖性假设,提出一种基于正则化思想的新主题建模框架.在该框架下,评论信息中的意见词特征,通过定义在不同评论中意见词的使用相似度上的正则化因子,纳入到传统的主题建模框架中.正则化的基本思想为:若2条评论在意见词的使用模式上相似,则它们评论相同的产品属性的概率越高.定性和定量2种实验结果均表明,本文的正则化主题模型较传统的主题模型算法有更高的准确率,说明本文的正则化思想是有效的.  相似文献   

14.
为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概率的求解过程,减少了高频候选标注词对概率统计模型的影响,同时引入语义相似语言模型,利用上下文关联词矢量表示每个标注词,通过估计1幅图像的1组相关性最大的标注词来实现对图像的标注.与基于联合媒体相关图像自动标注算法相比,在标注过程中,本算法不再假设模型中各标注词之间是相互独立的,充分考虑标注词上下文的相关性信息,提高了图像标注精度;对标准的Corel图像集实验结果表明,基于联合媒体相关模型的图像自动标注改进算法是有效的.  相似文献   

15.
文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.  相似文献   

16.
网络舆论意见领袖特征研究   总被引:5,自引:0,他引:5  
为了发现网络舆论的意见领袖,利用从网络中采集到的基本数据,构造网络话题参与者的"属性矩阵",提出意见领袖综合评价算法,以排序方式列出意见领袖.通过实际示例说明应用该评价算法的基本步骤和计算方法.该模型具有一定的理论指导意义和实际使用价值.  相似文献   

17.
针对微博新词的情感倾向分析问题,提出了一种改进互信息的微博新情感词提取方法.首先,对预处理后的微博数据进行N元切分,以此得到候选字串; 然后,通过计算多字互信息(multiword mutual information,MMI)和左右侧邻接熵对候选字串进行扩展和过滤得到候选新词,再将候选新词与相应词典进行对比得到新词; 最后,通过词间情感相似度(sentiment similarity between the words,SW)计算出新词的情感倾向值,从而得到新情感词.实验结果显示,该方法对新词情感倾向识别的准确率、召回率和F1值比文献[4]方法分别提高了13.14%、5.81%和8.59%,因此该方法具有很好的应用价值.  相似文献   

18.
使用深度学习技术进行文本情感分类是近年来自然语言处理领域的研究热点, 好的文本表示是提升深度学习模型分类性能的关键因素。由于短文本蕴含情感信息较少、训练时易受噪声干扰, 因此提出一种融合对抗训练的文本情感分析模型PERNIE RCNN。该模型使用ERNIE 预训练模型对输入文本进行向量化, 初步提取文本的情感特征。随后在ERNIE 预训练模型的输出向量上添加噪声扰动, 对原始样本进行对抗攻击生成对抗样本, 并将生成的对抗样本送入分类模型进行对抗训练, 提高模型面临噪声攻击时的鲁棒性。实验结果表明, PERNIE RCNN 模型的文本分类性能更好, 泛化能力更优。  相似文献   

19.
网络舆情吸引着广大人民的目光,引导着事件的发展。为了解决公共场所互联网舆情监听的难题,借鉴以太网网络监听的原理和组成,设计了由中心控制节点和监听节点构成的互联网监听模型。模型采用分布式节点结构、端口镜像方式进行部署,利用零拷贝技术进行数据捕获和封装,通过构造特征码库和异常事件响应机制对敏感信息进行报警处理。采用本模型可以对宾馆、网吧、机场、车站等公共场所进行网络监听,把握舆论走向。  相似文献   

20.
基于特征选择技术的情感词权重计算   总被引:2,自引:0,他引:2  
在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难. 针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法. 首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益( information gain, IG)和卡方统计量( chi-square,CHI) ,将特征选择技术应用于情感词权重计算. 实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号