首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
目标情感分析旨在分析评论文本中不同目标所对应的情感倾向。当前,基于图神经网络的方法使用依存句法树来融入依存句法关系,一方面,此类方法大多忽略了依存关系缺乏区分度的事实;另一方面,未考虑依存句法树提供的依存关系存在目标与情感词关系缺失的问题。为此,提出双重图注意力网络模型。该模型首先使用双向长短期记忆网络得到具有语义信息的词节点表示,然后根据依存句法树在词节点表示上构建句法图注意力网络,实现依存句法关系重要程度的区分,更有效地建立目标与情感词之间的关系,进而得到更准确的目标情感特征表示;同时根据句子的无向完全图构建全局图注意力网络来挖掘目标与情感词缺失的关系,进一步提升模型的性能。实验结果表明,与现有模型对比,双重图注意力网络模型在不同数据集上的准确率与宏平均F1值均取得了更好结果。  相似文献   

2.
中文产品评论特征词与关联的情感词的分类是观点挖掘的重要研究内容之一. 该文改进了英文依存关系语法,总结出5种常用的中文产品评论依存关系; 利用最大熵模型进行训练,设计了基于依存关系的复合特征模板. 实验证明,应用该复合模板进行特征-情感对的提取,系统的查全率和F-score相比于传统方法,分别提高到78.68%和75.36%.  相似文献   

3.
引入句法依存信息到原方面术语,提出一种新的方面术语表示方法,利用Glove词向量表示单词以及单词与单词之间的依存关系,构造出包含句法依存信息的依存关系邻接矩阵和依存关系表示矩阵,利用图卷积神经网络和多头注意力机制将句法依存信息融入到方面术语中,使得方面术语表达与上下文结构高度相关。将改进后的方面词术语表示替换到现有模型后,模型泛化能力得到有效提升。对比试验和分析结果表明:该方法具有有效性和泛化性。  相似文献   

4.
提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。  相似文献   

5.
在方面级情感分析任务中,现有方法难以有效利用句法关系类型且性能依赖依存解析的准确性,为此提出注意力增强的关系门控图卷积神经网络(ARGCN)模型.该模型将双向长短时记忆(BiLSTM)网络学习得到的句子顺序特征与依存概率矩阵相结合构建单词图;利用关系门控图卷积神经网络(RG-GCN)和注意力增强网络(AAN)分别从单词图和句子的顺序特征中获取方面词的情感特征;拼接RG-GCN和AAN的输出作为方面词最终的情感特征.在数据集SemEval 2014、 Twitter上进行对比实验和消融实验,结果表明ARGCN模型可以有效地利用关系类型,减小依存解析准确性对模型性能的影响,更好地建立方面词和意见词的联系,模型准确率优于所有基线模型.  相似文献   

6.
日语依存关系解析是日语句子解析的一项基本技术。提出了一种基于条件随机场的日语依存分析方法,并充分使用了上下文信息和功能词出现信息作为新特征。在京都大学文本语料库上的实验结果表明,本文提出的日语依存分析方法是有效的,依存关系正确率、句子正确率分别达到了89.26%和45.90%。  相似文献   

7.
为了解决统计机器翻译语料对调序现象覆盖不足的问题,采用复述方法对语料进行扩展.提出了一种基于依存分析和句子生成的复述方法.对句子进行依存分析得到依存树,然后从依存树生成多个自然语言句子.生成的句子与原句相比没有词汇上的改变,但可以在词序方面进行变换.实验表明方法在不引入额外资源的前提下,有效缓解了语料覆盖不足的问题,提高了机器翻译质量.  相似文献   

8.
PageRank模型在中文情感词极性判别中的应用   总被引:1,自引:1,他引:0  
针对倾向性分析任务重的基础性工作——情感词的极性判断工作,提供了一种基于PageTank模型的情感词极性判断方法.由待判别情感词和少量中子情感词构成图中的节点,利用知网(HowNet)语义资源计算词语间的语义想死度,进而得到图中节点间边的权重.通过PageRank模型的引入,综合利用有标种子情感词和无标待判别情感词实现对无标情感词的极性判别.与传统的基于HowNet的情感词判别方法相比,PageRank模型的引入使情感词判别的准确率平均提高10%左右,充分验证了所提方法的可行性.  相似文献   

9.
基于语义概念树和局部上下文分析的查询扩展   总被引:1,自引:0,他引:1  
针对信息检索中因文档与查询词之间的不匹配而影响信息检索效果的问题,提出了一种结合基于语义概念树和局部上下文分析的查询扩展模型。该模型对用户提交的查询关键词进行扩展,扩展词来源于基于语义概念树和局部上下文分析的扩展词。实验结果表明,与单纯采用局部上下文分析方法(LCA)相比,该方法有更优的检索性能。  相似文献   

10.
产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。  相似文献   

11.
针对意见挖掘中产品意见对象的获取问题,提出一种基于传播(propagation)思想的产品属性抽取方法.该方法利用产品属性与意见词(opinion word)之间,以及产品属性本身和意见词本身的关系,通过定义的规则,抽取产品属性.对属性与意见词之间的关系采用依存语法进行描述.产品属性和意见词的抽取过程不断迭代,直至无新的属性可抽取.同时,为消除传播过程中引入的噪音,提出3种相应的噪音消除策略.实验结果表明,该方法比传统的产品属性抽取方法有更高的准确率和召回率.  相似文献   

12.
Blog opinion retrieval aims to find blogs with opinionated information related to a given topic. Its main problem is to compute the opinion score, which balances topic relevance and opinion relevance. To deal with this problem a generative model deduced by a Bayesian approach is pro-posed, and an improved mixture model is proposed to estimate the opinion relevance between a blog and a given topic in our retrieval framework. Moreover, pointwise mutual information is used to expand sentiment words for different topics based on a general sentimental lexicon. The correlation between topic and candidate words is applied in the process of both expanding sentiment words and estimating sentence opinion scores. Experimental results show that the proposed approaches improve upon the state-of-the-art opinion retrieval method on TREC2010 dataset.  相似文献   

13.
基于意见领袖概念的本质, 运用观点挖掘技术研究突发事件中微博意见领袖的识别, 为网络舆情治理提供参考。提出三步识别方法框架: 首先采用文献分析法构建指标模型, 评价微博博主的信息影响力; 其次构建文本主客观分类模型, 计算高影响力博主事件相关博文的观点输出性, 识别观点博文; 然后针对观点博文的评论文本构建情感极性分类模型, 计算博文观点获得的支持度以及博主观点的支持率, 最终将输出了观点并获得较多支持的高影响力博主作为该事件的“意见领袖”。同时, 运用上述方法对典型实际案例的微博舆情数据进行分析, 识别该事件的微博意见领袖, 对其特征和舆情参与行为进行观察。并将该结果与社会网络分析法、专家人工分析法识别的结果进行了对比, 验证了本方法的科学性和有效性。结果表明, 本方法能够识别在突发事件舆情生命周期中真正拥有舆论引导力, 具备治理价值的微博意见领袖。  相似文献   

14.
基于舆情事件的词汇关联分析,既是面向网络舆情的情报研究中的一项关键技术,也是保证和提高网络舆情分析质量的一个重要途径.文章研究基于词跨度的关键词获取算法,对候选  相似文献   

15.
分析了高校网络舆情监控的现状,提出了基于高校网络舆情监控系统的设计方案。该系统通过网络爬虫将相关网络新闻、博客和论坛的信息采集下来,采用关键词和敏感词匹配的方式对信息进行过滤,将用户关注的信息呈现出来,从而实现对舆情信息及时准确的发现。  相似文献   

16.
面向舆情分析的短文本频繁模式聚类算法   总被引:1,自引:0,他引:1  
基于短文本的舆情分析是当前信息挖掘与情感分析领域的研究重点,针对网络环境中大量的短文本信息的鲜明特点,本文突破了传统基于词的分类方法,提出一种基于后缀数组频繁模式发现的聚类算法,利用后缀数组频繁模式精确去重算法得到关键词库,结合局部性原理对位置点聚类之后作有意义字串挖掘,进而进行文本舆情分析,以便及时动态了解网络群体的情感方向以及社会舆情热点。  相似文献   

17.
为了提高网络舆情监测的时效性与准确性,改进了Nutch信息采集的方法,加入了URL分析、判重、页面时限等功能,提高了舆情采集的效率。利用《综合电子政务主题词表》构建了舆情监测领域本体,加入了辖区知识进行了扩展,提出了语义扩展的舆情监测算法。实验结果表明,舆情监测的准确率和召回率都有明显提高。  相似文献   

18.
微博中的意见领袖不仅在社交网络的信息传播中发挥着举足轻重的作用,而且在网络舆情演化中也表现出显著的意见代表性。针对已有的意见领袖挖掘方法仅从复杂网络或者基本图模型来建模发现意见领袖,忽略了意见领袖在具体的话题演化中的意见代表性的问题,提出了基于话题演化的意见领袖发现的方法。该方法首先根据用户之间的交互构建图模型,然后利用寻找中心节点的图论算法挖掘潜在意见领袖,再利用话题演化模型判断潜在意见领袖的演化中心度,最后发现在整体舆情上的具有意见代表性的真实意见领袖。在新浪微博的话题数据集上的试验结果表明,该算法较仅考虑网络模型的意见领袖发现方法更优。  相似文献   

19.
主题网络舆情分析中,基于本体的知识模型构建是基础和核心工作。在本体理论基础上对主题网络舆情M进行知识化表示:KM={KC,KD,KG},KC为与具体舆情主题相关的上下文知识,KD为舆情主题所涉及到的专业领域知识,KG为普遍认可的基本概念和推理方法等通用知识;研究知识源的分类、描述语言的确定、本体库的架构设计,为主题网络舆情的内容分析奠定基础,实现一种技术方法上的创新。最后对该知识模型中的应用本体创建进行实例分析。  相似文献   

20.
基于目前互联网的信息与日俱增而用户评论信息利用度很低的现状,提出了一种基于最大熵分类器进行评论信息抽取的方法,并结合自然语言处理技术,利用同义词林以及反义词林定位产品评论属性值的语义极性。最后,通过试验验证了评论信息抽取方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号