首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 500 毫秒
1.
目标情感分析旨在分析评论文本中不同目标所对应的情感倾向。当前,基于图神经网络的方法使用依存句法树来融入依存句法关系,一方面,此类方法大多忽略了依存关系缺乏区分度的事实;另一方面,未考虑依存句法树提供的依存关系存在目标与情感词关系缺失的问题。为此,提出双重图注意力网络模型。该模型首先使用双向长短期记忆网络得到具有语义信息的词节点表示,然后根据依存句法树在词节点表示上构建句法图注意力网络,实现依存句法关系重要程度的区分,更有效地建立目标与情感词之间的关系,进而得到更准确的目标情感特征表示;同时根据句子的无向完全图构建全局图注意力网络来挖掘目标与情感词缺失的关系,进一步提升模型的性能。实验结果表明,与现有模型对比,双重图注意力网络模型在不同数据集上的准确率与宏平均F1值均取得了更好结果。  相似文献   

2.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

3.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

4.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。  相似文献   

5.
针对基于词典的传统分类器无法对不在词典中的情感词的极性和强度进行有效计算和细分的问题,基于最大期望模型,提出构建完善情感词典的EM-SO算法,在此基础上设计基于语义倾向计算模型的否定式和强(弱)化处理组件,以获取评价词及其修饰词的组合效应。实验结果表明,所提算法及所设计组件在评论集上对情感词极性和强度的计算性能优于SO-CAL模型,可应用到主观性分类等实际任务中。  相似文献   

6.
使用HowNet知识资源建立极性词库,吸取语义块和依存关系的思想,提出了极性收缩传递算法,较好地处理主题词和极性成分的匹配问题,判断句子中每个主题的极性倾向,最终确立句子观点.通过测试,将自动抽取的观点与手工标注结果进行比较,得出召回率和准确率,并和其它算法结果数据比较,证明了极性收缩传递算法的有效性.  相似文献   

7.
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率.  相似文献   

8.
为了解决传统图卷积神经网络在进行谣言检测时面临的未充分考虑单词语义信息以及池化方法选择困难的问题,提出基于图卷积网络(GCN)的归纳式微博谣言检测新方法. 考虑单词之间的语义关系,结合传统词共现建图方法提出基于词语义相关性的微博事件建图方法,并结合图卷积网络和门循环单元(GRU)实现节点信息聚合;为了有效融合不同节点状态的特征信息,提出基于注意力机制的多池化方法融合策略融合最大池、平均池和全局池以获取最终的图级向量;为了提高微博谣言检测效率,探究微博评论时间对检测结果的影响,获得用于模型训练的最佳评论利用时间阈值. 实验结果表明,本研究方法在给定数据集上的表现普遍优于Text-CNN、Bi-GCN、TextING等典型方法,验证了其在微博谣言检测领域的有效性.  相似文献   

9.
针对释义识别任务如何学习上下文语义的问题,提出了利用词向量来表示句子语义距离的模型。首先,利用word2vec训练大规模的词向量模型,把词的语义信息利用向量分布式表示;然后通过欧氏距离来计算句子间词的移动开销;最后基于EMD模型实现了从词语义距离到句子语义距离的建模,通过采用句子变换矩阵来实现句子间语义距离的度量,进而从语义相似性方面进行句子释义识别。实验基于SemEval-2015 PIT任务,与作为实验基线的逻辑回归和加权矩阵因数分解方法进行比较,提出的模型采用有监督实验时, 值非常接近实验基线,而采用无监督方法实验时, 值提高了5.8%。  相似文献   

10.
基于音乐情感的心理模糊量的言词研究成果——Hevner情感环模型,提出了一种音乐情感的语言值计算模型。该模型利用八维语言值向量来表示音乐情感,并定义了任意两首乐曲之间的情感相似性度量。本文还通过语义认知实验建立了由基本语言值集构成的情感心理空间。结合情感化音乐检索和多专家决策的需要,本文基于音乐情感向量的代数和逻辑运算法则实现了多源情感信息的融合,实例表明该融合方法符合音乐情感认知的心理模式。  相似文献   

11.
针对在线中文评论中用户主观意见的不确定性,提出一种基于不确定理论的情感分析模型,并结合情感分析模型设计了个性化推荐算法。采用分词工具ICTCLAS和IKAnalyzer预处理在线中文评论,并基于情感词典(HowNet)计算特征词的点互信息值;应用不确定变量与不确定集设计情感分析模型;根据情感分析模型设计新的最近邻居搜索方法并产生推荐。在两个真实数据集上进行试验,试验结果表明,该方法能够有效改进推荐结果的准确率,缓解数据稀疏问题。  相似文献   

12.
由于问卷调查分析法受访者少,问卷质量也低,为此,以海量的在线消费者评论为数据,采用情感分析技术,提出一种快递服务质量评价方法.选取大众点评网上SF和ST两家快递企业的评论语料为例进行实验分析,首先,应用服务质量测评模型SERVQUAL量表和物流服务质量评价的相关理论,结合文本分析方法,建立一套基于在线评论情感分析的快递服务质量评价指标体系;其次,对评论语料进行抓取、分句、标识等预处理,比较不同特征选择算法在不同分类算法下的查全率与查准率,最终以信息增益和支持向量机作为最佳组合,抽取614个特征项用于有用性文本的识别;然后,基于How Net的语义相似度极性计算方法和副词量级划分方法对在线评论进行情感极性和强度分析;最后,应用TF-IDF法,结合评论文本确定评价指标的权重,对快递企业服务质量计算综合评价得分.与大众点评网的星级评分进行对比,实验结果表明:该方法与现有方法相比,能够直观地比较SF和ST两家快递企业在快递服务质量各项评价指标上的差异,并且两者的得分趋势相吻合.  相似文献   

13.
基于特征选择技术的情感词权重计算   总被引:2,自引:0,他引:2  
在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难. 针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法. 首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益( information gain, IG)和卡方统计量( chi-square,CHI) ,将特征选择技术应用于情感词权重计算. 实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度.  相似文献   

14.
为了提高PageRank算法检索结果的精确度,分析了PageRank算法的基本原理和存在的不足,提出了基于超链接文本语义相关性的超链接算法.算法的特点是提取页面的超链接文本,计算检索关键词与超链接文本的语义相关度,并结合PageRank超链接分析算法来估算页面的重要性.实验结果表明,该算法可以提高PageRank算法的检索精确度.  相似文献   

15.
面向文本情感分析的中文情感词典构建方法   总被引:3,自引:1,他引:2  
提出了构建基于HowNet和SentiWordNet的中文情感词典方法。将词语自动分解为多个义元后计算其情感倾向强度,并且使用词典校对方法对词语情感倾向强度进行优化。将所构建词典应用到文本情感分析任务中,使用支持向量机构建文本情感分类器进行实验。实验结果表明,该词典优于一般极性情感词典,为情感分析研究提供了有效的词典资源。  相似文献   

16.
分析了目前常用的不良倾向文本识别方法存在的困难和不足,设计了一种基于语义分析的不良倾向文本识别算法。该算法以语句为基本处理单元,采用依存句法获得句子的语义结构,结合How Net词汇褒贬倾向性判别,识别不良信息。实验结果表明,此算法能够较好地提高不良文本识别效率和准确率。  相似文献   

17.
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation, LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。  相似文献   

18.
识别线上消费者群体评论的情感倾向,有助于优化平台推荐算法及提升服务质量,如何有效识别消费者情感倾向,是一个热门的研究选题。本文基于多头自注意力机制的双向长短期机制提出MABM(Multi-head self-Attention and Bidirectional long-short term Memory neural network)情感倾向识别模型,采用知名电影点评网站豆瓣点评在线评论数据作为语料,使用文本挖掘工具对数据进行预处理,以10个机器学习模型和4个深度学习模型为对照组,按照8:2划分训练集和测试集来验证对比评估MABM模型的有效性和稳健性。两组对比实验结果发现,深度神经网络模型预测效果整体优于机器学习模型,并且以MABM模型的分类效果最佳。MABM模型能够有效识别消费者评论的情感倾向,使推荐算法能有效结合消费者的心理行为,以获得更显著的营销效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号