共查询到20条相似文献,搜索用时 736 毫秒
1.
网络评论方面级观点挖掘方法研究综述 总被引:2,自引:0,他引:2
网络评论的观点挖掘任务是文本分析的关键问题之一.随着网络评论的快速增长,用户在浏览评论时更加关注细粒度的信息,因此对评论进行方面级观点挖掘能够帮助消费者更好地做出决策.过去的十多年间,研究人员在大量网络评论语料库上进行观点挖掘等相关研究,并取得了丰硕的研究成果和广泛的应用价值,更不乏优秀学者对观点挖掘方法现状进行综述总结.然而有针对性地对观点挖掘中方面提取与观点提取进行综述总结的成果较少.本文综述了近年来网络评论方面级观点挖掘的研究现状.首先介绍了方面级观点挖掘的相关问题描述;接着重点分类介绍方面提取方法及观点内容提取的主要方法;然后总结了方面级观点挖掘的常见评价指标以及在社会中的广泛应用价值;最后根据对现有方法提出挑战方向并进行系统总结.对方面级观点挖掘进行综述有助于比较不同方法的差异,从而发现有价值的研究方向. 相似文献
2.
随着移动互联网的发展,以商品评论等带有主观性的短文本信息急剧增加.海量的文本信息使得人工管理越来越困难.本文以商品评论为研究对象进行情感分析.针对商品评论为短文本的特点,本文在词向量的基础上提出了词向量叠加方法和加权词向量方法进行文本特征的提取,从而更深层次的提取短文本特征.在进行评论情感分析模型性能的比较中,说明了本文所提方法的有效性.基于情感分析技术可以解决人工难以胜任的海量商品评论的分类,方便用户快速获取有效信息. 相似文献
3.
在线评论已成为互联网环境下用户需求获取的重要数据资源.然而,评论质量的良莠不齐严重干扰了需求挖掘的准确性和可信性.如何发现能够准确描述用户需求的有用评论是提高需求获取技术有效性的前提保障.针对这一问题,文中提出一种基于复杂网络的评论有用性分析方法,利用评论间的语义关联,从宏观的角度分析评论对于用户需求识别的有用程度,进而发现能够准确描述用户需求的评论.作者将评论看作一种内容互连的网络拓扑的形态,利用评论网络节点的重要性来度量评论的有用性,并通过拓扑势理论将用户的主观评价与网络拓扑结构的客观影响有机融合对评论网络节点重要性进行分析.实验结果表明,该方法所确定的高有用性评论能够保证用户需求获取具有较高的准确率和覆盖率. 相似文献
4.
评价搭配识别是评论挖掘的研究热点之一.针对现有方法存在的不足,通过对真实语料的观察和分析,提出了一种基于语法模板的评价搭配识别方法.该方法借助HowNet和语法分析等资源和工具,从大规模的真实评论语料中自动获取反映评价搭配规律的候选语法模板,对候选模板进行泛化和遴选,通过生成的模板识别待分析的评论句的搭配关系.在手机和数码相机两种电子产品领域上的对比实验验证了该方法是有效的. 相似文献
5.
针对有监督评论有用性预测方法中的训练数据集难以构造,以及无监督方法缺乏对情感信息支撑的问题,提出基于语义和情感信息构建一种无监督模型,用于对评论有用性进行预测,同时考虑了评论和评论下回复内容对观点的支持度用来计算观点的有用性得分,进而得到评论的有用性。同时,提出结合句法分析和改进潜在狄利克雷分配(LDA)模型的评论摘要方法用于评论有用性预测模型中的观点提取,基于句法分析结果构建must-link和cannot-link两种约束条件指导主题模型学习,在保证召回率的同时提高模型准确率。该方法在实验数据集上能取得70%左右的F1值和90%左右的排序准确率,且实例应用也表明该方法对结果具有较好的解释性。 相似文献
6.
针对现有商品评论存在数量大、质量参差不齐、可信度差,导致用户难以快速获取有效信息并制定高效的决策,而现有评论可信性评估主要考虑评论来源和投票形式的支持度等问题,提出了一种从评论内在质量角度实现评论可信度评估方法,即通过融合评论者等级、评论支持度和评论观点一致性等实现评论可信性评估。首先基于规则库和方法库完成了评论数据的预处理;然后基于商品特征库、通用词典、情感词典以及方法库,完成了商品特征识别和特征值提取及标准化;最后基于建立的模型完成评论可信度评估。实验结果验证了该方法的可行性,该方法可以应用于其他电商平台实现商品评论可信性自动评估。 相似文献
7.
8.
9.
针对网络视频元数据信息缺失严重和多媒体数据本身特征难以提取等问题,提出了融合评论分析和隐语义模型的网络视频推荐算法.从视频评论入手,通过分析用户对不同视频的评论内容以判断其情感倾向并加以量化,继而构建用户对项目的虚拟评分矩阵,弥补了显式评分数据稀疏性问题.考虑到网络视频的多元性和高维度特性,为了深度挖掘用户对网络视频的潜在兴趣,针对虚拟评分矩阵采用隐语义模型(LFM)对网络视频分类,在传统的用户—项目二元推荐系统基础之上添加虚拟类目信息以进一步发掘用户—类目—项目关联关系.实验在多重标准下进行,对YouTube评论集的实验表明,所提推荐方法获得了较高的推荐精度. 相似文献
10.
面对海量的APP软件,不同用户对其评论的侧重点、表达方式以及情感倾向程度等都不相同,这给APP软件的用户行为分析和质量评价带来了困难。提出一种APP软件用户评论模式分析方法,首先综合分析用户评论信息与APP软件信息之间的关系,根据用户对APP软件的评论特征将用户评论信息进行分类;接着分析每类用户评论信息的词性组合;然后计算用户评论信息的情感倾向程度,以分析出该APP软件用户的评论模式;最后通过实验验证了该方法的有效性。 相似文献
11.
12.
基于情感词典扩展技术的网络舆情倾向性分析 总被引:7,自引:0,他引:7
随着Web2.0时代的到来,网络已逐渐成为反映社会舆情的重要载体之一,网络舆情发现及网民的观点和倾向性挖掘也成为新的研究热点,但是目前尚无有效反应网民对热点事件或话题总体态度的舆情分析系统.本文针对网民关于话题评论简单、数目众多的特点,应用HowNet和NTUSD两种资源对现有情感词典进行扩展,建立了一个新的、具有倾向程度的情感词典.基于扩展的情感词典,开发了一个半自动化网络舆情分析系统.该系统能够为用户提供更加细致、准确的评论倾向性分析结果. 相似文献
13.
本文介绍了一种基于SVM与距离加权计算的自动观点分析方法,主要包括观点自动检测与观点持有者自动抽取两方面内容。本文首先建立了与观点分析相关的一系列资源,如观点指示动词集等。利用这些相关的资源,采用SVM进行机器学习,从而完成观点的自动检测。在观点自动检测的基础上,以观点指示动词为指示器,采用距离加权计算的方法抽取给定句子中的观点持有者,并采用模式匹配的方法来对观点持有者进行短语扩展,从而使观点持有者的抽取结果得到进一步提高。 相似文献
14.
Tourist reviews on social media websites reflect the tourist's opinions concerning various aspects of a tourist place or service (e.g., “comfortable room” and “terrible service” in hotel reviews). Extracting these aspects from reviews is a challenging task in opinion mining. Therefore, aspect‐based opinion mining has emerged as a new area of social review mining. Existing approaches in this area focus on extracting explicit aspects and classification of opinions around these aspects. However, the implicit and coreferential aspects during aspect extraction are often neglected, and the classification of multiaspect opinions is relatively less emphasized in prior art. In this paper, we propose a model, namely, “enhanced multiaspect‐based opinion classification” that addresses existing challenges by automatically extracting both explicit and implicit aspects and classifying the multiaspect opinions. In this model, first, a probabilistic co‐occurrence‐based method is proposed that utilizes the co‐occurrence between aspects and sentiment words to identify the coreferential aspects and merge them into groups. Second, an implicit aspect extraction method is proposed that associates the sentiment words with suitable aspects to build an aspect‐sentiment hierarchy. Third, a multiaspect opinion classification approach is proposed that employs multilabel classification algorithms to classify opinions into different polarity classes. The effectiveness of the proposed model is evaluated by conducting experiments on benchmark and real‐world datasets. The experimental results revealed the supremacy of multilabel classifiers by achieving 90% accuracy per label on classification when extracting 87% domain‐relevant aspects. A state‐of‐the‐art performance comparison is conducted that also verifies the advantages of the proposed model. 相似文献
15.
对初始情感种子集预处理,增加网络情感词汇、过滤部分特征词,采用改进逐点互信息—信息检索方法对特征词进行情感倾向性计算,实现对网络论坛网帖中网民观点极性和观点强度的挖掘,进一步实施网民观点属性挖掘;构建基于三粒度挖掘结果的观点树,建立基于观点树的网络舆情危机预警架构。通过实验验证,该方法能够对网络舆情危机作出预警判断。 相似文献
16.
Ebuka IBEKE Chenghua LIN Adam WYNER Mohamad Hardyman BARAWI 《Frontiers of Computer Science》2020,14(2):404-416
There are large and growing textual corpora in which people express contrastive opinions about the same topic.This has led to an increasing number of studies about contrastive opinion mining.However,there are several notable issues with the existing studies.They mostly focus on mining contrastive opinions from multiple data collections,which need to be separated into their respective collections beforehand.In addition,existing models are opaque in terms of the relationship between topics that are extracted and the sentences in the corpus which express the topics;this opacity does not help us understand the opinions expressed in the corpus.Finally,contrastive opinion is mostly analysed qualitatively rather than quantitatively.This paper addresses these matters and proposes a novel unified latent variable model(contraLDA),which:mines contrastive opinions from both single and multiple data collections,extracts the sentences that project the contrastive opinion,and measures the strength of opinion contrastiveness towards the extracted topics.Experimental results show the effectiveness of our model in mining contrasted opinions,which outperformed our baselines in extracting coherent and informative sentiment-bearing topics.We further show the accuracy of our model in classifying topics and sentiments of textual data,and we compared our results to five strong baselines. 相似文献
17.
《Information & Management》2016,53(8):987-996
Social media is a major platform for opinion sharing. In order to better understand and exploit opinions on social media, we aim to classify users with opposite opinions on a topic for decision support. Rather than mining text content, we introduce a link-based classification model, named global consistency maximization (GCM) that partitions a social network into two classes of users with opposite opinions. Experiments on a Twitter data set show that: (1) our global approach achieves higher accuracy than two baseline approaches and (2) link-based classifiers are more robust to small training samples if selected properly. 相似文献
18.
19.
20.
网络舆情信息挖掘是舆情研究的重要课题. 在大量的信息面前, 为了快速发掘有用性高的舆情信息为舆情的分析、决策提供助力, 提出一种面向特定观点的舆情信息有用性排序方法, 实现快速发掘特定观点下有用舆情信息的目的. 该方法针对舆情信息的具体观点进行分析计算, 同时根据舆情信息可信度和关注度、传播者的影响力, 并且结合信息时效性等因素, 利用排序方法进行打分, 根据舆情信息的得分进行有用性排序. 实验结果表明, 该方法能很好的完成对舆情信息的推荐排序. 本研究理论上对舆情信息挖掘的研究理论进行补充, 现实意义对舆情管理者有很好的辅助作用, 能够为网络舆情引导工作提供助力. 相似文献