首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
从大量的产品评论中进行观点评价对象的自动抽取是观点挖掘研究的重要课题,然而目前观点评价对象抽取结果只提供少量信息,因此提出一种基于上下文相关的双向自举方法同时获取产品名称和产品属性。该方法利用初始种子集、词性模板集获得候选观点评价对象,采用上下文相关的方法对文中所有包含候选观点评价对象的语句抽取出观点评价对象并进行边界识别,同时抽取观点评价对象的词性模板并计算分数,将分值高的模板加入模板集,这样重复迭代直到没有出现新的观点评价对象为止。实验结果表明采用上下文相关方法进行观点评价对象抽取相对于上下文无关的方法性能提高10%以上。  相似文献   

2.
含有观点的文档中准确识别出观点的持有者是预处理步骤.通过建立ChunkCRF模型对观点表达句进行观点持有者的识别;对于同一个观点句中含有多个观点持有者的情况,借助语言学手段进行预处理,再利用模型进行观点持有者识别.在此基础上还进行了观点的摘要与倾向性分析的工作.实验结果表明,基于ChunkCRF的中文观点持有者识别方法达到了80%上以的准确率,并且能够更好的配合观点的摘要与倾向性分析工作.摘要;观点倾向性分析  相似文献   

3.
观点往往承载着文本的重要信息,观点句抽取技术旨在抽取文本中包含作者主观观点的句子,其应用越来越广泛。针对网络语言不规范的现象,文章提出了一种对不规范文本的无监督观点句抽取方法,该方法先对语料及其分词结果进行规范化处理,再通过基于词典和基于规则的方法自动构造训练样例,对SVM分类器进行训练,再使用分类器抽取观点句。使用该方法在人工标注的语料以及COAE2011电子产品语料上进行实验,取得了较好的效果。  相似文献   

4.
针对支持向量机(SVM)在超平面附近进行性别识别的不准确性,引入进行加权的K近邻(KNN)算法。提出了结合加权KNN和SVM的改进KNN-SVM算法,该算法用少量已知性别样本自动确定加权KNN与SVM的最优分类阈值,并计算待识别样本和支持向量机所确定的超平面的距离,通过距离与阈值的比较进行性别识别。基于FERET人脸库进行性别实验,实验结果表明,该算法比SVM算法和不进行加权处理的KNN-SVM算法的识别率更高。  相似文献   

5.
基于支持向量机方法的人脸识别研究   总被引:9,自引:0,他引:9  
采用 SVM方法进行人脸识别研究 ,将人脸识别这一典型的多分类问题构造成适合 SVM处理的二分类问题 ,克服了传统 SVM方法在解决多分类问题上的一些缺陷 .实验以手工与自动两种预处理方式在 FERET和 Bio ID人脸库上完成 ,并与 PCA方法进行了对比 ,结果表明本文的 SVM方法比 PCA方法有更好的概括能力和更高的正确识别率 ,使得今后建立一个基于 SVM方法的人脸自动检测和识别系统成为可能  相似文献   

6.
基于序贯判决法的自动说话人识别   总被引:2,自引:0,他引:2  
潘洁 《微机发展》2000,10(1):46-48
本文介绍了一种在微型计算机上实现的与文本无关的自动说话人识别系统。系统采用了一种经距离加权的矢量量化方法,提出了用于识别过程的序贯判决法,从而提高了系统识别率,并大大减少了识别系统的计算量。  相似文献   

7.
基于混合模型的中国人名自动识别   总被引:3,自引:0,他引:3  
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%。  相似文献   

8.
针对Web中文文本分类中现有权重计算方法的不足和SVM算法对大数据量模式分类的低效性,提出了基于粗糙集约简并且加权的SVM分类方法。粗糙集作为SVM分类的前期预处理器,应用粗糙集的约简理论和基于Web中文文本的可变精度粗糙集加权方法对分类前的数据分别进行简化并计算权重,从而提高SVM后期分类的效率和精度。实验结果表明,SVM对约简并加权后的数据进行分类,分类性能得到了进一步保证。  相似文献   

9.
CT图像中肺结节检测一直是肺癌CAD系统的关键和难点。提出了一种孤立性肺结节自动检测算法,首先对原始CT图像进行有效、准确的肺实质分割;采用寻找局部灰度最大值方法对ROI进行初始分割;再对分割出的各ROI进行特征提取,利用SVM方法对每个特征进行定量描述,根据SVM单特征分类准确率对Mahalanobis距离进行加权改进,最后采用基于改进的Mahalanobis距离进行肺结节分类。实验结果表明,该算法可以较好地提取出CT图像中的孤立性肺结节,具有较高的灵敏度和较低的漏诊率,可以为医生诊断早期肺癌病灶提供帮助信息。  相似文献   

10.
CT图像中肺结节检测一直是肺癌CAD系统的关键和难点。提出了一种孤立性肺结节自动检测算法,首先对原始CT图像进行有效、准确的肺实质分割;采用寻找局部灰度最大值方法对ROI进行初始分割;再对分割出的各ROI进行特征提取,利用SVM方法对每个特征进行定量描述,根据SVM单特征分类准确率对Mahalanobis距离进行加权改进,最后采用基于改进的Mahalanobis距离进行肺结节分类。实验结果表明,该算法可以较好地提取出CT图像中的孤立性肺结节,具有较高的灵敏度和较低的漏诊率,可以为医生诊断早期肺癌病灶提供帮助信息。  相似文献   

11.
RECOGNIZING STRONG AND WEAK OPINION CLAUSES   总被引:3,自引:0,他引:3  
There has been a recent swell of interest in the automatic identification and extraction of opinions and emotions in text. In this paper, we present the first experimental results classifying the intensity of opinions and other types of subjectivity and classifying the subjectivity of deeply nested clauses. We use a wide range of features, including new syntactic features developed for opinion recognition. We vary the learning algorithm and the feature organization to explore the effect this has on the classification task. In 10-fold cross-validation experiments using support vector regression, we achieve improvements in mean-squared error over baseline ranging from 49% to 51%. Using boosting, we achieve improvements in accuracy ranging from 23% to 96%.  相似文献   

12.
中文观点挖掘中的主观性关系抽取   总被引:1,自引:0,他引:1  
本文所针对的具体任务是抽取评价词和目标对象之间的关联关系。所采用的方法是将同一句子中共现的评价词与评价对象作为候选集合,应用最大熵模型并结合词、词性、语义和位置等特征进行关系抽取。我们将关系抽取引入观点挖掘,所提出的方法一定程度上解决了指代消解以及评价对象遗漏的问题。实验结果表明该方法的F值比取最近评价对象的Baseline方法有了15%的提高,并且发现程度副词能够帮助提高主观性关系抽取的性能。  相似文献   

13.
随着互联网普及率的不断提高和大众媒介的网络化,网络媒体逐渐成为使用率最高的网络应用.媒介的互动性和网络的海量性导致了网络评论的大量出现,使得网络评论主流观点的自动提取以及不同源数据的对比分析格外具有意义.针对以上问题展开研究,主要有两点贡献:第一,提出了一种自动提取网络评论主流观点的方法,该方法克服网络评论的复杂性和海量性,通过"Web评论观点鉴别"和"主流观点描述"两个核心部分的处理,自动提取出某一主题下评论的主流观点,并针对每个主流观点,使用关键词和代表性评论对其进行描述;第二,利用该方法对来自不同数据源的网络评论进行对比分析,给出了不同数据源的网络评论特点及差异.  相似文献   

14.
15.
文本意见挖掘综述   总被引:12,自引:2,他引:10  
意见挖掘是针对主观性文本自动获取有用的意见信息和知识,它是一个新颖而且十分重要的研究课题。这种技术可以应用于现实生活中的许多方面,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等。本文首先对意见挖掘进行了定义,然后阐述了意见挖掘研究的目的,接着从主题的识别、意见持有者的识别、陈述的选择和情感的分析四个方面对意见挖掘的研究现状进行了综述,并介绍了几个成型的系统。此外,我们针对汉语的意见挖掘做了特别的分析。最后对整个领域的研究进行了总结。  相似文献   

16.
Since the continuous proliferation of the journalistic content online and the changing political landscape in many Arabic countries, we started our current research in order to implement a media monitoring system about the opinion mining in political field. This system allows political actors, despite of the large volume of online data, to be constantly informed about opinions expressed on the web in order to properly monitor their actual standing, orient their communication strategy and prepare the election campaigns. The developed system is based on a linguistic approach using NooJ’s linguistic engine to formalize the automatic recognition rules and apply them to a dynamic corpus composed of journalistic articles. The first implemented rules allow identifying and annotating the different political entities (political actors and organizations). Then these annotations are used in our system of media monitoring in order to identify the opinions associated with the extracted named entities. The system is mainly based on a set of local grammars developed for the identification of different structures of the political opinion phrases. These grammars are using the entries of the opinion lexicon that contain the different opinion words (verbs, adjectives, nouns) where each entry is associated with the corresponding semantic marker (polarity and intensity). Our developed system is able to identify and properly annotate the opinion holder, the opinion target and the polarity (positive or negative) of the phraseological expression (nominal or verbal) expressing the opinion. Our experiments showed that the adopted method of extraction is consistent with 0.83 F-measure.  相似文献   

17.
基于最大熵模型的观点句主观关系提取   总被引:4,自引:0,他引:4       下载免费PDF全文
提出一种提取中文观点句中评价对象和评价词主观匹配关系的方法。分析观点句中评价词和评价对象的词性、词语位置,通过句法分析获取语义特征,将2类特征应用于最大熵模型,提取观点句的主观关系。实验结果证明,与取距离评价词语最近的词作为评价对象的Baseline方法相比,该方法大幅度提高了准确率和F测试值。  相似文献   

18.
以文本颗粒度为视角,从情感词抽取、语料库和情感词典构建、评价对象与意见持有者分析、篇章级情感分析、实际应用五个方面对文本情感分析文献进行了梳理,并做出必要评述。指出当前情感分析系统的准确率普遍不高,进一步研究的重点在于:自然语言处理的研究成果在文本情感倾向分析中更广泛和贴切的应用;选取文本情感倾向分类的特征和方法;利用现有语言工具和相关资源,规范、快速地构造语言工具和相关资源并应用。  相似文献   

19.
Tourist reviews on social media websites reflect the tourist's opinions concerning various aspects of a tourist place or service (e.g., “comfortable room” and “terrible service” in hotel reviews). Extracting these aspects from reviews is a challenging task in opinion mining. Therefore, aspect‐based opinion mining has emerged as a new area of social review mining. Existing approaches in this area focus on extracting explicit aspects and classification of opinions around these aspects. However, the implicit and coreferential aspects during aspect extraction are often neglected, and the classification of multiaspect opinions is relatively less emphasized in prior art. In this paper, we propose a model, namely, “enhanced multiaspect‐based opinion classification” that addresses existing challenges by automatically extracting both explicit and implicit aspects and classifying the multiaspect opinions. In this model, first, a probabilistic co‐occurrence‐based method is proposed that utilizes the co‐occurrence between aspects and sentiment words to identify the coreferential aspects and merge them into groups. Second, an implicit aspect extraction method is proposed that associates the sentiment words with suitable aspects to build an aspect‐sentiment hierarchy. Third, a multiaspect opinion classification approach is proposed that employs multilabel classification algorithms to classify opinions into different polarity classes. The effectiveness of the proposed model is evaluated by conducting experiments on benchmark and real‐world datasets. The experimental results revealed the supremacy of multilabel classifiers by achieving 90% accuracy per label on classification when extracting 87% domain‐relevant aspects. A state‐of‐the‐art performance comparison is conducted that also verifies the advantages of the proposed model.  相似文献   

20.
该文主要研究如何自动识别微博中用户对各品牌汽车进行评价的句子。针对微博中汽车宣传信息较多而由真正汽车用户发出的观点句所占比例很小的特点,该文提出了结合微博和汽车评论语料的基于SVM模型的分类方法。选取的特征包括词语、评价词个数、与评价对象有关的词语以及微博相关特征。实验表明,评价词特征和部分微博相关特征可有效提高分类器性能,使用微博和汽车评论两种语料进行训练的分类器性能要比仅使用微博语料的方法好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号