首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
评价搭配识别是评论挖掘的研究热点之一.针对现有方法存在的不足,通过对真实语料的观察和分析,提出了一种基于语法模板的评价搭配识别方法.该方法借助HowNet和语法分析等资源和工具,从大规模的真实评论语料中自动获取反映评价搭配规律的候选语法模板,对候选模板进行泛化和遴选,通过生成的模板识别待分析的评论句的搭配关系.在手机和数码相机两种电子产品领域上的对比实验验证了该方法是有效的.  相似文献   

2.
在线评论中特征抽取是产品意见挖掘的基础,直接影响到最终挖掘结果的准确性。针对现有特征抽取方法的准确率和召回率偏低问题,该文通过设计词性序列模板产生候选特征集,利用PMI-IR方法进行筛选,最终获得产品特征集。实验结果表明,该方法取得较好效果。  相似文献   

3.
中文产品评论中属性词抽取方法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。  相似文献   

4.
《计算机工程》2017,(6):169-176
传统评价对象抽取方法较少考虑低频、结构复杂和信息量较大的评价对象。为此,针对中文产品评论提出一种完整评价对象抽取方法。利用词性和语法分析结果提取基础词单元,通过每个词单元的完整值和缺失值对其进行扩展,根据连接稳定性判断扩展后的词单元是否合理,得到候选评价对象集合,采用过滤策略对候选评价对象集合进行过滤,获得最终的评价对象集合。在真实数据集上的实验结果表明,该方法对包含低频和分词结构复杂的评价对象有较好的抽取效果。  相似文献   

5.
王景慧  卢玲 《计算机应用研究》2023,40(5):1410-1415+1440
中文实体关系抽取多以字符序列处理文本,存在字符语义表征不足、长字符序列语义遗忘等问题,制约了远距离实体的召回率,为此提出了一种融合依存句法信息的关系导向型抽取方法。输入层以字符序列和基于同义词表示的词序列为输入;编码端用长短时记忆网络(LSTM)进行文本编码,并加入全局依存信息,用于产生关系门的表示;解码端加入依存类型信息,并在关系门的作用下,用双向长短时记忆网络(BiLSTM)解码得到实体关系三元组。该方法在SanWen、FinRE、DuIE、IPRE中文数据集上的F1值分别较基线方法提高5.84%、2.11%、2.69%和0.39%。消融实验表明,提出的全局依存信息和依存类型信息表示方法均可提升抽取性能,对长句和远距离实体的抽取性能也稳定地优于基线方法。  相似文献   

6.
用户评论中产品特征的抽取及聚类   总被引:1,自引:0,他引:1  
在用户评论中蕴含了大量的产品特征和用户对这些特征的观点和态度.本研究提出了基于Apriori关联规则算法的产品特征抽取方法,利用与种子特征集合的互信息和与观点词的共现度对候选特征进行过滤;并提出了一种特征自动聚类方法,以特征词间的字符串相似度和语义相似度以及特征所对应的观点词作为衡量产品特征之间关联程度的特征,采用K-means聚类算法对产品特征进行聚类.本研究采用大众点评网对美食店铺的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有效性.  相似文献   

7.
准确挖掘购物网站中的用户评论对商家和顾客进行有效的推荐具有重要作用.本文研究了现有的网络贸易系统平台的功能模块,给出了用户评论信息抽取的具体方法,并指出用户评论信息抽取模块应用到网络贸易系统平台的优势和实际意义.  相似文献   

8.
远程监督是一种根据知识库自动对齐实体进行大规模语料标注的方法,但过强的假设导致获取的语料混有大量的噪声.针对这一问题,提出了一种基于同义词词林和规则的中文远程监督人物关系抽取方法,该方法基于多示例学习思想将人物关系句子划分为包(bag)级,利用同义词词林对人物关系触发词做词频统计,确定最大词频候选关系和次大词频候选关系,再结合特定的人物关系判别规则判断人物关系.对bag判断出某个人物关系后,再对其进一步进行多关系预测,最终得到人物关系预测结果.在大规模的中文远程监督人物关系抽取公开数据集(IPRE)上的实验结果表明,所提方法得到的结果具有较好的F1值,并且能识别远程监督数据测试集标签所没标注出的人物关系.  相似文献   

9.
针对当前中文开放领域多元实体关系抽取研究较少的情况,借鉴国外已有的研究成果,结合中文自身的特点,提出了中文领域多元实体关系抽取的方法。该方法以句法分析结果的根节点作为入口,迭代地获取所有谓语的主语、宾语及其定语成分,再利用句法分析结果对这些成分进行完善,最终获取句子中的多个实体之间的语义关系。该方法被应用在不同的领域并进行了对比分析,实验结果表明:其具有一定的参考价值。另外,对实验数据进行了详细的分析,归纳了错误的主要情形,为今后的研究工作指明了方向。  相似文献   

10.
面向中文短信的信息抽取方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在手机3D动画自动生成系统中,研究面向中文短信的信息抽取方法.设计一种基于上下文无关文法的模板定义方式,以及对应的模板知识库与模板解析器.在模板解析器处理数据的过程中,通过最左规约算法保证中文短信的信息抽取效率.实验结果表明,该方法在扩展抽取内容范围的同时,能提高信息抽取的准确性.  相似文献   

11.
挖掘中文网络客户评论的产品特征及情感倾向*   总被引:17,自引:2,他引:15  
为探索中文客户评论中的产品特征及相关情感倾向的挖掘,以帮助生产商和服务商改进产品、改善服务,提高竞争力,提出采用基于Apriori算法的非监督型产品特征挖掘算法,结合监督型情感分析技术,实现对于评论中产品特征及其情感倾向的综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用几种从互联网下载的真实产品评论语料,对该方法进行了数据实验,实验结果初步验证了该方法的有效性。  相似文献   

12.
In order to meet the requirement of customised services for online communities, sentiment classification of online reviews has been applied to study the unstructured reviews so as to identify users’ opinions on certain products. The purpose of this article is to select features for sentiment classification of Chinese online reviews with techniques well performed in traditional text classification. First, adjectives, adverbs and verbs are identified as the potential text features containing sentiment information. Then, four statistical feature selection methods, such as document frequency (DF), information gain (IG), chi-squared statistic (CHI) and mutual information (MI), are adopted to select features. After that, the Boolean weighting method is applied to set feature weights and construct a vector space model. Finally, a support vector machine (SVM) classifier is employed to predict the sentiment polarity of online reviews. Comparative experiments are conducted based on hotel online reviews in Chinese. The results indicate that the highest accuracy of the sentiment classification of Chinese online reviews is achieved by taking adjectives, adverbs and verbs together as the feature. Besides that, different feature selection methods make distinct performances on sentiment classification, as DF performs the best, CHI follows and IG ranks the last, whereas MI is not suitable for sentiment classification of Chinese online reviews. This conclusion will be helpful to improve the accuracy of sentiment classification and be useful for further research.  相似文献   

13.
一种面向产品线的特征依赖建模方法   总被引:2,自引:1,他引:1  
罗代忠  赵文耘 《计算机应用》2008,28(9):2349-2352
特征依赖建模是描述特征间相互约束的模型,是软件产品线开发中的一项关键活动。引入了特征局部依赖和全局依赖关系,在对特征依赖关系分析的基础上,提出了一种特征依赖建模方法,该方法不仅支持分解、泛化等特征局部依赖描述,还支持配置依赖、运行依赖和影响依赖等全局依赖建模。通过一个空调控制系统的产品线特征依赖建模实例验证了该方法的有效性。  相似文献   

14.
大量的网络评论已经成为挖掘用户意见、改进产品质量的重要信息来源,而特征抽取作为后续分析的基础,直接影响到最终意见挖掘结果的准确性. 本文提出了一种PMI-Bootstrapping算法,并结合了语言规则实现中文网络评论的产品特征抽取. 首先利用语言规则产生候选特征集,计算每个候选特征与初始给定种子集的加权平均互信息,将满足阈值的候选特征添加到种子集中,如此循环迭代,直到种子集合收敛,输出排队后的种子集合作为抽取结果. 实验证明,该算法取得良好的准确率和召回率.  相似文献   

15.
非参数特征提取中模板信号的选取   总被引:2,自引:0,他引:2       下载免费PDF全文
非参数特征提取方法虽然不需要用任何参数表达的基函数,但在很大程度上却依赖于模板信号的选取。模板信号与实际信号逼近的程度,直接影响了提取结果的精度,这严重阻碍了该方法的广泛应用,因而模板信号的选取成为非参数波形提取中的一个关键问题。利用非参数特征提取方法前一次提取的结果,引入自适应调节模板信号的算法,使得该方法不再过多地要求模板信号具有信号的先验知识,提高了该方法在应用中的柔性和适应性。仿真信号表明了所提方法的可行性和有效性。研究结果为非参数特征提取方法的应用提供了一条新途径。  相似文献   

16.
为了解决用户评论文本中的产品特征-观点对的提取及情感分析问题,本文利用组块分析提取产品特征,从中寻找到频繁项集,并用PMI对候选产品特征进行过滤,得到产品的特征集合;利用特征与情感词在位置上的邻接关系,提取情感词并组成特征-观点对,通过SO-PMI方法进行情感倾向分析。为验证该方法的有效性,以酒店评论文本为例,从中提取酒店的特征-观点对并进行情感分析,准确率为76.68%,召回率为70.84%。实验结果表明引入组块分析可以有效的解决商品评论的细粒度情感分类问题。  相似文献   

17.
酒店在线评论细粒度挖掘具有重要研究意义.以酒店在线评论具体特征属性和情感分类为研究目标,应用Apfiori算法和情感词典匹配算法,对重庆雾都宾馆在线评论数据深入挖掘,挖掘出用户最关注的酒店十大特征和满意度结果,进一步挖掘出商务出差等五种不同出游类型人最关注的酒店五大特征和满意度结果.这种方法不仅能对酒店领域评论进行分析,同样能够应用于其他领域.  相似文献   

18.
讨论了基于ICA的图像去噪方法,给出了基于ICA的图像边缘检测算法,该算法应用于高斯噪声图像,并与传统的边缘提取算法进行了比较.实验结果表明,该算法即使在高水平噪声图像中,也能够提取出比较清晰的图像边缘信息.  相似文献   

19.
针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词,在每一轮迭代中,通过计算提取词与提取模式的置信度,确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率。实验结果表明:本文算法对产品属性提取的F值可以达到78.97%,结果优于文献中其它类似提取算法。  相似文献   

20.
中文网络评论的IT产品特征挖掘及情感倾向分析   总被引:1,自引:0,他引:1  
为探索中文客户评论中的IT产品特征及相关情感倾向的挖掘,帮助IT生产商和服务商提高改进产品和服务质量,提高竞争力。该文将采用情感分析技术,提出基于客户感知价值的产品特征挖掘算法,实现对于评论中IT产品特征及其情感倾向的语义分析、动态提取和综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用从互联网下载的真实IT产品评论语料中进行实验,初步验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号