首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
针对当前电子商务网站用户评分过于集中而区分度不明显,以及整数评分可信度不高导致协同过滤推荐效果较差的问题,提出一种改进协同过滤算法. 利用改进的词性路径模板算法挖掘评论中包含的产品特征和情感词,分析并建立评论特征偏好向量;依据评论特征偏好向量计算评论中包含的情感态度,利用用户评论中包含的情感态度对评分进行修正,使得修正后的评分更接近于用户的真实评分意愿;利用修正后的评分计算评分相似度,与偏好相似度结合产生推荐. 实验结果表明,该算法有效地增加了评分区分度与可信度,提高了最近邻居的质量,从而提高了推荐结果的准确度.  相似文献   

2.
为挖掘大量的电子商务产品评论数据隐藏的巨大潜在价值,构建产品评论数据库,提取特征-情感词集,对情感极性进行计算并对关注点进行挖掘。实验结果表明:该方法得到的产品热门特征标签与官网热门标签高度吻合,可以推广到其他中文在线网络评论。  相似文献   

3.
大量涌现的电商产品评论对企业制定商业决策十分有利, BERT 应用在英语文本情感分析中取得了不错的效果。针对中文电商产品文本评论提出了一个新的融合Stacking 集成思想和深度学习算法模型。首先在文本信息特征提取层使用Chinese-BERT-wwm 生成含有丰富语义信息的动态句子表征向量, Chinese-BERT-wwm 是专门针对中文特点改进后的预训练模型, 具有稳健的中文文本特征信息提取能力, 其次该层同时设计了TextCNN 和BiLSTM捕获文本中局部关键信息特征与语序信息特征, 并将这些特征拼接在一起以获得更全面丰富的句子信息, 最后基于Stacking 集成学习思想使用SVM 对该特征进行分类。为了评估模型效果, 人工标注3 万条具有三类情感极性的中文电商产品文本数据进行实验, 该数据集可广泛用于中文情感分析领域。实验结果表明, 与基线模型相比, 提出的模型可以有效提高中文文本情感极性分类任务的准确率。  相似文献   

4.
文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.  相似文献   

5.
近年来,中文产品评论的特征情感分类是Web数据挖掘的重要研究内容之一.提出了一套完整的产品命名实体、特征词、情感词以及边界的标注规则,设计了多层次的混合标签模式;提出了双层HHMM(层级隐马尔科夫模型)结构,将词形标注和词性标注的特点进行融合;提出了基于词形标注的HHMM-1算法和基于词性标注的HHMM-2算法,实现复杂短语的自动标注.实验证明,双层HHMM模型起到了互补的作用,模型的查全率和F-score值均有较大提高.  相似文献   

6.
针对中文酒店评论自身特点设计语料特征,将评论高频词赋予权重并扩展基础情感词典;结合扩展基础情感词典和语义规则,计算情感加权值,实现对酒店频率褒贬倾向分析;选取Boson和大连理工情感词典作为基础情感词典进行了试验。试验结果表明,利用本方法进行中文酒店评论情感分析的精准率可达到90%以上,相比基础情感词典,可提高10%,且加入前50个高频词扩展基础情感词典,对精准率有较大提升,之后精准率的提升速度趋于平缓。  相似文献   

7.
针对基于评论文本推荐系统的特征没有充分组合的问题,提出一种利用双重注意力实现评论特征组合的推荐模型.首先利用经情感分类任务微调后的编码模型对评论文本进行编码,得到对应的特征向量;然后利用双线性内积计算用户与商品之间评论特征向量的交叉注意力,实现用户和商品之间评论特征的交叉组合;再利用多头自注意力实现用户和商品对应评论特征的自组合,得到用户和商品最终的特征表示.在真实数据集上的实验结果表明,所提模型的均方误差相比其他模型下降了1.43%.  相似文献   

8.
基于评论文本的深度学习推荐方法主要利用评论文本刻画用户和项目的特征信息,学习用户对项目的评分关系,提升推荐的性能.现有研究工作在提高推荐系统精度质量的同时,忽略了情感特征在评分预测中的可解释性贡献.针对此问题,考虑了评论文本以及情感倾向分别在用户和项目嵌入中的作用,提出了一种基于评论文本情感注意力的推荐方法(Incor...  相似文献   

9.
虚假评论的检测与治理,对净化网络环境具有重要的意义。针对现有的虚假评论检测方法收敛速度慢、准确率低的问题,提出一种融合评论情感特征的虚假评论检测方法。首先,基于预先构建的情感词典,设计情感特征抽取方法抽取情感特征;其次,引入 Transformer模型对融合情感特征后的嵌入表示提取特征向量;最后,将特征向量送入全连接层并利用 softmax函数实现真实评论与虚假评论分类。采用 Amazon数据集,设计实验验证了基于情感词典所提情感特征的有效性,在融合情感特征后准确率提升了1.19百分点;同时与深度学习ISTM方法相比,该方法检测准确率提高0.59百分点。  相似文献   

10.
产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。  相似文献   

11.
产品线特征模型的可变点决定了产品线实例的多样性,运用变体度来度量产品线实例数量.在特征模型的基础上分析了特征可变性类型和特征约束依赖类型对变体度的影响,提出的变体度算法不仅支持度量特征单型分解和单特征依赖的变体度,也能精确度量多型分解和多特征依赖的变体度.最后通过一个电梯控制系统实例验证了算法的有效性.  相似文献   

12.
Wordisalogicalsemanticandsyntacticunitinnaturallanguage.UnlikeEnglish,thereisneitherde limitertomarkwordboundariesnorexplicitdefinition ofwordsinChinese.WordsegmentationtransformsChinesecharacterstringintowordsequence.Asapre requisitepartofPOStagging,parserandotherdeeply processing,earlyerrorinsegmentationwillalwayscas cadethroughthechain,causingthewholesentenceer rorinthefinaloutputs,suchasMachineTranslation,InformationExtractionandtheQuestionandAnswer(QA)System.Thoughwordsegmentationha…  相似文献   

13.
为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型. 实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语法模型长距离相依性能较差的缺陷;同时,在模型困惑度、音字转换正确率上均优于已有基于净频次的CFS语言模型.  相似文献   

14.
针对现有的面向特征的软件产品线分析方法大多着眼于细粒度的特征,对宏观特征考虑不多,导致对产品线体系结构支持不足的问题,基于逐步精化的思路,提出特征增量概念,试图捕捉和描述产品线中产品的宏观联系与差异,以增强从需求到产品线体系结构再到单个产品体系结构的可跟踪性和可维护性. 分析了特征增量的依赖关系和组合原则,并给出了基于目标场景的面向特征增量分析过程.结合一个可视化建模工具产品线实例对特征增量和分析过程进行说明.实例表明,特征增量的引入提升了产品线分析的粒度,增强了分析过程的层次性,从而系统且有效的支持产品线的开发活动.  相似文献   

15.
分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF—IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF—IDF方法没有考虑这种语义信息,所以传统的TF—IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果.  相似文献   

16.
为了提升卷积神经网络特征提取能力,设计了一种基于连续卷积的深度卷积神经网络模型.该模型采用小尺度的卷积核来更细致地提取局部特征,并借助连续的两个卷积层增加模型的非线性表达能力,结合Dropout技术降低神经元之间的相互依赖,利用抑制网络过拟合对模型进行优化.人脸表情、手写数字字符和彩色图像的目标识别实验表明,在图像较为复杂时,该模型在识别的准确性和泛化性能上比手工特征提取方法及一般的2、3层卷积结构具有明显的优势.  相似文献   

17.
针对意见挖掘中产品意见对象的获取问题,提出一种基于传播(propagation)思想的产品属性抽取方法.该方法利用产品属性与意见词(opinion word)之间,以及产品属性本身和意见词本身的关系,通过定义的规则,抽取产品属性.对属性与意见词之间的关系采用依存语法进行描述.产品属性和意见词的抽取过程不断迭代,直至无新的属性可抽取.同时,为消除传播过程中引入的噪音,提出3种相应的噪音消除策略.实验结果表明,该方法比传统的产品属性抽取方法有更高的准确率和召回率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号