首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
情感分析是文本分类的研究方向,深度迁移学习通过学习目标领域数据和已有领域数据之间的相关度,提高当目标数据不足时文本分类的精度。从基于网络迁移的角度设计算法,首先使用Word2vec+词性特征词向量表示,然后进行卷积神经网络文本分类,再将训练好的模型共享网络参数,迁移至跨域商品评论数据,训练、分类评论数据。实验证明,在小样本数据集中算法精度有明显提升。  相似文献   

2.
《信息技术》2016,(7):172-175
在线商品评论的情感倾向分析是一个很有研究价值的分类技术。文中采用SVM文本分类算法将在线商品评论进行情感倾向分析,同时,为了克服传统的CHI统计特征选择法的不足,提出了结合方差分析的CHI统计特征选择方法。实验表明:在基于SVM的在线商品评论情感倾向分析中,改进的特征选择方法对在线商品评论的情感分类效果有很好的提升。  相似文献   

3.
本文针对现有商品评论情感分析模型均没有对商品评论文本进行细粒度划分的缺点,提出一种基于双向门控循环网络(Bi-GRU)和双层注意力机制的商品评论情感分类模型。该模型将商品评论文本划分成词级和句子级,通过Bi-GRU提取商品评论在词级和句子级的特征,同时在词级和句子级分别应用注意力机制对相应信息进行权重重分布,通过层级递进的方式获取到商品评论的情感倾向。实验结果表明,本研究提出的商品评论情感分析模型在评论数据集中取得了93.78%的准确率,相对于使用单层注意力机制的Bi-GRU提升了2.6%。  相似文献   

4.
传统的协同过滤推荐算法直接根据用户对物品的评分进行推荐,忽略了评论文本中隐含的重要信息,当用户对物品的评论较少时,由于数据的稀疏性会造成推荐效果的不准确和单一。本文提出了一种基于LDA主题模型的协同过滤推荐算法LDA-CF(Latent Dirichlet Allocation model-LDA-Collaborative Filtering),在传统的协同过滤算法基础上,通过LDA模型对评论文本中的主题进行分类,从各个主题层面挖掘用户的情感偏好,计算用户之间的相似度,进而向目标用户推荐商品。对京东平台牙膏的评论数据集的实验结果表明,该算法不仅可以缓解由于评分数据较少造成的稀疏性问题,推荐的精确度也有所提高。  相似文献   

5.
在异常数据检测中,由于数据量过大和数据特征维度过高,往往会导致数据标定困难、数据冗余、算法效率降低等。针对以上问题,将主成分分析(PCA)特征选择算法与深度自编码高斯混合模型(DAGMM)相结合,提出一种新的无监督异常数据检测方法 PCA-DAGMM。该方法首先利用PCA特征选择算法对数据进行预处理,去除对分类效果增益较小的冗余数据,降低运算成本;然后将特征选择后的数据输入到DAGMM模型中进行训练。基于kddcup99数据集和CIC-IDS-2017数据集进行实验,并与多种特征选择算法进行对比,实验结果表明,PCA-DAGMM方法可以有效优化分类器性能,提高分类器训练效率,适用于解决网络流量异常检测问题,F1指数在kddcup99数据集和CIC-IDS-2017数据集上比DAGMM模型分别提高了4.37%和1.06%,训练时间减少了14.43%和8%。  相似文献   

6.
基于EP的提升分类算法   总被引:1,自引:0,他引:1  
显露模式(EP)是支持度从一个数据集到另一个数据集发生显著变化的项集.EP具有很强的区分能力,可以建立很好的分类器.文中采用基于EP的分类算法CEEP建立基分类器,结合组合学习分类方法AdaBoost算法的思想,提出了一种新的分类算法A-E算法.算法使用加权样本建立基分类器,并根据分类结果改变样本权值,同时应用分类误差计算基分类器权重.最终,算法按权重组合每个分类器的分类结果.在UCI机器学习数据库的9个基准数据集上的实验表明,A-E算法都能有效地减低泛化误差,并具有较高的分类准确率.  相似文献   

7.
随着互联网应用的快速普及,用户在商品分析、服务评估、影视分享等众多领域发表了大量的评论文本。如何快速识别众多评论文本中的情感倾向,提高文本数据的应用价值,已成为自然语言处理领域关注的热点话题之一。针对此问题,基于BERT和CNN模型对资产维修服务的评论文本进行情感分析,将BERT模型输出的动态字向量送入CNN进行二次表征,并将其与文本序列向量相融合为分类器提供更多的语义信息。实验结果表明,所提出的方法在文本情感分类准确率、F1值上均取得了良好的结果,具有有效性,同时通过对评论文本进行情感分析形成对维修工人的综合评价,实现系统报修工单的智能派单,为企业资产管理系统中资产维修管理模块的优化提供一定的思路。  相似文献   

8.
黄人伟 《移动信息》2020,(3):00078-00079
随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数据,建立分析模型对钉钉评论数据进行评论相干性和情感极性的分析,提出基于相干机制的评论数据处理模型,对评论长度较长的评论,使用N元语法模型和信息量的办法,结合情感词的上下文语境,采用自适应的办法对情感词的情感范围进行情感极性的计算,提高了长评论文本的情感极性准确率。与现有的情感词典分词的方法相比,达到了更好的效果。  相似文献   

9.
左荣欣 《电子世界》2014,(17):192-193
目前主观信息情感分类常用的方法主要有基于知识工程和基于统计两类,其中基于统计的机器学习方法在效率上优于基于知识的方法,但单一的机器学习算法有各自的优缺点,难以胜任复杂的分类任务。本文将微博情感判别任务分层,在不同层次选择合适的机器学习算法,提出了一种多算法集成的微博细粒度情感分类方法。首先采用朴素贝叶斯(NB)分类器对微博进行有无情绪分类,然后采用AdaBoost集成算法对KNN进行集成训练出多个分类器,对有情绪微博基于训练出的多个分类器通过线性组合模型进行情感判别。实验结果表明,在文本分类任务中合理集成不同机器学习算法,较单一机器学习算法和基于情感词典的方法能够提高分类性能。  相似文献   

10.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。  相似文献   

11.
丁玲  唐娉  李宏益 《红外与激光工程》2013,42(10):2707-2711
为挖掘高光谱遥感数据内在的非线性结构特性,采用全局化流形学习算法等距特征映射(ISOMAP)对高光谱遥感数据进行非线性降维,并取得了优于常用的最小噪声分离(MNF)变换方法的结果,具有更好的数据压缩性能。将光谱角相似性度量方法用于ISOMAP 算法,取得良好的降维效果。通过把ISOMAP 降维算法和k-最邻近分类器相结合对降维后子空间特征进行分类,实验表明:ISOMAP 利用较少的特征维数获得比MNF 更高的分类精度,并达到较高稳定的分类精度,尤其对难以区分、光谱相似的两类别问题,ISOMAP 的特征维数能够有效的提高两类别的可分性。  相似文献   

12.
李仁  石新龙  王林生  宋强 《光电子.激光》2019,30(10):1086-1091
在数据进行集成的实际过程当中,分类器往往具有自主性,会随着样本数据的变化对自己进行 适 当调整,以此来提高自己的适应能力。对此,本研究以在数据样本区域内对相邻数据进行区分 的方法进行SVM集成方法研究,并最终提出了一种切实可行地支持SVM进行集成的方式。即针 对区分的数据样本区域,以一种新的搜索算法进行研究,利用FCM与模糊贴近度的结合来进行 计 算,实现在模糊特征空间集合频域自身位置的自动确定,再根据各项分类器的阈值数据系统自 行 录用当中的优异数据结果。并最终形成个体分器的数据结果从而进行集合性判定。结果显 示。在减少区分判断用时的前提下,这样一种数据算法能够达到提升分类器功能的有效作用 ;所建立的SVM集成模型具备动态自主适应性。集成过程当中分类器的个数选取关键点在于 分类精度阀值的选取,据此可以通过最优阀值的选取以达到模型判别能力的极大提升。  相似文献   

13.
在所有新兴的大数据研究主题中,数据分类问题成为我们在分析问题时遇到的一个巨大挑战。在分析大规模病历时,采用树状结构的分层学习方法训练最大边缘分类器,可以得到较好的分类结果,且具有较高的计算效率。特征的质量影响分层学习算法对病历分类的效果。因此,我们必须提取判别特征来训练层次分类器。文章提出了一种高度相关特征集选择(HCFS)算法,并将其与分层学习方法相结合,该算法可识别出良好的特征子集,提高分类精度。  相似文献   

14.
在人脸识别研究问题中,传统的K-近邻分类器是仅基于一种测度进行分类的.但是,这种仅基于一种测度进行分类的方法没有充分考虑不同特征间的相似信息,因而往往分类不够准确.针对这个问题,本文提出了基于距离和角度两种测度联合分类的改进近邻分类器.即在距离测度的基础上融合cosine分类器的角度信息作为分类测度,同时在分类过程中运用模糊识别,以改善传统近邻分类器的分类效果.经计算机仿真数据实验,表明这种改进的近邻分类器与Gabor小波的结合,提高了人脸识别率.  相似文献   

15.
基于机器学习的舰船目标识别近年来已成为水声信号处理领域的一个重要研究方向,但水声目标信号的获取困难,样本量不足和不均衡的问题很容易导致目标分类模型的识别效果不佳。该文提出一种基于条件卷积生成对抗网络的船舶噪声数据分类方法,该方法利用生成对抗学习理论,生成相比于传统数据增强算法非线性特征更强,特征差异更丰富的伪DEMON调制谱数据来缓解训练样本量不足的问题。之后将传统生成对抗网络中的全连层输出替换成更善于解决小样本问题集成分类器,从而降低分类器对于数据量的依赖程度,进一步提高分类模型性能。最终由基于真实样本的实验结果表明,相比于传统数据增强算法和卷积生成对抗网络,该文方法能够更有效提高在样本不足条件下的模型的分类性能。  相似文献   

16.
基于图的Co-Training网页分类   总被引:1,自引:0,他引:1  
侯翠琴  焦李成 《电子学报》2009,37(10):2173-2180
 本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithm for web page classification),简称GCo-training,并从理论上证明了算法的有效性.GCo-training在Co-training算法框架下,迭代地学习一个基于由超链接信息构造的图的半监督分类器和一个基于文本特征的Bayes 分类器.基于图的半监督分类器只利用少量的标记数据,通过挖掘数据间大量的关系信息就可达到比较高的预测精度,可为Bayes分类器提供大量的标记信息;反过来学习大量标记信息后的Bayes分类器也可为基于图的分类器提供有效信息.迭代过程中,二者互相帮助,不断提高各自的性能,而后Bayes分类器可以用来预测大量未见数据的类别.在Web→KB数据集上的实验结果表明,与利用文本特征和锚文本特征的Co-training算法和基于EM的Bayes算法相比,GCo-training算法性能优越.  相似文献   

17.
吕品  于文兵  汪鑫  计春雷  周曦民 《电子学报》2019,47(10):2228-2234
恶意评论检测是预防社会媒体平台给用户带来负面影响的一项重要工作,是自然语言处理的重要领域之一.为解决单分类器实现恶意评论检测时模型精度不稳定、boosting集成模型精度较低的问题,提出一种异构分类器堆叠泛化的方法.该方法用深度循环神经网络将多标签的恶意评论分类问题转变为二类分类,防止了模型精度不稳定;用堆叠泛化集成时单个分类器GRU(Gated Recurrent Unit)和NB-SVM(Naïve Bayes-Support Vector Machine)在模型结构和分类偏差上的差异性,改善了模型精度.在维基百科恶意评论数据集上的对比实验证明:提出的方法优于boosting集成,说明堆叠泛化异构分类器实现恶意评论检测是可行且有效的.  相似文献   

18.
随着深度学习技术在自然语言处理领域的广泛应用,短文本情感分类技术得到显著发展。该文提出了一种融合TextCNN-BiGRU的多因子权重文本情感分类算法。算法通过引入词语情感类别分布、情感倾向以及情感强度三个关键因子改进了词语的向量表示。将基于词向量表示的短文本分别作为TextCNN和BiGRU模型的输入,提取文本关键局部特征以及文本上下文的全局特征,将两种特征进行线性融合,实现中文短文本的情感分类。在公开的两个情感分类数据集上验证了多因子权重向量表示方法和融合TextCNN-BiGRU的情感分类模型的有效性,实验结果表明,文中提出的算法较单一模型在短文本情感分类准确率上提高了2%。  相似文献   

19.
电子商务网站中的评论数据隐含着商品特征和用户情感,现有基于方面情感分析的推荐研究大多通过抽取同一类别商品评论数据中用户对商品不同方面的情感来捕捉用户方面偏好,忽略了不同类别商品有不同方面以及用户的方面偏好随时间变化的特点。对此,该文提出一种面向时序感知的多类别商品方面情感分析推荐模型,该模型对用户、商品类别、商品、商品方面、方面情感和时间统一建模,以发现用户对不同类别商品的方面偏好随时间变化的特点,并据此做出推荐。该模型能够推断用户在任意时间对商品的方面偏好,从而为用户提供可解释的推荐。两个真实数据集的实验结果表明,与其它基于时间或方面情感分析的推荐模型相比,该文提出的模型在top-N推荐准确率和召回率评价指标上均获得显著改善。  相似文献   

20.
为了全面提高高等教育教学质量,从督导专家角度提高教学评价有效性,提出一个基于教学评价的中文短文本情感分析方法。针对中文短文本教学评价数据专业性强、特征稀疏等特点,建立教学评价专业词典,结合word2vec语言模型训练词向量,对教学评价数据的属性特征进行降维,采用线性核、多项式核和径向基核三种内核的支持向量机算法,对教学评价中的中文短文本数据进行情感分类,以判断评价的情感倾向。实验结果表明,支持向量机在径向基核函数下的情感分类性能最好,有助于教学质量的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号