首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。  相似文献   

2.
提出了建立Linked Data数据集主题模型的方法.首先,将数据集中的RDF陈述三元组转换成主谓宾结构的语句,从而将Linked Data数据集转化为文本文档;然后,使用LDA算法对所有数据集的文本文档进行主题建模,即可得到每个数据集的主题向量,该向量就是描述数据集内容主题的特征.在Linked Data数据集链接目标推荐问题上,引入数据集的主题特征进行实验.使用数据集主题向量的余弦相似度替换基于记忆的协同过滤推荐算法中的相似度计算模块.结果表明,推荐效果比原始的协同过滤算法有很大提升.  相似文献   

3.
推荐系统广泛地应用在网络平台中,推荐模型需要预测用户的喜好,帮助用户找到适合的电影、书籍、音乐等商品.通过对用户评分和评论信息的分析,可以发现用户关注的商品特征,并根据商品的特征,推测用户对该商品的喜好程度.本文提出将评论中隐含的语义内容与评分相结合,设计并实现了一种新颖的商品推荐模型.首先利用主题模型挖掘评论文本中隐含的主题分布,用主题分布刻画用户偏好和商品画像,在逻辑回归模型上训练主题与打分的关系,最终评分可以被视为是对用户偏好和商品画像的相似程度的量化表示.最后,本文在真实数据上进行了大量对比实验,结果证明该模型比对比系统性能优越且稳定.  相似文献   

4.
针对传统邮件分类模型中较少对邮件主题进行描述和分析的问题,提出一种代价敏感多主题学习的邮件分类算法,用以实现垃圾邮件过滤.首先,基于LDA(潜在狄利克雷分布)对邮件的多个主题进行提取,对邮件语义进行描述;其次,利用CS-SVM(代价敏感支持向量机)对邮件进行代价敏感学习,实现对不同类别邮件的惩罚;最后,结合MI-SVM(多示例支持向量机)进行代价敏感的多主题学习,实现邮件分类.实验采用四组ling-spam处理数据集.实验结果证明:该分类算法较比传统邮件分类算法,可以取得更高的准确性、特异性与敏感性.  相似文献   

5.
对利用主题模型挖掘医疗服务主题进行了深入研究,针对LDA主题模型用于医疗评论主题挖掘中存在的语义稀疏、共现信息不足等问题,提出一种基于词共现分析与LDA主题模型结合的CO-LDA模型.首先使用词共现分析方法对评论语料库进行分析,得到词共现矩阵.其次利用LDA主题模型对语料评论进行建模表示,挖掘出患者对医疗服务的关注点.基于平均最小JS距离、平均肯德尔等级相关系数τb及平均TF-IDF 3个指标对比CO-LDA模型与传统LDA模型在医疗评论主题挖掘中的应用效果,实验最终表明CO-LDA模型识别主题的一致性和主题质量优于LDA模型.将实验结果与中国《医院评价标准》进行对比,一致性较高,说明基于CO-LDA的在线医疗评论主题挖掘方法的有效性.   相似文献   

6.
基于逻辑回归的中文在线评论有效性检测模型   总被引:1,自引:0,他引:1  
为了实现电子商务和社交网络中文在线评论有效性的自动化检测,提出了一种单一主题环境下基于逻辑回归的垃圾评论检测模型.中文在线评论有效性的检测可以归结为分类问题,结合中文在线评论的特点提取了9个特征以构建分类模型;为获取核心特征主题的相关度,采用基于关联规则的评论名词模式优化了ICTCLAS中文分词系统的主题识别,进而利用交叉语言模型获取在线评论主题相关度.实验中采取了人为标定的1 000条评论作为样本,把支持向量机分类模型作为对比进行试验,利用数据挖掘工具Weka进行计算.结果表明,采用优化评论名词模式下基于逻辑回归的垃圾评论检测模型结果的准确率达到83.54%,比支持向量机分类模型计算得到的准确率高2.10%.  相似文献   

7.
通过提出一种多路融合卷积神经网络(multi-mixed convolutional neural network,MMCNN)对网购商品评论数据进行文本情感分类。采用skip-gram模型进行词向量的训练,并用训练好的向量表示评论数据。针对评论数据长短不一的情况,提出了循环词向量填充和随机词向量填充算法,有助于提升模型分类的准确率。针对传统卷积神经网络特征提取方式单一的问题,将多路卷积特征和池化特征在全连接层进行了特征融合,以此提升网络的文本分类效果。选择京东网站上45 000条婴儿奶粉的评论数据进行试验,并与支持向量机、最大熵模型、朴素贝叶斯等传统机器学习方法以及经典卷积神经网络方法进行对比。试验结果表明,提出的多路融合卷积神经网络具有较高的分类正确率。  相似文献   

8.
高速公路实时事故风险研判模型及可移植性   总被引:3,自引:0,他引:3  
通过G15沈海高速公路南通段上布设的高清卡口过车数据对路段上发生的实时事故风险进行研究.采用配对案例对照方法,结合基于随机森林的参数选取方法对3个子路段上的事故分别建立了支持向量机模型.结果表明,基于高清卡口采集的高分辨率过车数据构建的支持向量机模型相对既有研究中的模型而言其性能较优;对3个子路段分别构建的支持向量机模型进行可移植性分析发现各支持向量机模型均具有一定的可移植性,经过参数重新标定后可直接应用至邻近道路对其实时事故风险状态进行研判,并有着相对较高的预测精度.  相似文献   

9.
针对地理标签和评论信息的情感倾向对于推荐系统性能的影响,本文基于地理标签和用户评论情感分析提出有关兴趣点的推荐策略,并建立了一种基于内容的推荐模型.本系统首先对用户兴趣点信息进行有效的补充,并实现了用户兴趣点相似度度量.对无标签评论数据进行情感分析及挖掘,获取其情感倾向度.同时本系统结合了时间滑动窗口,更准确地把握用户评论和兴趣点的结合度.最终得到用户个性化推荐排名.本文方法涵盖了本地用户和外地用户的个性化推荐策略.通过实验数据表明,本文模型有效提高了推荐的准确度.  相似文献   

10.
在经典线性判别分析(LDA)和软间隔支持向量机(C-SVM)的基础上,提出了支持向量判别分析(SVDA)和基于支持向量的极大化间隔判别分析(MSVDA).为了说明SVDA和MSVDA对分类问题的有效性和实用性,利用UCI数据库中的Wine数据和Iris数据进行了对比实验.实验结果表明,总体上,SVDA和MSVDA均比LDA有效.  相似文献   

11.
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品.  相似文献   

12.
在对标准潜在狄利克雷分布(LDA)模型进行改进的基础上,提出了一个主题情感混合最大熵LDA模型对在线评论进行细粒度观点挖掘.首先,在传统LDA模型中加入最大熵组件来区分背景词、特征词和观点词,并对特征词和观点词进行局部和全局的划分;然后,在主题层和单词层之间加入情感层,将传统的LDA三层模型扩展成四层;最后,进行情感极性分析,同时获取整篇评论和每个主题的情感极性,生成细粒度的主题情感摘要.实验验证了所提模型和理论的有效性.  相似文献   

13.
针对现有基于评论分析的推荐算法没有充分考虑个性化的问题, 通过对评论进行主题分析, 挖掘用户的喜好, 分别建立基于用户和物品的个性化评分预测模型。在真实数据集上进行实验验证, 结果表明该模型有效地提高了推荐系统的评分预测性能。  相似文献   

14.
提出一种结合LDA及语义相似度的商品评论情感分类方法。该方法首先使用LDA对商品语料库建模,获取文档-主题矩阵;人工选择k对褒义词、贬义词,基于HowNet语义相似度计算主题(评价对象+观点内容)与各个褒义词和贬义词的相似度,达到对观点词极性判断,计算文本观点词情感极性的加权和作为文本的情感极性。实验表明,与基于向量空间的SVM分类方法相比,该情感分类方法在分类指标上表现更好。  相似文献   

15.
从最小二乘支持向量机的稀疏表达出发,构建高效的基于稀疏最小二乘支持向量机的网络入侵检测模型,提出了一种通过基于核空间近似策略的有效低秩逼近来有效减小原始训练样本集中的支持向量数来实现最终模型的稀疏表达.以MIT KDD99数据集为基础,对所提出方法进行有效性验证,并与利用剪枝策略通过递归过程中不断减少模型中支持向量个数的稀疏化方法、基本最小二乘支持向量机以及标准支持向量机方法的性能进行对比.结果表明:基于核空间近似的最小二乘支持向量机稀疏化与标准最小二乘支持向量机相当;此外稀疏最小二乘支持向量机能够提高入侵检测响应速度.  相似文献   

16.
基于粒子群优化算法提出了一种通过优化支持向量机模型参数,建立更佳的支持向量机数学模型的方法. 针对双螺旋分类问题,分别利用基于粒子群优化算法所建立的支持向量机分类器和标准支持向量机分类器进行了仿真实验,利用所建立的评价体系对仿真实验所获得的实验数据进行了评估,评估结果表明基于粒子群优化算法的支持向量机分类器明显优于标准支持向量机分类器,其分类结果表明基于粒子群优化算法的支持向量机分类器提高了分类结果的准确性,同时也验证了基于粒子群优化算法的支持向量机分类器在数据分类中的有效性.   相似文献   

17.
将主成分分析和支持向量机回归相结合, 以广西5、6月区域平均日降水量作为预报对象, 进行区域日降水量预测研究.首先,整理分析大量的T213数值预报产品信息数据进行主成分分析, 得到主成分数据序列; 其次, 根据主成分数据序列建立训练集训练支持向量机, 并利用遗传算法优化参数; 最后, 输入支持向量机所需数据, 得到主成分预测结果, 建立广西日降水预报模型. 实例计算结果表明, 支持向量机回归模型比逐步回归模型有更好的预测能力.  相似文献   

18.
协同过滤算法是一个在各领域广泛使用的启发式推荐算法,但传统协同过滤算法存在冷启动、数据稀疏性、用户分类精度低等问题.以协同过滤算法中重要的分类模型为切入点,对协同过滤算法进行改进.在选取分类算法方面,使用支持向量机算法与K最近邻算法进行模型融合,得到一个适用于协同过滤模型的分类算法,用其代替传统协同过滤算法中的分类算法.实验结果表明,改进的个性化推荐算法模型能较好解决传统协同过滤算法存在的问题,在对用户喜好的推荐精度上有明显优化作用.  相似文献   

19.
基于粒子群最小二乘支持向量机的瓦斯含量预测   总被引:3,自引:0,他引:3  
针对经验模型与确定性模型在应用中受到限制问题,采用基于统计学习理论的支持向量机对经验数据进行学习,建立瓦斯含量与其影响因素之间的映射模型,从而实现煤层瓦斯含量预测.支持向量机的惩罚因子和核参数取值不同将会明显影响其预测的精度,支持向量机本身也没给出解决的办法,引入粒子群算法自动搜索支持向量机参数.该方法克服了神经网络过学习问题和支持向量机人为选取参数的盲目性问题.通过对某矿区样本的学习预测研究,表明该方法可取得良好的预测效果,具有较好的适应性.  相似文献   

20.
针对人耳图像自身的特点并通过对现有方法的研究,提出了一种先利用LDA/GSVD算法对样本图像进行特征提取,然后运用SVM分类器对样本向量进行分类的人耳识别方法.此外,还对线性判别分析、广义奇异值分解和支持向量机的相关内容做了简要介绍.实验表明,LDA/GSVD很好地解决了在高维、小样本的情况下,使用Fisher线性鉴别分析的特征提取方法存在的病态奇异问题,把它与支持向量机有机地结合起来,构成了一种有效的人耳识别新方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号