首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本表示模型是基于主题向量和文档向量计算新的特征表示文本,但直接计算所得的稀疏主题特征与基于词向量的文档特征的距离,缺乏特征的一致性。本文提出了Huffman-LDA和Weight-Word2vec的文本表示模型,首先,使用LDA模型得到主题向量后构建主题哈夫曼树,再运用梯度上升方法更新主题向量,新的主题向量包含不同主题词之间的关系,求得的特征不再具有稀疏性;然后,使用LDA主题向量与主题矩阵中词的主题特性计算词权重更新Word2vec的词向量,使得词向量包含主题词之间的关系进而表示文档向量;最后,通过主题向量和文档向量的欧式距离得到具有强分类特征的文本表示。实验结果表明,该方法可获得更强的文本表示特征,有效提高文档分类精度。  相似文献   

2.
如何从海量的专利信息中挖掘出不同专利之间隐含的关联关系是很多专利管理系统迫切需要解决的问题.本文从专利文本的摘要出发,提出一种基于Apriori和引入LDA主题模型的专利文本分析方法.首先,采用Apriori算法对数据降维,挖掘关键词和主题词之间的关联规则并根据规则绘制共享主题网络图,然后使用LDA主题模型对离散化的专利-主题词矩阵进一步线性降维,并将主题聚类,得到主题细分下的高频词主题,最后结合两种分析方法的结果对专利文本进一步挖掘分析.本文所使用的方法能够有效地挖掘出专利文本数据间的关联,可以为专利间的关联推荐提供思路和应用参考.  相似文献   

3.
对用户生成内容的挖掘分析是获得微博主题的有效方法。针对用户标签使用匮乏的冷启动问题,提出融合用户标签和主题标签的微博主题生成方法。首先,以用户标签作为特征项,对用户稀疏向量进行压缩并计算用户标签相似度。其次,采用LDA主题模型对用户的微博进行主题抽取,生成微博主题标签。再次,将两种标签进行融合,建立用户标签主题相似度模型,以此获得微博的主题。最后,在微博数据集上对所提出的方法进行了应用,获得了以热门标签形式表征的微博主题,这一结果与采用LDA主题模型生成的微博主题基本一致,而获得的热门标签更具有主题代表性。  相似文献   

4.
提出了一种加权的基于LDA(Latent Dirichlet Allocation)的协同过滤算法,通过对传统协同过滤算法优缺点的分析,联合打分数据和评论数据的特征进行推荐。该算法主要研究用户评论文本的特点,通过LDA主题模型对评论文本集合进行主题提取,使用相对熵的方法计算相似度,在此基础上,研究用户评分对于每条评论文本的影响,联合LDA进行评分预测及推荐。实验结果表明,该算法能够显著提高推荐准确度。  相似文献   

5.
提出了一种考虑用户与发布者建模的个性化微博搜索模型,该模型一方面运用主题模型与语言模型构建微博主题维度的用户兴趣模型,另一方面,融合用户与微博发布者的关系特征,构建用户-发布者关系维度的用户兴趣模型。并将二者进行有效融合,设计了将单个用户的微博作为一个文本的训练方法,解决微博文本短、语料稀疏的问题。基于真实用户搜索反馈的实验表明,融合用户-发布者关系的微博搜索模型可有效提高微博搜索的个性化效果。  相似文献   

6.
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。  相似文献   

7.
针对隐含狄利克雷分布(LDA)模型特征提取时忽略语义信息的问题,提出一种融合LDA和全局文本表示(GloVe)模型的病症文本聚类算法LG&K-Medoide.首先,利用LDA对病症文本数据建模,采用JS(Jensen-Shannon)距离计算文本相似度;其次,利用GloVe对病症文本数据建模获取词向量,根据病症词性贡献...  相似文献   

8.
概率生成模型LDA(Latent Dirichlet allocation)是对文本进行主题挖掘的重要手段,在近几年有着广泛的应用。对于论坛文本,因为其本身具有一些结构特性,单纯使用LDA并不能够最大限度地利用文本信息挖掘主题,水帖、大量的短回复以及同一版块帖子的背景词也极大地影响了其主题挖掘的效果。针对论坛文本的特点,提出了基于改进LDA的BBS-LDA模型,并使用Collapsed gibbs sampling对模型进行推导。由于该模型利用了论坛的用户信息,故在挖掘主题的同时能够识别论坛的水贴和背景词。在天涯论坛语料上进行的实验表明,BBS-LDA可以有效地对论坛进行主题挖掘。  相似文献   

9.
针对传统社会网络链接预测方法忽视节点文本内容的问题,提出一种基于潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型的协作演化链接预测算法。算法利用LDA模型,对节点的文本内容进行分析,提取出每个节点的主题分布向量,利用分布向量的点积来衡量节点文本的相似性;然后将节点文本内容相似性矩阵与节点邻接矩阵相加,在此基础上计算节点之间的相似性;最后选取相似性最高的k个节点作为预测结果。实验结果表明该算法在网络图稀疏的情况下有较好的效果。  相似文献   

10.
通过自然语言处理技术,实现对商品评论数据的可视化流程分析,利用八爪鱼采集器对京东商品评论数据进行采集,对文本数据进行去重、分词、去停词等预处理,再结合TF-IDF算法来提取文本数据特征词,利用R软件建立LDA主题模型并提取主题,使用LDAvis可视化工具对主题模型进行交互式可视化分析,并结合词云图将评论文本数据以更直观的方式展现出来,从而挖掘消费者重点关注的评论词语,结合主题模型和词云图两种可视化方法将用户评论情感数据通过丰富的图形进行内容展示,可以使情感分析的结果更准确、更全面反映产品和客户需求,为消费者的购买和商家的改进提供依据。  相似文献   

11.
探讨了 Banach 代数中的行列式理论.给出了具有单位元的迹 Banach 代数具有行列式的充要条件.  相似文献   

12.
对引起加工质量故障的原因进行了研究,建立了用于加工中心加工质量故障分析的与/或故障树,提出了隐加工质量故障(FMQF)的概念和由·FMQF 找出制造系统故障的决策树方法.本文在模糊理论基础上,提出了隐加工质量故障识别的新方法,用这种方法可以根据控制图的变化进行设备状态估计.基于以上研究,建立了可用于柔性制造系统隐加工质量故障预测和预报的专家系统.  相似文献   

13.
发展了立方准晶材料的断裂理论 .通过应用Fourier分析和对偶积分方程理论 ,得到了立方准晶材料Ⅲ型裂纹问题的精确解析解 ,并由此确定了位移与应力场 ,应力强度因子和应变能释放率 .结果表明 ,应力强度因子与材料常数无关 ,而应变能释放率依赖于所有的材料常数 .这些为研究此新固体材料的变形和断裂提供了重要的信息 .  相似文献   

14.
对近年来非织造布滤料的研究进展做了简要综述,介绍了内部结构的研究及表征、过滤性能及其影响因素、过滤过程的计算机模拟,指出进一步发展所需要解决的问题。  相似文献   

15.
分析了当前高师物理专业人才培养与基础教育人才需求存在的问题,结合调查情况,提出了高师物理专业在培养目标、课程设置、教学内容、教学方法及实践教学环节方面的改革措施。  相似文献   

16.
17.
鞋面织物染整是纺织工业中一个特殊分支,公司通过采用先进染色技术和工艺,可以从源头上达到节能和减少废水产生量的效果,废水产生后经过处理达标排放,部分经深度处理后回用。公司经长期实践后已经达到吨织物染整用水125m~3/t_(产品),吨织物排放废水79.2 m~3/t_(产品),水回用率达37.8%,吨产品蒸汽耗量从9t/t_(产品)下降到7 t/t_(产品),均达到国内国际先进水平。  相似文献   

18.
介绍了一种面向对象的 NBO(node-block-object)超媒体数据模型.该模型利用面向对象的方法,将多媒体信息和链接功能封装于一体,成功地实现了交叉链接和双向链接,大大增强了系统的灵活性,并实现了超媒体系统中的前、后向双向查找功能.在链接关系上,还实现了条件约束,从而大大方便了时间相关媒体信息的处理和多种媒体对象相互协作的操作.  相似文献   

19.
研究一类高度非线性摩擦特性影响下的控制系统的定位控制问题 .针对负载扭矩变化而造成摩擦特性的变化 ,采用PID控制和摩擦补偿控制对阀控液压马达控制系统的定位控制进行实验对比分析 .实验结果表明 ,常规比例控制由于受摩擦的影响产生较大的稳态误差 ,而积分控制的引入可减小稳态误差 ,但却引起系统产生极限环振荡和较长的调节时间 ;简单的定摩擦补偿在恒定的负载扭矩下可以有效地减小稳态误差 ,但是当负载扭矩大范围变化时 ,稳态定位精度将大大降低 ;基于误差和误差变化的动态摩擦补偿 ,在负载扭矩大范围变化的条件下均获得了高精度的定位控制 .  相似文献   

20.
<正>May 26,2014,BeijingScience is a human enterprise in the pursuit of knowledge.The scientific revolution that occurred in the 17th Century initiated the advances of modern science.The scientific knowledge system created by human beings,the tremendous productivity brought about by science,and the spirit,methodologies and norms formulated in scientific practice since the 17~(th)Century have long become essential elements of  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号