首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
《计算机工程》2018,(1):35-43
在大规模时序文档集中,异同话题缺乏从时序文档集中识别跟踪分析话题随时间变迁的能力。为此,提出一种面向时序文档语料库的话题变迁检测方法。该方法从时序文档语料库中发现相似话题和异同话题。利用改进的联合非负矩阵分解算法,从多个数据集中提取话题集合。为避免引入噪声话题,计算所有话题的话题熵,以获取优质话题,并通过运用词云和趋势图来分析话题变迁趋势。在20Newsgroups和LTN2011数据集上的实验结果表明,该方法可以有效地从时序文档集中发现异同话题,且提取的话题效果好、准确率高。  相似文献   

2.
链接预测是社会网络分析中一个具有挑战性的问题。社会网络中的链接预测问题就是预测社会实体间未被发现的链接和即将演化产生的链接。已有的链接预测算法大多基于社会网络本身的拓扑结构,而忽视社会实体自身的个性化特征。针对以上问题,结合社会实体的个性化特征和社会网络的拓扑特征,提出一种基于概率矩阵分解模型的个性化链接预测算法。该算法整合了社会网络的拓扑特征和实体的个性化信息,建立概率矩阵分解模型,并通过基于梯度的优化算法对模型进行求解。在两个数据集上进行多组实验,一个是数据挖掘领域的合作者网络,另一个是电子商务消费者的信任网络。实验结果证明该算法较现有方法预测准确率有了较大提高。  相似文献   

3.
《计算机工程》2017,(2):57-62
现有微博热点话题发现模型对微博数量规模较敏感,发现速度较慢。为此,提出一种基于热度矩阵的主题模型。通过热度矩阵获取各潜在主题的热度和主题-词概率分布,并以词间的共有热度来挖掘其语义关系,进而准确识别数据中的热点话题及热点词汇。在真实微博数据上的实验结果表明,与潜在狄利克雷分布模型相比,该模型的效率和准确率较高,发现的热点话题与实时事件保持一致,具有较好的热点识别效果。  相似文献   

4.
许多推荐算法如基于矩阵分解因无法充分挖掘用户对项目的偏好信息而无法取得令人满意的推荐效果.为了解决上述问题,该文设计了两个模块,首先,利用多层感知机技术学习输入的信息以获得较好的特征表示,在原始输入时通过点积操作得到关系信息,并将其命名为深度矩阵分解(DeepMF);其次,在多层感知机中加入多层注意力网络,这样能够得到...  相似文献   

5.
Web媒体被公认为继报纸、广播、电视之后的“第四媒体”.而Web2.0的迅速普及,又使当今的Web媒体呈现了一种“自媒体”形式,即每个用户既是信息的接受者,也是信息发布者和信息转发者,在信息传递过程中,用户与用户互动,影响信息传播的进程.用户本身的特性对于传播有很大影响,信息传播依赖于用户个体的行为模式.因此,需要对用户和传播话题之间的关系进行建模,来度量用户对某个话题的感兴趣程度.论文提出了有效的算法来对用户进行感兴趣的话题推荐,该算法基于非负矩阵分解理论,分析用户发表过的内容,将用户感兴趣的话题推荐给该用户.该文针对研究小组下载的真实数据集-科学网数据集进行实验分析,实验结果表明算法能够有效地将用户感兴趣的话题推荐给用户.  相似文献   

6.
话题发现与追踪技术研究   总被引:3,自引:1,他引:2  
话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价方法以及发展历史;然后对其多个研究内容提出一个统一研究框架,并对该框架中的关键技术进行了详细分析;最后指出该领域中的关键问题及难点,并对未来研究做出展望。  相似文献   

7.
刘士荣  俞金寿 《控制与决策》1999,14(11):589-592
研究用矩阵QR分解分析一类模糊模型的结构,用模糊统计信息判据指导规则的精简,用R矩阵扩对角线元素分布与模糊规则的关系确定重要规则,冗余或不重要规则,实现模糊模型结构优化。该方法已成功地应用于Mackey-Glass浑沌系统建模。  相似文献   

8.
国玉静  姬东鸿 《计算机应用》2014,34(10):2859-2864
针对新闻的评论摘要的抽取问题,提出了一种将带权文本矩阵分解(WTMF)与信息熵结合的社交媒体评论自动抽取方法。该方法对微博(tweets)和news信息构建基于异质图的WTMF模型,解决短文本特征稀疏问题,保障信息的相似性;根据tweet的特征分布,构建基于特征的二元信息熵和连续信息熵,保证信息的多样性。最后依据子模属性,设计基于贪心的抽样算法,获取优化问题近似最优解。实验结果表明,WTMF与信息熵结合的方法能有效提高社交媒体摘要性评论抽取的性能,在ROUGE2上召回率和F1值分别达到0.40074和0.27330。与潜在狄利克雷分配(LDA)扩展模型--基于位的主体模型(BTM)相比,分别提高了0.05和0.03,有效地提高了新闻评论摘要质量。  相似文献   

9.
协同过滤推荐算法是目前构建推荐系统最为成功的算法之一,它利用已知的一组用户对物品喜好数据来对推测用户对其他物品的喜好,其中,能够直接刻画用户与项目潜在特征的矩阵分解模型和通过分析物品或者项目间相似度的邻域模型是研究的热点.针对这两个模型存在的不足,提出了一种将邻域模型与矩阵分解模型有效结合的方法,进而构建了一个改进的协同过滤推荐算法,提高了预测准确性.实验结果验证了改进算法的正确性与有效性.  相似文献   

10.
随着对LDA模型的研究越来越深入,文本表示和挖掘能力进一步提高。话题是LDA模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把LDA模型用于话题追踪,目的有两个:(一)检验LDA话题对追踪话题的表示能力;(二)检验LDA模型在挖掘训练数据中的追踪话题时,LDA话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于LDA模型的追踪性能更好,但由于粒度不同,LDA模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的LDA模型是下一步工作的目标。  相似文献   

11.
时间序列数据是一种数据属性随时间变化的高维数据类型,反映了用户兴趣的动态变化。基于时序数据的推荐系统利用用户的行为时间提高推荐的准确性,但是不适用于大规模数据集的推荐任务,矩阵分解方法是处理高维数据集时常用的降维方法。为此,提出一种基于时序模型和矩阵分解的推荐算法。基于该方法,首先利用矩阵分解提取原始时序数据的特征,然后通过时序模型挖掘特征的趋势,最后根据预测的特征得到预测结果并进行推荐。实验结果表明:所提出的算法与已有的推荐算法相比,在均方根误差(Root Mean Square Error, RMSE)和平均准确率(Mean Average Precision, MAP)两个指标上均有较好表现,且适用于大规模数据的推荐任务。  相似文献   

12.
近年来,群组推荐由于其良好的实用价值得到了广泛关注.然而,已有的群组推荐方法大多都是根据分析用户对服务的评分矩阵直接将个体用户的推荐结果或个体用户偏好进行聚合,没有综合地考虑用户-群组-服务这三者间的联系,导致群组推荐效果欠佳.受潜在因子模型与状态空间模型启发,结合评分矩阵、服务描述文档以及时间因素,共同分析用户-群组-服务间的联系,提出了一种基于动态卷积概率矩阵分解的群组推荐方法.该方法首先利用基于卷积神经网络的文本表示方法获取服务潜在特征模型的先验分布;然后,将状态空间模型与概率矩阵分解模型相结合,获得用户潜在偏好向量与服务特征向量;之后,对用户偏好向量运用聚类算法来发现潜在的群组;最终,对群组中的用户偏好采取均值策略融合成群组偏好向量,并与服务特征向量共同生成群组对服务的评分,实现群组推荐.通过在MovieLens数据集上与同类方法进行对比实验,发现所提方法的推荐有效性与精确性上更具有优势.  相似文献   

13.
在概率矩阵分解(PMF)模型拟合之后,评分较少用户的特征趋近于先验分布的平均值,导致对其评分预测接近物品的平均评分.受约束概率矩阵分解(CPMF)未考虑到不同评分系统的整体差异以及数据集内部用户与物品存在的固有属性.针对以上问题,提出将传统矩阵分解中的用户和物品偏置项以及全局平均分结合受约束概率矩阵分解来建立新的矩阵分解算法.算法利用整体平均分衡量不同评分系统,在采用偏置来表示用户以及物品之间相互独立的属性的同时,引入约束使行为相近用户拥有相近的用户偏置,从而提高预测精度.在两个真实数据集上的实验结果表明,该算法相对于PMF和CPMF算法预测精度得到了提高.  相似文献   

14.
建立鲁棒的外观模型是目标跟踪中的关键问题,为此提出一种基于增量型非负矩阵分解的目标跟踪算法.首先根据转移概率模型在当前帧中预测得到一组图像样本;随后利用非负矩阵分解获取样本在子空间中的坐标向量;在此基础上计算样本与前一帧视频中目标图像在低维坐标向量上的相关性,以具有最大相关性的图像样本作为目标在当前帧中的图像区域;最后以增量的方式完成子空间的在线更新,提高了外观模型的更新效率,且所要求的存储空间大小恒定.实验结果表明,该算法对目标物的外观变化具有良好的自适应性,能够在视频序列中对目标进行稳定的跟踪.  相似文献   

15.
训练集中文本质量的好坏直接决定着文本分类的结果。实际应用中训练集的构建不可避免地会产生噪声样本,从而影响文本分类方法的实际应用效果。为此,针对文本分类中的噪声问题,本文提出一种基于概率主题模型的噪声处理方法,首先对训练集中的每个样本计算其类别熵,根据类别熵对噪声样本进行过滤;然后利用主题模型进行数据平滑,进一步减弱噪声样本的影响。这种方法不但能够减弱噪声样本对分类结果的影响,同时还保持了训练集的原有规模。在真实数据上的实验表明,该方法对噪声样本的分布具有较好的鲁棒性,在噪声比例较大的情况下仍能保持较好的分类结果。  相似文献   

16.
杜东舫  徐童  鲁亚男  管楚  刘淇  陈恩红 《软件学报》2018,29(12):3747-3763
互联网的蓬勃发展,在为用户提供便利的同时,其海量信息也为用户选择造成了困难,基于用户理解的信息推荐服务正成为应时之需.相较于面向单个用户信息的传统推荐技术,基于社交信息的推荐技术通过引入影响力建模,可以更真实地还原用户属性及行为.然而,已有的社交推荐技术往往停留于对用户影响的笼统归纳,并没有对其内在机制进行清晰分类和量化.针对这一问题,通过对用户评分行为中的信任关系进行分析,着重研究了信任用户间接影响用户偏好和直接影响用户评分两种不同机制,进而提出了基于用户间信任关系融合建模的概率矩阵分解模型TPMF,从而实现对上述两种机制的有效融合.在此基础之上,针对不同用户受两种机制影响权重不同的问题,通过借助评分相关性对用户进行聚类并映射到相应权重,实现了用户模型参数的个性化选择.公开数据集的多项实验结果表明:提出的TPMF及其衍生算法在各项指标上优于现有代表性算法,验证了所提出的影响机制及技术框架的有效性.  相似文献   

17.
矩阵分解已经成为预测用户对物品评分的一种常用方法。传统的矩阵分解技术没有考虑到用户评分之间的差异性,针对上述问题在矩阵分解的基础上,提出差值矩阵分解模型。算法将每个用户对物品的评分减去与其社会属性相似用户对该物品评分的平均分,得到一个差值矩阵,然后对差值矩阵进行分解。在Movielens 1M数据集的实验结果表明,该算法的预测精度较贝叶斯概率矩阵分解、矩阵分解、融合用户属性的隐语义模型都有较为明显的提升。  相似文献   

18.
文本聚类的目标是把数据集中内容相似的文档归为一类,而使内容不同的文档分开。目前针对不同领域的需求,多种解决聚类问题的算法应运而生。然而,由于文本数据本身固有的复杂特点,如海量、高维、稀疏等,使得对海量文本数据的聚类仍然是一个棘手的问题。提出了层次非负矩阵分解聚类方法,该方法不但保留了非负矩阵分解的优点,如同步识别文档类别和找出类别本质特征,而且能够展现类别间的层次结构。这种类别层次结构在网页预览等应用中是非常有用的。在真实数据集20Newsgroups和Reuters-RCV1上的实验结果表明,层次非负矩阵分解相比已有的方法更有效。  相似文献   

19.
黄晓宇  潘嵘  李磊  梁冰  陈康  蔡文学 《软件学报》2015,26(9):2262-2277
研究一类特殊的矩阵分解问题:对由多个对象在一组连续时间点上产生的数据构成的矩阵R,寻求把它近似地分解为两个低秩矩阵UV的乘积,即RUT×V.有为数众多的时间序列分析问题都可归结为所研究问题的求解,如金融数据矩阵的因子分析、缺失交通流数据的估计等.提出了该问题的概率图模型,进而由此导出了其约束优化模型,最终给出了模型的求解算法.在不同的数据集上进行实验验证了该模型的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号