首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
孟军  刁印 《计算机应用》2014,34(12):3433-3437
针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程和最大期望算法的自适应模型;然后,利用图优化策略融合功能类别和蛋白质相互作用网络构成的多个关联矩阵;最后,将融合后的关联矩阵代入模型中预测蛋白质功能。在Yeast和Mouse的蛋白质多源异构数据上的实验结果表明,提出的方法具有预测准确率高、标签损失率低等优势。  相似文献   

2.
胡赛  熊慧军  赵碧海  李学勇  王晶 《自动化学报》2015,41(11):1893-1900
一个蛋白质可能在不同条件或不同时刻与不同的蛋白质发生相互作用,这称为蛋白质的动态特性.蛋白质在分子处理的不同阶段参与到不同的模块,与其他的蛋白质共同完成某项功能.因此, 动态蛋白质相互作用的研究有助于提高蛋白质功能预测的准确率.结合蛋白质相互作用网络和时间序列基因表达数据,构建动态蛋白质相互作用网络.为降低PPI网络中假阴性对功能预测产生的负面影响,结合结构域信息和复合物信息,预测和产生新的相互作用,并对相互作用加权.基于构建的动态加权网络,提出一种功能预测方法D-PIN (Dynamic protein interaction networks). 基于三个不同的酵母相互作用网络实验结果表明, D-PIN 方法的综合性能比现有方法提高了14%以上.结果验证了构建的动态加权蛋白质相互网络的有效性.  相似文献   

3.
近年来,链接预测成为社会网络和其他复杂网络链接挖掘中的热门研究领域.在链接预测问题中,经常会存在用来提高预测效果的附加数据信息源,这些数据可以用于预测网络中的链接是否存在.在所有的数据源中,最主要的数据源在链接预测中起到最重要的作用.因此,设计具备健壮性的算法用于充分利用所有数据源的信息来进行链接预测十分重要,算法还需要平衡主数据源和附加数据源的关系,使得链接预测能够获得更好的效果.同时,传统基于拓扑结构计算的无监督算法大多数通过计算网络中节点间的评分值来解决预测链接存在可能性的问题,这些方法能够获得有效的结果.在链接预测方法中,最关键的一步是构建准确的输入矩阵数据.由于许多真实世界数据集存在噪声,这导致降低了大多数链接预测模型的效果.提出了一种新的链接预测方法,通过多个数据源的融合,兼顾地利用了主数据源的信息和其他附加数据源的信息.接着,主数据源和其他附加数据源被用于构建一个低噪声且更准确的矩阵,而新的矩阵被用于作为传统无监督拓扑链接预测算法的输入.根据在多个真实世界数据上的测试结果,在多源数据集上进行对比实验,提出的基于低秩和稀疏矩阵分解的多源融合链接预测算法相对于基准算法能够获得更好的效果.  相似文献   

4.
基于关键功能模块挖掘的蛋白质功能预测   总被引:1,自引:0,他引:1  
精确注释蛋白质功能是从分子水平理解生物体的关键.由于内在的困难和昂贵的开销,实验方法注释蛋白质功能已经很难满足日益增长的序列数据.为此,提出了许多基于蛋白质相互作用(Protein-protein interaction,PPI)网络的计算方法预测蛋白质功能.当今蛋白质功能预测的趋势是融合蛋白质相互作用网络和异构生物数据.本文提出一种基于多关系网络中关键功能模块挖掘的蛋白质功能预测算法.关键功能模块由一组紧密联系且共享生物功能的蛋白质组成,它们能与网络中的剩余部分较好地区分开来.算法通过从多关系网络的每一个简单网络中挖掘高内聚、低耦合的子图形成关键功能模块.关键功能模块中邻居蛋白质的功能用于注释待预测功能的蛋白质.每一个简单网络在蛋白质功能预测中的重要性各不相同.实验结果表明,提出的方法性能优于现有的蛋白质功能预测方法.  相似文献   

5.
鉴于多标签传播算法在发现社会网络的社区结构研究上具有快速、高效的求解能力,提出融合多源蛋白质生物学知识的基于多标签传播机制的蛋白质相互作用(PPI)网络功能模块检测算法.首先,结合PPI网络功能信息和结构信息初始化节点的标签.然后,利用基因表达数据描述蛋白质间的共表达性,依据共表达性构建标签集合,从中选择标签以实现标签在节点间真实可靠的传播.最后,将具有相同标识符的节点划分到同一功能模块中,获得最终结果.实验表明文中算法不仅具有良好的时间性能,而且在检测精度上也具有一定的竞争性.  相似文献   

6.
长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法预测它和蛋白质之间的相互作用将会不太合适。LPHeteSim算法是一种基于对称路径随机游走的方法,它可以衡量异质长非编码RNA和蛋白质相互作用网络中两者的相关性。在导质网络中,LPHeteSim算法可以有效地预测两者的相互作用,实验结果验证了算法的有效性。  相似文献   

7.
蛋白质相互作用数据具有较高的假阳性率和假阴性率,这直接导致计算方法从中预测蛋白质复合物会产生较大的误差。为了弥补数据的这种先天性不足,通过结合多数据源,一种新的蛋白质复合物预测算法被提出。匹配分析和GO功能富集分析被用于评估算法的性能。测试结果表明,新算法远优于以前的其他算法。  相似文献   

8.
多关系蛋白质网络构建及其应用研究   总被引:3,自引:0,他引:3  
考虑到不同类型的相互作用对于功能预测的作用各不相同, 结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络, 并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络, 提出一种蛋白质功能预测方法FPM (Functions prediction based on multi-relational networks).对于未注释的蛋白质, 算法遍历与该蛋白质相连的, 具有最高优先级的所有相互作用, 形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合, 并为每一项功能评分、排序.与其他算法对比结果表明, FPM方法的性能优于其他的功能预测方法.  相似文献   

9.
实验产生的蛋白质相互作用数据不可避免地伴随着假阳性和假阴性,因而,基于蛋白质相互作用数据预测蛋白质复合物的计算方法天然具有较大的误差。为了弥补这种数据先天性不足,基因表达谱被结合进来,构造了新的加权蛋白质网络。为了验证网络的生物学意义,马尔可夫聚类算法被用于从加权与非加权网络中预测蛋白质复合物,预测到的复合物与基准复合物进行匹配分析。分析结果表明,加权网络比非加权网络具有更高的生物学意义。  相似文献   

10.
一种基于随机游走模型的多标签分类算法   总被引:5,自引:0,他引:5  
在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题.  相似文献   

11.
蔡彪  李蕊岑  吴媛媛 《计算机应用》2021,41(9):2569-2577
链路预测的主要任务是设计一个能够更加准确地描述给定网络机制的预测算法,从而得到更准确的预测结果。在分析现有研究成果基础上发现,网络的相似性特征对采用的链路预测方法有较大的影响:在节点间标签相似性较低的网络中,提高标签的相似性可以提高预测的准确性;而在节点间标签相似性较高的网络中,则应更加关注结构信息对于链路预测的贡献来提高预测的准确性。随后,通过对标签进行加权处理,提出带权值的标签相似性算法,在低相似性网络中能够提高链路预测的准确性。同时,在较高相似性网络中,将网络的结构信息引入到节点的相似性计算中,并通过偏好链接机制来提升链路预测的准确性。在四个真实网络上的实验结果表明,所提算法相对于标签系统间的余弦相似性(CSTS)算法、偏好链接(PA)等算法取得了最高的准确率。根据网络相似性特征,采用所提出的对应算法进行链路预测能够得到更准确的预测结果。  相似文献   

12.
针对现有的基于蛋白质相互作用(PPI)网络的蛋白质功能预测方法预测精度不高、易受数据噪声影响的问题,提出一种基于机器学习(层次聚类、主成分分析和多层感知器)的蛋白质功能预测方法HPMM。该方法综合考虑蛋白质宏观和微观层面的信息,将蛋白质家族、结构域和重要位点信息作为顶点属性整合到PPI网络中以减轻网络中数据噪声的影响。首先,基于层次聚类和主成分分析进行特征提取,得到功能模块和属性主成分特征,然后训练多层感知器模型,建立多特征与多功能之间的映射关系以用于功能预测。在三个分别被分子功能(MF)、生物过程(BP)和细胞组件(CC)注释的人类PPI网络上进行测试,对HPMM、余弦迭代算法(CIA)和有向PPI网络基因本体术语传播(GoDIN)算法的功能预测效果进行比较分析。实验结果表明,相比CIA和GoDIN这两种完全基于PPI网络的方法,HPMM的精确度与F值更高。  相似文献   

13.
链接预测是社会网络分析领域的关键问题。传统的链接预测方法大多针对社会网络的静态结构预测隐含的链接或者将来可能产生的链接,而忽视了网络在动态演变过程中的潜在信息。为了能更好地利用网络演变的动态信息,从而取得更好的链接预测效果,提出了一种基于网络结构演变规律的链接预测方法。该方法使用机器学习技术对网络结构特征的动态变化信息进行训练,学习每种结构特征的变化并得到一个分类器,为每个分类器加权得到最终集成的结果。在三个现实的合著者网络数据集上的实验结果表明,该方法的性能要高于静态链接预测方法和一个相关的动态链接预测方法。这说明,网络结构演变信息有助于提高链接预测效果。此外,实验还表明,不同的结构特征对网络动态变化的刻画能力也有所差别。  相似文献   

14.
张蕾  李征  郑逢斌  杨伟 《计算机应用》2017,37(5):1512-1515
蛋白质二级结构预测是结构生物学中的一个重要问题。针对八类蛋白质二级结构预测,提出了一种基于递归神经网络和前馈神经网络的深度学习预测算法。该算法通过双向递归神经网络建模氨基酸间的局部和长程相互作用,递归神经网络的隐层输出进一步送入到三层的前馈神经网络以便进行八类蛋白质二级结构预测。实验结果表明,提出的算法在CB513数据集上达到了67.9%的Q8预测精度,显著地优于SSpro8和SC-GSN。  相似文献   

15.
刘巧玲  李劲  肖人彬 《计算机应用》2017,37(5):1419-1423
针对现有的舆情传播模型研究与实际舆情数据结合较少以及难以从舆情大数据中挖掘舆情传播内在规律的问题,提出一种基于实际网络舆情大数据采用神经网络的舆情传播模型参数反演算法。改进经典SIR传染病传播模型,构建一种网络舆情传播模型,基于该模型对实际案例进行参数反演,预测网络舆情的后续传播趋势,并与马尔可夫预测模型对比,所提算法可以精确预测舆情的具体热度值。实验结果表明,所提算法在预测性能上具有一定的优越性,可以用于网络突发事件传播的数据拟合、过程模拟和趋势预测。  相似文献   

16.
张涛  张颖江 《计算机科学》2016,43(7):111-114, 135
客户机与服务器之间存在数据存储隐通道,对该通道的网络流量进行准确预测可避免网络拥堵,提高网络流量的调度和管理能力。传统方法采用线性时间序列分析方法进行网络流量预测,没有准确反映流量序列的非线性特征信息,预测精度不高。提出一种基于非线性时间序列分析和矢量空间重构的网络流量预测算法。进行相位随机化处理,使得网络流量数据离散解析化,把网络流量时间序列解析模型分解为含有多个非线性成分的统计量。采用自相关函数法求得矢量空间重构的时间延迟,采用互信息最小嵌入维算法求得网络流量序列的矢量空间嵌入维,实现流量序列的矢量空间重构。在高维矢量空间中,提取网络流量的高阶谱特征,实现网络流量的准确预测。仿真结果表明,采用该算法能有效拟合流量序列的非线性状态特征,对流量状态变化的动态跟踪性能较好,其预测误差比传统方法的低。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号