首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 937 毫秒
1.
多关系蛋白质网络构建及其应用研究   总被引:3,自引:0,他引:3  
考虑到不同类型的相互作用对于功能预测的作用各不相同, 结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络, 并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络, 提出一种蛋白质功能预测方法FPM (Functions prediction based on multi-relational networks).对于未注释的蛋白质, 算法遍历与该蛋白质相连的, 具有最高优先级的所有相互作用, 形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合, 并为每一项功能评分、排序.与其他算法对比结果表明, FPM方法的性能优于其他的功能预测方法.  相似文献   

2.
针对现有的基于蛋白质相互作用(PPI)网络的蛋白质功能预测方法预测精度不高、易受数据噪声影响的问题,提出一种基于机器学习(层次聚类、主成分分析和多层感知器)的蛋白质功能预测方法HPMM。该方法综合考虑蛋白质宏观和微观层面的信息,将蛋白质家族、结构域和重要位点信息作为顶点属性整合到PPI网络中以减轻网络中数据噪声的影响。首先,基于层次聚类和主成分分析进行特征提取,得到功能模块和属性主成分特征,然后训练多层感知器模型,建立多特征与多功能之间的映射关系以用于功能预测。在三个分别被分子功能(MF)、生物过程(BP)和细胞组件(CC)注释的人类PPI网络上进行测试,对HPMM、余弦迭代算法(CIA)和有向PPI网络基因本体术语传播(GoDIN)算法的功能预测效果进行比较分析。实验结果表明,相比CIA和GoDIN这两种完全基于PPI网络的方法,HPMM的精确度与F值更高。  相似文献   

3.
基于蛋白质网络的模块动态特性挖掘研究   总被引:1,自引:1,他引:0  
郭阳  尚学群  李晶 《计算机应用研究》2012,29(12):4495-4499
目前对于蛋白质网络的多数分析方法都是基于静态网络框架提出的,然而,事实上蛋白质之间的相互作用关系是随着时间变化的,具有明显的动态特性。从动态角度出发,基于蛋白质交互网络,结合时间序列的基因表达数据,揭示蛋白质功能模块变化的动态特性,提出了一种动态网络的构建方法及在动态快照网络中挖掘功能模块的算法,采用模糊匹配的方法揭示了蛋白质功能模块的变化过程。实验证明,该方法能够有效地揭示蛋白质功能模块的动态变化特性。  相似文献   

4.
孟军  刁印 《计算机应用》2014,34(12):3433-3437
针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程和最大期望算法的自适应模型;然后,利用图优化策略融合功能类别和蛋白质相互作用网络构成的多个关联矩阵;最后,将融合后的关联矩阵代入模型中预测蛋白质功能。在Yeast和Mouse的蛋白质多源异构数据上的实验结果表明,提出的方法具有预测准确率高、标签损失率低等优势。  相似文献   

5.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

6.
探测蛋白质相互作用网络中的功能模块对于理解生物系统的组织和功能具有重要的意义。目前,普遍的做法是将蛋白质相互作用网络表示成一个图,利用各种图聚类算法来挖掘功能模块。本文采用了基于模块度优化的图聚类算法来探测蛋白质相互作用网络中的集团,从具有2617个节点11855个相互作用的酵母蛋白相互作用网络中探测出68个集团。对于得到的集团,首先从拓扑结构的角度验证其的确是内部连接稠密的子图,然后分析了MIPS数据库中ComplexCat提供的已知的蛋白质复合体与这些集团的重叠情况,发现很多蛋白质复合体完全包含在某些集团中,最后使用超几何聚集分布的P值来分析一个集团对某个特定功能的富集程度,并根据最小的P值对应的功能来注释该集团的主要功能,发现集团中大部分的蛋白质具有相同的功能。研究结果表明,该方法探测的集团具有重要的生物学功能意义。  相似文献   

7.
针对谱聚类融合模糊C-means(FCM)聚类的蛋白质相互作用(PPI)网络功能模块挖掘方法准确率不高、执行效率较低和易受假阳性影响的问题,提出一种基于模糊谱聚类的不确定PPI网络功能模块挖掘(FSC-FM)方法。首先,构建一个不确定PPI网络模型,使用边聚集系数给每一条蛋白质交互作用赋予一个存在概率测度,克服假阳性对实验结果的影响;第二,利用基于边聚集系数流行距离(FEC)策略改进谱聚类中的相似度计算,解决谱聚类算法对尺度参数敏感的问题,进而利用谱聚类算法对不确定PPI网络数据进行预处理,降低数据的维数,提高聚类的准确率;第三,设计基于密度的概率中心选取策略(DPCS)解决模糊C-means算法对初始聚类中心和聚类数目敏感的问题,并对预处理后的PPI数据进行FCM聚类,提高聚类的执行效率以及灵敏度;最后,采用改进的边期望稠密度(EED)对挖掘出的蛋白质功能模块进行过滤。在酵母菌DIP数据集上运行各个算法可知,FSC-FM与基于不确定图模型的检测蛋白质复合物(DCU)算法相比,F-measure值提高了27.92%,执行效率提高了27.92%;与在动态蛋白质相互作用网络中识别复合物的方法(CDUN)、演化算法(EA)、医学基因或蛋白质预测算法(MGPPA)相比也有更高的F-measure值和执行效率。实验结果表明,在不确定PPI网络中,FSC-FM适合用于功能模块的挖掘。  相似文献   

8.
洪海燕  刘维 《计算机科学》2017,44(10):38-44
关键蛋白质是生物体内维持所有生命活动最重要的物质基础。随着高通量技术的发展,如何从蛋白质相互作用网络中识别出关键蛋白质成为目前蛋白质组学的研究热点。针对大部分现有方法仅仅基于网络拓扑结构信息进行识别以及蛋白质相互作用数据假阳性高的问题,提出了改进的粒子群算法来识别关键蛋白质。通过综合考虑网络拓扑结构特性和多源生物属性信息构建了高质量的加权网络,还考虑使用蛋白质节点间联系的紧密程度来衡量蛋白质的关键性,并扩展局部网络拓扑至二阶邻居,大大提高了预测的准确率。提出了衡量top-p关键蛋白质的整体性指标,降低了计算复杂度。在标准数据集上的实验结果表明,与其他经典算法相比,所提算法更具优势,能够识别出更多的蛋白质,具有较高的准确率。  相似文献   

9.
针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声以及现有关键蛋白识别方法准确率不高等问题,提出了一种基于中心性和模块特性(united centrality and modularity,UCM)的方法来识别关键蛋白质。首先,整合蛋白质拓扑数据和生物数据构建多元属性网络,以降低PPI网络中噪声的影响;其次,根据关键蛋白质的拓扑特性和生物特性,提出一种挖掘稠密且高度共表达的关键模块算法,从多元属性网络中挖掘高可靠性的关键模块,以从多维角度强化关键蛋白质在模块中的重要程度;最后,整合蛋白质的中心性和模块化特性,设计一种衡量蛋白质关键性的策略(essential integration strategy,EIS),以提高识别高关键蛋白质的准确率。UCM方法应用在DIP数据集上进行验证,实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。  相似文献   

10.
蛋白质相互作用网络比对在识别同源蛋白质或者蛋白质功能模块、蛋白质功能预测等方面具有十分重要的生物学意义.通常从拓扑特性和生物特性两个方面来衡量网络比对的结果,而现有的网络比对算法很难同时取得好的拓扑特性和生物特性.基于此,本文提出一种新的网络比对算法NABG.NABG利用最小度启发式算法计算节点在网络中的重要性,并基于重要性得分计算节点对的拓扑相似性,引入节点对的序列相似信息,使拓扑和生物相似性高的蛋白质对被比对上;基于结合了节点相似性和边保守性的目标函数,使用遗传算法模拟生物进化过程来优化比对结果.NABG分别在合成网络和真实网络上进行了实验,并与MGANA++、PROPER、SPINAL等算法作比较分析.实验结果表明,NABG的比对结果在拓扑指标以及生物指标上能保持均衡的高指标且更具有生物学意义.  相似文献   

11.
关键蛋白质是生物体内一切生命活动中不可缺少的物质基础,关键蛋白质的识别不仅可以从理论上理解生命活动机理,同时在实际应用中为药物研制、疾病治疗提供重要基础。目前,现有的关键蛋白质识别算法大多应用在静态PPI网络上,忽略了蛋白质的动态性和保守性,只考虑网络拓扑结构,忽略了蛋白质的生物特性,并且未能完全解决PPI网络中假阳性和假阴性问题。针对以上问题,构建一种混合动态保守蛋白质的时序加权PPI网络,并提出一种名为JTBC(Joint Topological properties,Biological properties and Complexes information)的关键蛋白质识别算法。利用基因表达数据提取动态蛋白质和保守蛋白质的活性信息,以动态调整静态PPI网络进而构建时序PPI网络,有效降低了PPI网络中的假阴性;设计一种融合双重拓扑特性的点边凝聚度DEcc(node and edge cohesion coefficient),以衡量蛋白质在PPI网络中的拓扑特性,再结合带有生物特性的蛋白质结构域信息和皮尔逊相关系数为时序PPI网络加权,以准确描述蛋白质之间的相互作用,减少了假阳性的影响;根据关键蛋白质的聚集特性和共表达特性,设计一种共表达复合物中心性方法局部评估蛋白质的重要程度。综上考虑,整合权重信息和蛋白质复合物信息来综合衡量蛋白质的关键性。实验结果表明该算法能够从全局和局部特性较准确地识别关键蛋白质。  相似文献   

12.
与静态PPI网络相比,动态PPI网络更能体现蛋白质之间相互作用的真实情况,并有效降低PPI网络中的假阴性。现有的关键蛋白质预测方法主要应用在静态PPI网络,忽视了PPI网络的动态特性。为有效预测关键蛋白质,利用基因表达数据提取蛋白质的动态信息,再结合静态PPI网络构建动态PPI网络,然后引入GO术语对网络加权,并基于动态加权PPI网络提出一种新的预测方法-DWE。该方法以蛋白质在动态网络中的动态加权边之和与蛋白质在动态网络中出现的次数的比值衡量蛋白质在网络中的关键性。实验结果表明动态加权PPI网络有助于提高关键蛋白质的预测精度,且DWE方法优于其他几种关键蛋白质预测方法。  相似文献   

13.
在蛋白质相互作用(Protein-Protein Interaction,PPI)网络中检测蛋白质功能模块有助于预测未知蛋白质的功能模块。随着蛋白质相互作用有效数据迅速增长,如何通过PPI网络获得有效的蛋白质功能模块成为最大挑战。阐述PPI网络的发展及现状,通过对当前蛋白质功能模块检测算法进行归纳总结,把它们分为单元聚类和多元聚类,并对每类的代表性方法进行详细阐述;讨论蛋白质相互作用网络功能模块检测研究所面临的挑战及未来研究方向。  相似文献   

14.
当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关注。通过实验检测方法来发现这些信息是非常耗时耗力的,所以链接预测成为一种新的挖掘这些信息的指导方法。基于蛋白质交互网络并融合了基因表达数据信息,从拓扑和基因表达两个方面的信息来构建PPI权值网络,提出了一种在权值网络中基于相似度比较的链接预测的新方法来预测PPI网络中未知的交互信息。使用MIPS数据库评估了实验结果,表明了该算法有很好的准确率和良好的性能。  相似文献   

15.
洪海燕  刘维 《计算机科学》2016,43(Z11):16-20, 25
关键蛋白质对于细胞生活是不可缺少的,识别关键蛋白质可以帮助了解细胞生活的最小需求,同时对药物设计也有非常大的作用。随着高通量技术的发展,人们可得到越来越多的蛋白质-蛋白质相互作用(PPI)的数据,这就使得可以在网络层次上来研究关键蛋白质。目前,学术界已经提出了一系列的计算方法来识别关键蛋白质,但这些方法并没有完全解决蛋白质相互作用数据的假阳性问题。除此之外,现有方法一般只考虑了网络的拓扑结构,对于生物信息的考虑,目前还是比较欠缺的。蛋白质对于人类细胞的生命活动不仅仅与网络拓扑结构有关,还和蛋白质在网络上的生物信息相关。因此,针对以上问题,提出了一种高效的预测关键蛋白质的新方法EPP(Essential Proteins Predict),该方法通过计算蛋白质在PPI网络中的重要性来进行预测,蛋白质的重要性越高,成为关键蛋白质的可能性就越大。取重要性排名前P%的蛋白质作为关键蛋白质,在进行蛋白质重要性的计算时,综合考虑语义相似度及可信度因素,以综合考虑网络的拓扑结构与蛋白质本身的生物信息。实验结果表明,与其他传统方法相比,提出的新方法复杂度较低,且能够识别出更多的关键蛋白质,并且其统计指标也高于其他的方法。  相似文献   

16.
朱海湾 《计算机应用研究》2020,37(2):390-397,420
针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号