首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 17 毫秒
1.
首先采用伪氨基酸组成(PseAA) 和特定位点记分矩阵(PSSM)2 种方法组合的特征提取方法来表达蛋白质序列。通过该方法将蛋白质序列转化成特征向量, 虽然该向量在很大程度上保留了蛋白质序列的原始信息, 但是它产生的相应的维数会很高, 这使得蛋白质亚细胞位置的预测过程变得很复杂。同时, 就目前的情况来看, 想要获取大量已标记的蛋白质亚细胞位置样本也很困难。为了解决这些问题, 提出采用半监督降维算法(SS-MVP) 对特征向量进行降维的同时能从标记和未标记的样本点中提取对分类有用的信息。基于降维后的样本利用支持向量机(SVM)的算法来预测蛋白质亚细胞位置类型。实验结果表明, 采用上述方法既能简化蛋白质亚细胞位置的预测系统, 又能提高其分类性能。  相似文献   

2.
确定蛋白质与RNA是否发生作用非常重要,因为它广泛存在于生物学过程中,在生物体细胞活动中起到至关重要的作用。特别是近几年随着蛋白质结构数据的增多,如果仍用传统的物理化学方法去测定会非常困难,找到能自动预测蛋白质与RNA的相互作用的方法迫在眉睫。首先采用Pse PSSM算法表达蛋白质序列,编码后的蛋白质特征向量维数很高;接着采用GPP流形学习方法对其进行维数约简,约简后的特征向量输入SVM分类器训练,训练好的分类器预测未知的蛋白质与RNA是否相互作用;最后,采用Jackknife测试方法检验预测准确率,测试结果表明,上述方法是十分有效的,为蛋白质与RNA是否相互作用的研究提供一条新的思路。  相似文献   

3.
目的 为提取有效的鉴别特征和降低鉴别向量的维数来识别人脸表情图像.方法 将流行学习(Manifold leaming,ML)和半监督学习(Semi-Supervised leaming,SSL)结合起来,利用人脸表情图像数据本身的非线性流形结构信息和部分标签信息来调整点与点之间的距离形成距离矩阵,而后基于被调整的距离矩阵进行线性近邻重建来实现维数约简,提取低维鉴别特征用于人脸表情识别.结果 该方法 能充分利用数据的结构信息和有限的标签信息,使具有标签信息的同类样本之间的距离最小化,不同类数据之间的距离最大化,进而可以有效地提取数据的低维鉴别子流形,使得分类性能要优于非监督的雏数约简方法 .结论 笔者提出的半监督局部线性嵌入算法能有效地提高人脸表情识别的性能.  相似文献   

4.
确定细菌性病原体内某种未知蛋白质是否属于病毒蛋白非常重要。如果是病毒蛋白,研究其在病原体内的致病机制能有助于设计出抗病毒药物。特别是,近几年发现大量的病毒蛋白质序列,如果仍用传统的物理化学方法去测定非常困难,找到能自动预测细菌性病毒蛋白的方法迫在眉睫。首先采用基因本体论(Gene Ontology,GO)和特定位点记分矩阵(Position-Specific Score Matrix,PSSM)的组合特征表达方法编码蛋白质序列,接着采用流形学习方法对编码后的高维蛋白质特征向量进行维数约简。然后把约简后的特征向量,输入K近邻(K Nearest Neighbor,KNN)分类器进行训练,利用训练好的分类器预测未知蛋白是否为病毒蛋白。最后,采用Jackknife测试方法检验预测准确率,测试结果表明上述方法是十分有效的,能解决细菌性病原体中病毒蛋白预测这个复杂的问题。  相似文献   

5.
针对蛋白质关联图预测问题,提出一种克隆选择算法与蛋白质折叠规律相结合的预测方法,综合使用蛋白质序列疏水性质、残基的二级结构倾向、关联图总点数等信息,构造了基于限制规则的克隆选择算法适应度函数,设计了符合关联图生物学特性的变异操作。算法不需要使用额外蛋白质作为训练集,不需要从现有蛋白质数据库中提取模板,因此不受现有蛋白质结构数据的局限,可以由序列信息直接进行预测。对200个非同源蛋白质的测试验证了算法的有效性。  相似文献   

6.
为解决实验方法中结果存在较高假阳性率和假阴性率的问题,整合蛋白质特征数据,提出一种基于深度神经网络的蛋白质相互作用预测框架。提取蛋白质的GO语义相似性、序列相似性、蛋白质重要性以及亚细胞定位信息,得到低维度的输入数据。然后建立深度神经网络,进行预测。通过使用弃权技术,减少网络中复杂的互适应神经元,总体性能得到提高。预测框架在酿酒酵母蛋白质数据集上的准确率达到95.67%,精确度达到96.38%。实验结果表明:提取的特征数据较适合用于蛋白质互作的预测研究,且构建的基于深度神经网络的蛋白质相互作用预测框架具有出色的泛化性能,在多种数据上都能取得较好效果。  相似文献   

7.
为解决文本分类中存在的维数灾难、数据集噪声等问题,本研究提出一种利用非线性维数约简算法结合k-最邻近结点算法(k-nearest neighbor algorithm, k-NN)的文本分类算法。该算法首先对数据集进行去噪处理,再采用非线性流形学习中的局部线性嵌入算法恢复高维数据中的中低维流形结构,以实现数据约简,利用经过上述处理的文本数据学习k-NN分类器。实验结果表明,该算法能够有效提高文本分类精度。  相似文献   

8.
提出了一种基于序列和PPI特征的距离公式,可综合序列氨基酸组成和PPI对象、强弱等信息对两个蛋白质的相似性进行表征,并在此基础上提出了一种用于蛋白质亚细胞定位预测的K近邻算法。利用留一法对性能进行了评估,结果显示,在序列基础上加入PPI特征,可明显有助于亚细胞定位的预测;同时基于上述距离的K近邻算法也优于使用相同特征的SVM算法,表明该算法可以对蛋白质的亚细胞定位信息进行准确有效的预测。  相似文献   

9.
利用相空间重构技术,并借助G-P算法、C-C方法和Wolf方法从宁陵地区地下水位一维时间序列中提取 Lyapunov指数,结果表明此时间序列具有混沌特征。计算了宁陵地区地下水位时间序列的关联维数、时间延迟 和最大Lyapunov指数,将局域加权一阶多步预测模型应用于地下水位预测。预测表明,此模型可有效应用于地 下水位时间序列的多步预测。  相似文献   

10.
k-mer频率是进行宏基因组分类时的一种重要的数字特征,然而该特征的维数随参数k的增加呈指数增长,利用该特征进行宏基因组分类易陷入"维数灾难"。为解决此问题,本文提出了一种基于优化k-mer频率的宏基因组DNA序列聚类方法。首先,提取DNA序列的kmer频率特征;其次,使用非负矩阵分解算法对DNA序列的k-mer频率特征进行优化;最后,利用模糊C均值算法进行聚类。将本文方法在包含有不同物种个数的模拟宏基因组数据上运行的结果表明,其能有效地克服现有宏基因组数据分类方法计算量大的缺点,且分类性能优于同类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号