首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
烃类物质闪点定量构效的关系   总被引:1,自引:0,他引:1  
应用CODESSA软件计算300种烃类物质的分子结构描述符,用启发式回归(HM)、最佳多元线性回归(B-MLR)法,以筛选出来的分子描述符建立线性回归模型.用B-MLR法所选4个描述符作为支持向量机(SVM)的输入,建立非线性模型.预测结果表明:所建模型稳健,泛化能力强,预测误差小.非线性模型(R2=0.9884,RMSE=8.7570)的性能优于线性回归模型(HM:R2=0.9815,RMSE=11.0653;B-MLR:R2=0.9814,RMSE=11.1041),预测的效果令人满意.  相似文献   

2.
【目的】为了管理化学物质的使用,需要用已知化合物的毒性来预测未知化合物的毒性。【方法】采用定量构效关系(QSAR)方法预测一系列环境化合物对大型蚤类的毒害(50%Lethal Concentration,LC_(50)),确定影响毒性关键分子结构的特征比较几种模拟方法的优劣。将323个有机物分子作为数据集,随机选取其中81个分子作为测试集,其余为训练集,每个分子计算了196个参数。【结果】分别采用逐步多元线性回归分析法(R_(tr)~2=0.661,R_(te)~2=0.612)、主成分回归法(R_(tr)~2=0.590,R_(te)~2=0.577)和偏最小二乘法(R_(tr)~2=0.788,R_(te)~2=0.607)构建QSAR模型。这3种模型都表明分子量参数(M_W)对化合物的毒性影响较大。【结论】借助优质的QSAR模型方法预测和比较该类化合物的毒性情况,对水环境监测具有重要意义。  相似文献   

3.
通过构建分子顶点原子之间的关系对35个醛酮类化合物进行了结构表征,采用多元线性回归和逐步回归的方法建立了该类化合物结构与色谱保留指数之间的关系模型,模型的复相关系数(R)为0.978,标准偏差(SD)为37.305。采用"留一法"交互检验和外部样本预测的方法对模型的稳定性和预测能力进行了评价,交互检验的复相关系数(R_(cv))为0.970,标准偏差(SD_(cv))为43.477;外部预测的复相关系数(R_(test))为0.996,标准偏差(SD_(test)为17.004。结果表明所采用的分子结构描述符能够恰当表现该类化合物结构特征,所建模型具有良好的稳定性和预测能力。  相似文献   

4.
本文建立了2个180个含苯基的羧酸类化合物酸碱解离常数(pKa)的定量预测模型。这些化合物分子量在122.12到288.34的范围内,包含H,C,N,O,S,F,Cl,Br及I等元素.使用Cerius~2程序计算236个分子描述符来表述这些化合物,并使用统计学方法从中选择了12个描述符.分别使用多元线性回归分析(MLR)及支持向量机回归(SVM)结合10重交互检验方法来预测pKa数值.多元线性回归模型对pKa的预测结果相关系数为0.90,标准偏差为0.32;支持向量机模型结果较好,相关系数为0.91,标准偏差为0.31.  相似文献   

5.
通过分子顶点类型及连接方式,构建了分子顶点特征值用于表征122个烷基苯类化合物的结构,采用多元线性回归(MLR)和偏最小二乘回归(PLS)2种方法构建了烷基苯类化合物结构与保留关系(QSRR)模型。建立的MLR模型及PLS模型的复相关系数(R)分别为0.988和0.987。两模型的估计能力和预测能力经过内部和外部双重检验,对于内部交互校验(CV)的相关系数(R_(cv))均为0.986;对于外部预测的相关系数(R_(test))分别为0.990和0.991。结果表明该构建的顶点特征值有较强的分子结构表达能力,模型具有良好的预测能力与稳定性。这对于有机化合物的定量结构保留关系研究具有一定的参考价值。  相似文献   

6.
对125个磺胺类碳酸酐酶Ⅱ抑制剂的生物活性进行了预测研究。利用ADRIANA.Code软件计算得到了化合物的一系列2D和3D结构描述符,从中选用了12个描述符进行建模。分别用数学随机划分的方法和Kohonen自组织神经网络的方法把数据集划分成两组不同的训练集和测试集。对于这两组不同的训练集和测试集,分别利用多元线性回归(MLR)和支持向量机(SVM)的方法进行建模,共得到4个模型。其中SVM得到的2个模型,训练集的相关系数在0.92以上,测试集预测的相关系数都在0.90以上。所有模型可进一步用于碳酸酐酶Ⅱ抑制剂的虚拟筛选。  相似文献   

7.
30种多氯有机物的沉积物吸附系数定量结构性质关系研究   总被引:1,自引:0,他引:1  
研究了30种含氯有机物沉积物吸附系数(Koc)的定量结构性质关系(QSPR)模型。模型的自变量由遗传算法从多个结构描述符中选择得到,校正模型则采用多元线性回归方法建立。应用留一交叉验证及外部测试集验证对所建立的模型进行了检验。留一交叉验证中模型的预测均方相对误差为8.13,外部测试集验证中模型的预测均方相对误差为8.88。这说明所建立模型对于未知样本有较好的预测能力,可用于预测含氯有机物的Koc值;遗传算法结合多元线性回归方法是一种合理可行的建立含氯有机物沉积物吸附系数QSPR模型的方法。  相似文献   

8.
采用单苯环氯取代指数作为氯代二苯并二口恶口英类化合物 (PCDDs)的分子结构描述符 ,通过正向逐步线性回归方法建立了PCDDs的logKow与分子结构描述符之间的定量关系模型。与文献报道的MOD模型相比 ,该模型不仅具有显著的相关性 (n =43,Radj=0 898,SE =0 195 ,在α =0 0 5时 ,F =2 0 45 5 ,p =0 0 0 0 0 ) ,而且对于分子结构具有更好的区分能力。利用建立的模型 ,对没有logKow文献值的其他 33种PCDDs化合物给出了预测值  相似文献   

9.
本文收集了环烷烃类、环烯烃类、酮类、胺类、醚类、酯类等有机物在固定相角鲨烷和SE-30上的气相色谱保留指数,并采用基于Monte Carlo采样的模型集群分析(Monte Carlo sampling model population analysis,MCS MPA)方法进行了定量结构-色谱保留指数相关关系建模方法的比较研究。对于两种固定相上的有机化合物,分别采用不同的分子描述符予以表征,分子描述符的选择基于统计学与遗传算法。采用的建模方法包括多元线性回归(multivariate linear regression,MLR)、支持向量机回归(support vector machine,SVM)、径向基函数人工神经网络方法(radial basis function artificial neural networks,RBF ANN),通过所建模型预测了独立外部测试样本的气相色谱保留指数。研究结果表明,对于本文所研究的数据,SVM回归方法的建模效果优于MLR与RBF ANN方法。  相似文献   

10.
选取两组有机化合物的熔点数据,采用ADMEWORKS Model Buider软件计算并选取描述符,以所选描述符为自变量,熔点为因变量。通过三种模式识别方法——K-最近邻法(K-Nearest Neighbor Method,KNN)、K-均值聚类法(K-Means Clustering Method,KMC)和投影寻踪方法(Projection Pursuit Method,PP)对样本进行分类,将分类后的样本分别以多元线性回归(Multiple Linear Regression,MLR)、偏最小二乘(Partial Least Squares,PLS)和人工神经网络(Artificial Neural Network,ANN)建立QSPR模型。结果表明,三种模式识别方法均可以提高模型的预测能力。模型的预测能力不仅与结构相似度有关,还与建模方法有关。非线性模型预测能力要优于线性模型。  相似文献   

11.
根据MOPAC2009软件包中PM6算法得到的分子描述符研究半透膜仪(SPMDs)采集大气中多氯联苯(PCBs)采样速度(R_(air))的定量构效关系(QSPR)模型,并分析影响R_(air)的关键因素。以半经验PM6算法得到的分子量子化学描述符作为预测变量,采用偏最小二乘算法(PLS)构建了R_(air)的QSPR模型。根据交叉验证,所得到的最佳模型中PLS成分解释的因变量的累积变异(Q~2_(cum))为0.683,这表明该模型具有良好的预测能力和稳健性。通过外部验证和将实验测得的R_(air)与预测得到的R_(air)进行比较,对所构建模型的稳定性和可靠性进行了验证,结果表明无论是训练组还是预测组,其预测值与实测值间均具有较好的线性关系,线性相关系数均大于0.8376。对PCBs采样速度R_(air)的主要影响因素为PCBs与SPMDs中甘油三油酸酯分子间的相互作用大小和为将PCBs溶解在甘油三油酸酯中形成洞穴所需能量要求。  相似文献   

12.
方勇  刘庆山 《系统仿真技术》2011,7(2):116-119,125
在支持向量机( SVM)预测问题中,为了减小错误参数选取对预测结果的影响,提出了1种基于双重预测模型的非线性时间序列预测算法.该算法在充分考虑支持向量机参数对推广能力影响的基础上,分别利用自回归预测模型(AR)、自回归滑动平均模型( ARMA)、线性回归和决策树模型对SVM参数进行预测,将预测参数运用到SVM预测模型中...  相似文献   

13.
根据带钢张力时间序列非平稳、非线性特征,提出一种基于经验模态分解(EMD)和支持向量机(SVM)组合模型的预测方法;首先,应用EMD方法将原始张力序列分解成若干不同频率的平稳分量;其次,根据各分量特征,选用合适的核函数和最佳参数建立不同的SVM回归分析模型,对各分量测试集进行SVM预测;最后将各分量预测序列组合成原始序列的预测值;将EMD-SVM模型用于带钢张力预测,并与ARMA和SVM模型预测结果比较;EMD-SVM模型预测相关度可高达99.93%,而ARMA和SVM模型预测的相关度分别只有88.82%和79.31%,仿真结果表明EMD-SVM模型有较高的预测精度。  相似文献   

14.
以非氢原子及非氢原子间的关系为结构描述符,对部分聚合物结构单元进行了结构表征。采用多元线性回归和偏最小二乘回归的方法建立了该类聚合物结构与聚合物在玻璃化转变温度的热容变化(C_(p,change))之间的关系模型,两模型的复相关系数(R)分别为0.919和0.900。采用"留一法"交互检验对模型的稳健性和预测能力进行了评价,交互检验的复相关系数(Q~2)分别为0.658和0.693。结果表明结构描述符能够恰当表现该类聚合物结构特征,所建模型的稳健性和预测能力好,热容变化(C_(p,change))的模型预测值具有一定的参考价值。  相似文献   

15.
氯苯与氯酚类化合物毒性的预测   总被引:1,自引:1,他引:0  
基于定量结构-活性相关(QSAR)研究氯苯、氯酚类化合物的性质具有重要意义。采用分子电性距离矢量(MEDV)表征氯苯、氯酚类有机毒物的分子结构,运用多元线性回归建立定量结构毒性相关(QSTR)模型,同时采用逐步回归结合统计检测筛选模型变量,建立了22个氯苯、氯酚类有机污染物结构与对戈卑鱼(Guppy)半数致死浓度lg1/(LC_(50))回归方程。另外采用内部及外部双重验证的办法深入分析和检验模型的稳定性。建模的复相关系数(R_(cum))、留一法(LOO)交互校验复相关系数(R_(CV))和外部样本校验复相关系数(Q_(ext))分别为0.976 2、0.944 6和0.973 1。表明用MEDV表征氯苯、氯酚类有机物分子结构信息较好,所建QSTR模型的稳定性和预测能力良好。  相似文献   

16.
机电设备故障诊断和趋势预测的支持向量机方法   总被引:3,自引:0,他引:3  
分析了支持向量机(Support Vector Machine-SVM)的分类和回归算法。对近年来SVM在设备故障诊断和趋势预测方面的应用进行了回顾,给出了SVM用于设备状态趋势预测的模型和算法。采用AR(Auto Regressive)模型和SVM模型进行实验台的振动烈度的预测,表明SVM模型具有长区间预测精度高的特点。讨论了SVM在设备故障诊断和趋势预测研究的发展前景。  相似文献   

17.
采用原子电性距离矢量(Atomic electronegative distance vector,AEDV),描述了14个有机酸类化合物中不同等价碳原子的化学微环境,以多元线性回归(MLR)和偏最小二乘回归(PLS)方法建立~(13)C核磁共振定量结构波谱关系模型,两模型的复相关系数(R)均为0.984和0.962,标准误差(SD)分别为11.021和16.244。经"留一法"交互检验的复相关系数(R_(CV))分别为0.981和0.939,标准误差(SD_(CV))分别为12.061和17.121。研究结果表明,使用该方法所建模型可以用于预测有机酸类化合物~(13)C NMR化学位移,模型具有良好的稳定性和预测能力。  相似文献   

18.
计算出体系中烷基硫醇化合物的各种结构参数,以优选出的分子连接性指数和量化参数为结构描述符,首次采用反向传播算法(BP)人工神经网络、径向基函数网络(RBF)2种非线性方法建立了参数少且精度高的定量结构-色谱保留相关(QSRR)模型,预测了烷基硫醇在4种极性固定上的气相色谱保留指数(RJ)。结果表明:在4种固定相上建立的BP模型均优于RBF模型且非线性方法(BP、RBF)优于文献中多元线性回归(MLR)方法,所建定量结构保留关系(QSRR)模型具有良好的稳定性和预测能力。  相似文献   

19.
基于支持向量学习机预测药物透血脑屏障的活性   总被引:1,自引:1,他引:0  
为了预测药物透血脑屏障的活性,计算表征分子组成和拓扑等特征的87个分子描述符,经遗传算法筛选,参与建立基于支持向量学习机(SVM)的药物透血脑屏障活性分类模型.在模型训练中用网格搜索法确定核函数的两个重要参数C和γ,同时用5重交叉验证模型,结果证明模型预测能力较高,交叉验证的预测正确率达85.6%.  相似文献   

20.
通过非氢原子自身及非氢原子之间的关系对27个聚合物单体进行了结构表征,采用多元线性回归(MLR)和逐步回归(SMR)建立了聚合物结构与介电常数的关系(QSPR)模型,同时采用"留一法"对所得模型稳健性及预测能力进行了评价。模型复相关系数(R)为0.924,"留一法"交叉验证系数(Q2)为0.730。结果表明所采用的结构描述符可以恰当反映聚合物结构特征,构建的模型具有良好的稳健性和预测能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号