首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
人体肠道吸收性(human intestinal absorption,HIA)是衡量药物口服生物利用度的重要标志之一。利用人工智能方法在药物发现早期对药物的HIA进行预测评估,能够加速药物发现过程并且降低成本。本研究分别使用分子模拟软件MOE(molecular operating environment)的2D、3D描述符和ECFP4(extended connectivity fingerprints)对分子进行表征,针对2 061条HIA数据建立支持向量机(SVM)、随机森林(RF)、深度神经网络(DNN)等8种模型。结果表明,基于2D、3D描述符和ECFP4指纹的组合描述符构建的SVM模型在各项评价指标上进行综合评价后是最优的,最优模型的受试者工作特征曲线下面积(AUC)、马修斯系数和Kappa系数分别为0.94,0.75及0.74。综上,本研究建立一个鲁棒性高、泛化能力强的预测HIA性质的机器学习模型,该模型可以用于为药物药代动力学性质研究提供指导及早期的分子筛选。  相似文献   

2.
目的 对肺癌亚型肺鳞状细胞癌(肺鳞癌)和肺腺癌进行预测并找出分子标记。方法 通过研究两种不同癌症亚型中mRNA表达量,选取有差异有统计学意义的mRNA,利用极限梯度增强(extreme gradient boosting,XGBoost)算法构建模型,预测亚型分类,并比较其与逻辑回归分类模型和支持向量机分类模型的预测性能。结果 基于XBGoost模型的预测准确率为96.55%,曲线下面积为99.04%,优于逻辑回归分类模型和支持向量机分类模型。同时,找到11个基因作为两种亚型的分子标记。结论 肺癌两种亚型的在分子层面存在明显差异特征,将辅助临床医生进行疾病亚型预测。  相似文献   

3.
针对最小二乘支持向量机最佳算法参数难以确定的缺陷,提出了基于文化差分进化算法的最小二乘支持向量机(Cultural Differential evolution Algorithm Least Square Support Vector Machine,CDE-LSSVM)。该算法通过新型的文化差分进化算法优化确定最小二乘支持向量机核宽度参数和惩罚系数,建立具有良好预测性能的模型。同时,针对药物定量构效关系(Quantitative Structure-Activity Relationships,QSAR)模型具有高度非线性、变量之间存在相关性的特征,采用CDE-LSSVM建立HIV-1蛋白酶抑制剂的药物定量构效关系模型。模型具有很好的拟合精度与预测精度,且优于最小二乘支持向量机、BP神经网络和径向基神经网络。  相似文献   

4.
目的运用多层感知人工神经网络算法对吸血蠓属和非吸血蠓属进行分类预测,为蠓建立简单、有效的分类方法。方法对捕获的123只蠓经专家鉴定后分为78只吸血蠓和45只非吸血蠓,测量蠓的几何形态学翼长和触角长度,将采集到的数据导入Weka软件包,采用多层感知人工神经网络算法以不同的k折交叉验证建立分类预测模型。结果获得了高准确率的多层感知人工神经网络分类预测模型,在5折交叉验证建立的模型预测力最强,准确率0.959 3,灵敏度0.974 1,特异度0.934 8。结论蠓的几何形态学数据与人工智能算法相结合可以建立准确的吸血蠓属和非吸血蠓属分类预测模型。  相似文献   

5.
目的文本旨在使用深度学习方法对精神分裂症建立自动分类模型,为临床上精神分裂症患者的鉴别诊断提供参考。方法通过提取受试听觉稳态诱发电位的能量、相位、信噪比和微分熵作为模型输入特征,使用准确率、灵敏度、特异度和受试工作者特性曲线对深度信念网络和支持向量机构建的模型进行分析和比较。结果深度信念网络模型的准确率、灵敏度、特异度、曲线下面积分别为85.6%、88.33%、75.50%和0.88。深度信念网络模型诊断能力明显高于基于线性核、径向基函数核、sigmoid核的三种支持向量机模型。结论基于深度信念网络算法的诊断模型可以有效协助临床医生对于精神分裂症患者的诊断,达到早期发现疾病的效果。  相似文献   

6.
目的:比较支持向量机(support vector machine,SVM)和传统的Logistic回归构建的急性百草枯(paraquat,PQ)中毒早期预后判别模型的预测性能。方法:收集急性PQ中毒患者152例,随访观察2个月的临床转归情况。应用随机数字表法以3∶2的比例分为两组,一组作为训练样本用于筛选变量和建立预测模型,计91例;另一组作为验证样本,用于评价模型预测效果,计61例。建模方法采用SVM和常规统计方法中的Logistic回归。结果:通过对PQ中毒患者的预测判别验证,线性核、多项式核、Sigmoid核及径向基函数核SVM模型的预测准确率分别为77.92%、74.03%、75.32%、79.22%。对所有预测模型性能对比显示,SVM模型预测性能高于Logistic回归模型,其中径向基核函数(RBF)?SVM模型效果最好,灵敏度为87.5%,特异度为70.6%。结论:采用SVM模型能更好地整合各种影响PQ中毒患者早期预后的信息,所建立的模型具有更好的预测能力,为预测PQ中毒患者的预后提供了一种新方法。  相似文献   

7.
预测药物在血浆中的蛋白结合率,有助于了解药物的药代动力学特征,对药物发现的早期研究有重要的参考价值。本研究收集了2 452个临床药物的血浆蛋白结合率信息,用Molecular Operating Environment(MOE)和Mordred两种软件计算分子描述符,将算得的分子描述符作为模型的输入特征。使用极端梯度提升(extreme gradient boosting, XGBoost)算法和随机森林(random forest,RF)算法构建机器学习模型。结果表明,与MOE相比,将Mordred计算的分子描述符作为模型的输入,构建的模型预测性能更优。使用XGBoost算法和RF算法构建模型的预测性能结果相近,最优模型的R2均为0.715。此外,根据研究结果得出药物血浆蛋白结合率与药物分子的一些理化性质参数,如水溶性,辛醇/水分配系数以及共轭双键密切相关。通过这些参数预测药物血浆蛋白结合率具有方便快捷的优点,可以为相关药代动力学研究提供参考依据。  相似文献   

8.
目的探讨联合临床病理特征和人工智能(AI)算法构建的胃癌生存预测模型的效能及临床意义。方法选取2016年6月至2018年5月丽水市人民医院就诊的200例胃癌患者的病理信息,筛选与生存结局高度相关的指标。采用10倍交叉验证法将200例患者以2∶8的比例分为建模队列40例和验证队列160例。与生存结局高度相关的指标采用随机梯度提升(gbm)、广义线性模型(glmnet)、逻辑回归模型(plr)、径向基函数核支持向量机(svmRadial)、贝叶斯模型(naive_bayes)和随机森林模型(ranger)6种AI算法在建模队列中构建胃癌生存预测模型,并在验证队列中验证模型的预测效能。结果200例患者中存活组109例,死亡组91例。肿瘤最大径、淋巴结转移、肿瘤位置、神经浸润和TNM分期在存活组和死亡组的分布差异均有统计学意义(均P<0.05),且与生存结局均相关(均P<0.05)。ROC曲线显示单项指标预测患者生存的AUC均>0.500。综合比较6种算法的多维度考量指标发现,基于svmRadial算法下的5项病理特征组合生存预测模型综合效能最佳,AUC为0.817,灵敏度为0.762,特异度为0.833,准确度为0.795。在验证队列中svmRadial算法下的5项病理特征组合生存预测模型AUC为0.624。结论AI技术能够有效提升5项病理特征联合检测的预测效能,从多维度综合分析患者情况,具有优异的辅助潜能,可为改善胃癌患者的预后管理提供研究思路和理论基础。  相似文献   

9.
目的构建新型抗纤维化中药化合物虚拟筛选预测模型,并对模型的预测性能进行验证。方法通过对比使用随机森林与梯度提升决策树算法,实现化合物分子指纹的降维与特征优化。构建"特征优化—机器学习"的混合模型,将优化的特征作为输入分别送入逻辑回归、人工神经网络机器学习算法进行训练。使用准确率、召回率、F1值对不同组合的模型进行性能评价。根据模型性能结果确定抗纤维化中药化合物虚拟筛选预测模型。随后,对比此模型和分子对接模型对中药化合物的抗纤维化活性预测结果,进一步验证该模型的预测性能。结果随机森林模型准确率0.76,召回率0.75,F1值0.74,曲线下面积(AUC)值0.818;梯度提升决策树模型准确率0.76,召回率0.74,F1值0.72,AUC值0.829;人工神经网络模型准确率0.75,召回率0.75,F1值0.75,AUC值0.802;随机森林+逻辑回归模型准确率0.77,召回率0.76,F1值0.75,AUC值0.840;随机森林+人工神经网络模型准确率0.74,召回率0.84,F1值0.79,AUC值0.850;梯度提升决策树+逻辑回归模型准确率0.80,召回率0.80,F1值0.79,AUC值0.872;梯度提升决策树+人工神经网络模型准确率0.73,召回率0.91,F1值0.81,AUC值0.837。中药化合物姜黄素、甘草酸、羟基红花黄色素A、大黄素、绞股蓝皀苷分子对接活性结果与本模型预测结果一致。结论梯度提升决策树+逻辑回归模型表现较其他模型准确。通过对比该模型与分子对接模型,进一步确认了该模型在中药化合物预测方面的稳定性;且本模型具有高通量筛选的特性,可以弥补分子对接在筛选化合物效率方面的不足,可作为抗纤维化中药化合物虚拟筛选预测的新方法。  相似文献   

10.
背景颈动脉粥样硬化(CAS)不仅影响钢铁工人的工作效率,而且是引发缺血性脑血管疾病最重要的危险因素。近年来,越来越多的学者利用机器学习并通过易获得的因素对疾病进行风险预测,但目前,关于CAS风险预测模型的研究依然缺乏。目的运用支持向量机(SVM)、BP神经网络(BPNN)与随机森林(RF)模型构建钢铁工人CAS发生风险预测模型,并比较其预测效能。方法选取2017年3—6月在唐山市弘慈医院进行体检和健康监测的4 568例钢铁工人为研究对象,按照本团队编写的《健康评估检查表》进行调查,调查内容:人口学特征(性别、年龄、体质指数、文化程度、婚姻状况)、个人的行为生活习惯与方式(吸烟、饮酒)、个人病史(高血压、糖尿病、CAS家族史)、职业史(倒班、高温作业、噪声作业)。收集研究对象的实验室检查指标,如胆固醇、三酰甘油、同型半胱氨酸、尿酸。结合非条件多因素Logistic回归分析结果以及查阅相关文献,确定变量构建SVM、BPNN和RF模型并进行比较。结果训练集显示SVM、BPNN和RF模型预测钢铁工人发生CAS的准确率分别为83.81%、79.27%、86.60%,灵敏度分别为80.10%、66.19%、73.62%,特异度分别为87.32%、91.62%、98.90%,受试者工作特征曲线下面积(AUC)分别为0.84、0.79、0.86。SVM模型的灵敏度最高,RF模型在准确率、特异度和AUC方面高于其余两种模型,差异有统计学意义(P<0.05)。测试集显示SVM、BPNN和RF模型预测钢铁工人发生CAS的准确率分别为85.70%、75.46%、73.37%,灵敏度分别为81.63%、64.65%、60.00%,特异度分别为90.29%、87.66%、88.45%,AUC分别为0.86、0.76、0.74。SVM模型在灵敏度、准确率和AUC方面高于其余两种模型比较,差异有统计学意义(P<0.05)。结论运用SVM模型预测钢铁工人CAS发生风险的效果优于BPNN和RF模型。  相似文献   

11.
吴海峰  何坪  邓宇  潘伦  周天寒  何丽芳  方明金 《重庆医学》2012,41(15):1524-1526
目的为重庆市中医类专业卫生技术人员需求预测提供方法学参考。方法采用多元线性回归、主成分回归、人工神经网络方法建立预测模型,对该市中医药专业技术人才需求进行预测。结果模型Ⅲ对重庆市中医药类专业卫生技术人员需求的预测效果比模型Ⅰ、Ⅱ好。结论选择人工神经网络模型Ⅲ为最优模型预测重庆市各年中医药类专业技术人员具有较好的预测效果。  相似文献   

12.
目的建立AA人工神经网络蛋白分子诊断模型,寻找AA血清学诊断的新方法。方法采用表面增强激光解析离子化飞行时间质谱(SELDI-TOF-MS)技术及配套软件、芯片筛选AA差异表达蛋白,通过ANN建立并验证诊断模型。结果由5个差异表达蛋白组成的AA人工神经网络诊断模型对AA的诊断灵敏度为95.0%、特异度90.0%、阳性预测值为90.5%、阴性预测值94.7%、诊断准确度为92.5%。结论 SELDI-TOF-MS技术对AA的血清学诊断具有一定的价值,值得进一步的研究。  相似文献   

13.
应用机器学习方法构建早产儿和低出生体重儿的预测模型,包括逻辑回归、支持向量机和随机森林算法,运用交叉验证法得到不同算法的最优模型,综合准确率、F1值和AUC值评估3种模型的预测性能,结果表明基于随机森林算法的模型预测效果最好。  相似文献   

14.
目的基于计算机辅助技术预测芝麻寡肽的体内转运性质。方法收集芝麻中主要蛋白序列,以计算机辅助技术进行蛋白模拟消化水解,将水解获得的寡肽构建虚拟结构数据库。构建寡肽转运蛋白2(Pep T2)底物的支持向量机(SVM)模型后,通过数据处理和参数寻优方法挑选最优模型,预测芝麻Pep T2的底物成分。结果芝麻寡肽数据库共包括346条寡肽,利用筛选获得45个描述符,创建了Pep T2底物的SVM模型,模型的准确度、灵敏度和特异性均在85%以上。经受试者工作特征(ROC)分析,其曲线下面积(AUC)0.9。利用Pep T2底物模型预测芝麻寡肽数据库,发现36%的芝麻寡肽具有通过Pep T2转运的潜在活性。结论利用计算机辅助水解技术构建了中药芝麻寡肽数据库,以Pep T2底物SVM模型预测芝麻寡肽的体内转运性质,模型准确、稳定、灵敏、特异性高,为开展寡肽类中药成分的性质研究提供了新的方法。  相似文献   

15.
目的:利用机器学习算法建立前列腺癌诊断预测模型,为前列腺癌患者的穿刺术前诊断提供参考。方法:收集2017年1月-2018年12月中国医科大学附属盛京医院泌尿外科接受前列腺穿刺的255例患者的临床信息作为变量,采用Logistic多因素分析、信息增益率两种方法筛选研究变量,应用十折交叉验证划分训练集和测试集,采用多种机器学习算法(RF,SVM,Logistic,Naive Bayes)建立前列腺癌诊断模型,收集2019年1-6月的75例患者作为验证集,进一步评估模型性能和临床应用的可能性。结果:应用信息增益率筛选变量所建立的模型性能优于Logistic多因素回归分析。在4种机器学习算法中,Naive Bayes算法AUC最高,在试验集和验证集上分别为0.826和0.797。RF算法的Precision最高,在试验集和验证集上分别达到0.839和0.791。结论:基于前列腺穿刺患者的多种临床信息,通过机器学习方法建立诊断预测模型具有较高的准确率,能够为前列腺癌的诊断提供一定参考。  相似文献   

16.
基于信息熵的决策树在慢性胃炎中医辨证中的应用   总被引:9,自引:1,他引:8  
目的:探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用.方法:采用bootstrap方法对406例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策树C4.5算法建立中医辨证模型.结果:决策树C4.5算法筛选出对中医辨证分型有意义的26个因素并对其重要性进行排序;产生清楚易懂可用于分类的决策规则;建立辨证模型,模型分类符合率为:训练集83.60%,验证集80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高.结论:决策树C4.5算法建立的模型效果较好,可应用于慢性胃炎中医证型的鉴别诊断.  相似文献   

17.
目的 为了寻找新一代紫杉醇类抗癌药物,研究紫杉醇类似物分子结构和抗癌活性(PIDact)之间的定量构效关系。方法 基于电性状态拓扑指数和电性距离矢量,应用最佳子集回归的方法建立了PIDact值和紫杉醇类似物分子结构的定量结构–活性相关(QSAR)模型,并对模型进行了交互检验和外部检验,用43个紫杉醇类似物训练集样本构建的QSAR模型预测了外部10个检验集的PIDact值。结果 所建立模型具有较高的估计相关系数及LOO(leave-one-out)检验相关系数。结论 模型具有良好估计能力与稳定性,训练集模型具有良好预测能力。  相似文献   

18.
目的为了评估前列腺癌放疗中直肠并发症的预后,提出一种新型的基于多模态特征及多分类器融合的预测模型。方法 本研究回顾性收集了44例接受外照射放疗的前列腺癌患者的临床数据,从中提取临床参数特征和剂量学特征两种不同模态特 征,并利用筛选后的特征子集分别对五种基分类器(向量机、决策树、K近邻、随机森林和XGBoost)进行训练得到不同模态下的 多个基分类器,然后采用一种新型的基于多准则决策的权重分配算法依次对同一模态下多个基分类器以及不同模态信息的模 型进行融合,最终实现基于多模态特征及多分类器融合的预测模型。本研究采用五折交叉验证方法和ROC曲线下所围面积 (AUC)、准确率、灵敏度和特异性四种评价指标来定量评价所提出的预测模型。此外,本研究还将所提出模型与不同特征选择 方法、不同的权重分配算法、基于单模态单分类器的模型,以及两种使用其他融合方法的集成模型进行定量比较。结果五折交 叉验证结果显示本研究所提出的模型的平均准确率、AUC、特异性、灵敏度分别为:0.78、0.83、0.79、0.76。结论与基于单模态单 分类器的模型以及其他融合模型相比,本文所提出的基于多模态特征及多分类器融合的模型能更准确地预测前列腺癌放疗中 的直肠并发症。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号