共查询到20条相似文献,搜索用时 31 毫秒
1.
基因表达数据判别分析的随机森林方法 总被引:2,自引:1,他引:2
目的探讨随机森林算法在基因表达数据分类研究中的应用。方法通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在存在大量无差异表达基因情况下对分类产生的影响。结果随机森林算法对基因表达数据的分类具有较高的准确性,但随着基因数量的增加其判别效果呈下降的趋势,在差异表达基因之间具有相关性时,下降趋势明显减慢,能够获得较理想的分类效果。结论随机森林算法对基因表达数据的分类研究有较好的判别效果。 相似文献
2.
3.
目的 综述常见新近决策树算法及其在卫生领域的应用进展,为后续相关研究提供参考。方法 以“数据挖掘”、“决策树算法”、“decision trees”等作为检索词,检索2010-2019年CNKI、万方、维普、PubMed等数据库,总结随机森林、C5.0、GBDT等方法的基本原理、步骤、适用条件及优缺点,列举其在卫生领域中的应用。结果 不同决策树算法各有其优势,在卫生领域多学科中有不同程度的应用。结论 新近决策树算法较原始算法有较大改进,但仍存在不足。推广新近算法,针对其缺陷进行改进,将是决策树算法未来研究的重要方向之一。 相似文献
4.
5.
几种图像分割技术在医学图像处理中的应用研究 总被引:1,自引:0,他引:1
叙述了基于特定理论的图像分割算法在医学图像处理中的应用,详细介绍了遗传算法、水平集分割法、模糊集分割法各自的基本理论以及优缺点,论述与讨论了医学图像分割效果评价方法,最后对各种算法的特点进行了总结。 相似文献
6.
目的 探讨合成少数类过采样技术(SMOTE)结合机器学习模型在老年人是否具备健康素养预测评估中的应用。方法 利用单因素筛选从资料中筛选出与是否具备健康素养有关联的变量;以筛选出的变量作为输入变量,以是否具备健康素养为结局变量,分别在经SMOTE算法处理前后的数据集中建立logistic回归模型、随机森林和SVM模型,通过受试者工作特征曲线(ROC)来评价模型性能。结果 Logistic回归、随机森林和SVM在SMOTE算法处理前的测试集中的准确率分别为0.833、0.600和0.636,3种模型的ROC曲线下面积(AUC)分别为0.723、0.815和0.728;在SMOTE算法处理后的测试集中的准确率分别为0.936、0.908和0.890,3种模型的AUC分别为0.896、0.944和0.897。结论 随机森林模型在老年人是否具备健康素养的预后评估中具有较高的应用价值。 相似文献
7.
DNA微阵列数据判别的旋转森林方法 总被引:1,自引:0,他引:1
目的探讨旋转森林算法在DNA微阵列数据分类中的应用。方法通过对四个经典基因表达数据的分析考察旋转森林的分类效果,并与其他分类器进行比较,进一步调整算法参数并研究其对分类效果产生的影响。结果旋转森林对基因表达数据有较高且稳定的分类准确性,除了线性变换方式和集成规模对分类性能影响较大,分类效果不随算法其他几个主要参数变化。结论旋转森林在基因表达谱数据分类中有较好的判别结果。 相似文献
8.
目的 分析老年肌肉衰减症的影响因素,为老年肌肉衰减症干预提供参考依据.方法 通过对泸州市某社区及医院439例老年人进行问卷调查,应用随机森林算法对影响因素进行重要性排序并降维,将降维后的变量纳入Logistic回归分析模型,分析影响因素的作用方向和相对危险度.结果 随机森林算法显示:变量数为7时袋外估算误差率最低,依次... 相似文献
9.
基因表达数据的随机森林逐步判别分析方法 总被引:3,自引:2,他引:3
目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结果三种疾病基因表达数据的判别模型,在包含很少量的基因情况下便获得了理想的分类效果;模拟试验则显示在类间区分度较大的情况下,随机森林逐步判别分析的效果明显,能有效地将有作用的变量保留在模型中,提高模型的判别效果;在类间区分度不够大的情况下分类效果提高不明显。结论随机森林逐步判别分析可以有效地应用于基因表达数据的基因筛选和分类研究,但要特别注意由随机波动对分析结果造成的影响。 相似文献
10.
目的 介绍自组织映射模型的基本原理、常见算法及其研究进展,阐述自组织映射模型在医学领域数据挖掘中的应用,以期为相关研究提供参考方法 本文从医学领域的数据挖掘角度出发,采用文献回顾的方法,阐述自组织映射模型在处理非线性、高度冗余数据时运算速度和精度上的优势,并分析自组织映射模型各种算法的特点及不足结果 相对于传统的数据挖掘方法在大规模的医学数据挖掘时无法消除数据冗余及捕捉非线性特征,从而导致挖掘过程速度慢、精度低等问题,自组织映射模型可以自动地、智能地、可视化地将待处理的数据转化为有用的知识,较好地弥补传统数据挖掘方法的不足.自组织映射模型算法的不断改进,保证了它可以适用于具有不同特征的数据结论 自组织映射模型在医学领域的数据挖掘中得到了较好的应用,其算法还有进一步改进的空间,在医学领域的应用前景将会得到进一步扩展. 相似文献
11.
目的 将随机森林算法用于类风湿性关节炎病例对照研究的高维甲基化数据的分析,并探讨应用效果。方法 实例数据来自基因表达数据库(gene expression omnibus,GEO),检索号为GSE42861,包含354名病例、335名对照,本文选取类风湿性关节炎相关基因区域所在的第9号染色体,共纳入2 433个胞嘧啶-磷酸-鸟嘌呤双核苷酸(cytosine-phosphate-guanine pairs of nucleotides,CpGs)位点。利用随机森林计算变量的重要性评分并排序;对排序后的变量进行逐步随机森林过程,寻找最有可能与结果存在关联的变量子集;对降维后的变量子集进行逐步Logistic回归。结果 逐步随机森林筛选出80个重要的CpG位点,Logistic回归模型中有13个位点具有统计学意义。纳入这些位点建立Logistic回归模型,该模型的预测正确率达88.29%。结论 随机森林算法可以大大减少噪音变量,提高检验效能,适用于高维甲基化数据分析。 相似文献
12.
《中国卫生统计》2019,(2)
目的探讨随机森林模型和决策树模型在肝硬化并发上消化道出血患者预后评估中的应用。方法利用logistic回归方法从肝硬化住院患者病历资料中筛选出与并发上消化道出血有关联的变量;以筛选出的变量作为输入变量,以是否出血作为结局变量,分别建立随机森林、决策树和传统logistic回归模型,通过受试者工作特征曲线(ROC)来评价三种模型的性能。结果 logistic回归、决策树和随机森林模型在测试集中的准确率分别为81.5%、75.1%和88.9%,三种模型的ROC曲线下面积(AUC)分别为0.854、0.720和0.909;在随机森林模型的变量重要性评分中,血糖、胆固醇、血清钾、总蛋白、碱性磷酸酶、尿素氮等指标得分较高,提示这些指标或有临床意义。结论随机森林模型在肝硬化上消化道出血患者的预后评估中具有较高的应用价值。 相似文献
13.
14.
15.
目的 基于集成四种机器学习算法建立哮喘疾病发病风险预测模型,为健康气象预报服务及公众防御提供依据。方法 收集、整理2012—2018年天津市某三甲医院哮喘病患者逐日就诊数据以及同期气象因子、环境因子、花粉等数据资料,采用主成分分析法选取最优因子,应用Stacking集成学习方法集成决策树、随机森林、XGBoost、LightGBM等四种机器学习算法,通过调节最优风险等级阈值、时间滞后、分季节等手段优化模型性能。结果 随机森林建模预测效果好于决策树及XGBoost、LightGBM;基于四个子模型进行多模型集成,相比随机森林模型,在易发、多发等级的预报能力提升约13%;当选择滞后时间为2~3 d,且分季节建模后,模型预测能力有进一步提升。结论 综合考虑多种气象因子、环境因子和花粉因素的多模型集成方法可应用于哮喘疾病的气象预测业务和服务。 相似文献
16.
17.
目的:研究基于MITK的医学图像三维重建技术,分析基于MITK的医学图像处理效果。方法:利用MITK平台在VC++6.0环境下采用面绘制技术实现了交互式医学图像三维重建系统。结果:利用MITK平台实现了改进算法下医学图像表面重建。结论:医学图像三维重建是一个多学科交叉的研究领域,是计算机图形学和图像处理在生物医学工程中的重要应用。它涉及数字图像处理、数学、图形学以及医学领域的相关知识,在诊断医学、手术规划及模拟仿真、虚拟内窥镜、解剖教学等方面都有重要应用。 相似文献
18.
19.
目的:测试基于MITK的医学图像处理效果。方法:通过实例在VC++6.0集成开发环境下分别编程实现了MITK在医学图像分割、配准和三维可视化(包括面绘制和体绘制)开发中的应用。结果:在MITK中这些算法都得到了比较满意的处理效果,尤其是MITK中的面绘制绘制速度快,绘制效果好。结论:可以方便地使用MITK进行医学图像分割、配准和可视化处理。 相似文献