首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
对医疗数据进行挖掘分析生成疾病治疗的标准过程模型,或者为治疗方案制定提供决策支持,是当前研究热点之一。基于历史患者的用药数据对疾病的药物治疗过程模型进行挖掘,并提出一种过程模型与用户体征数据相融合的药物推荐方法。具体而言,对于给定的疾病种类,首先利用隐含狄利克雷分布LDA主题模型对患者用药数据进行训练,得到药物治疗的功效主题以及各个诊疗日的药物功效主题分布;然后,对患者各个诊疗日的功效主题分布进行聚类,将患者的药物治疗过程转换为药物功效组合标签序列,在此基础上构建药物治疗过程的概率后缀树模型;最后,基于概率后缀树计算各节点后续治疗所采用药物功效组合的概率分布,将其与病人的体征向量作为联合特征,病人真实用药对应的功效组合作为分类标签,使用XGBoost的分类方法训练模型,并利用该模型进行患者药物推荐。以MIMIC-Ⅲ数据库中糖尿病患者的处方日志和体征数据为例,对所提方案的可行性和有效性进行了评估。  相似文献   

2.
诊疗活动是诊疗过程的基本元素,诊疗活动向量可以应用于诊疗活动聚类、患者聚类等任务。以把握和利用诊疗活动"局部无序,全局有序"的数据特点为出发点,结合医学先验知识,提出了诊疗活动向量化表示方法CA2Vec。提出了诊疗活动向量化学习的数据处理过程框架;加入了下一个诊疗日的诊疗活动和诊断结果信息,使得所提诊疗活动向量化学习模型相比于经典模型,获得了更丰富的上下文信息;提出了基于诊断结果约束的诊疗活动负采样方法。以SNOMED-CT本体和ICD-10编码医学知识为依据设计了评估实验,并在基于特定诊疗活动的聚类、基于本体的相似性度量、基于诊疗活动类型的相关度度量、基于特定病种的分类准确度度量、基于患者向量的聚类准确度度量这几个任务上进行了对比实验。实验证明,相比其他已有的先进的词向量化学习模型,CA2Vec方法有效把握了诊疗活动的相关关系,总体上有更高的准确度。  相似文献   

3.
为了保障大功率电力机车安全稳定的运行,提出一种基于聚类-规则的异常运行数据检测方法。利用聚类算法对异常运行数据进行聚类,然后根据聚类中心获得异常运行数据的检测规则库,并由此构建检测模型,同时利用BP算法对模型参数进行优化,最终获得准确的异常运行数据检测模型。  相似文献   

4.
利用数据驱动手段快速准确地从客户行为数据中获取客户需求信息是产品开发中亟待解决的问题,为此对客户需求模型进行研究,提出了评论数据驱动下客户需求建模的方法。首先,针对基于主题聚类的评论分析中主题数目不易确定的问题,提出了产品性能词典,用以确定聚类主题,对TF-IDF方法进行了改进,用于词典创建,并基于产品性能词典完成了客户需求挖掘。其次,针对现有产品评论研究缺乏需求分析过程的问题,提出基于产品评论数据的Kano分析方法,在此基础上引入物元表示法对客户需求模型进行量化表达。最后通过实例研究验证了所提方法的可行性与有效性。  相似文献   

5.
为了从过往的医疗数据中得到清晰可理解的过程模型,并将其合理应用于医疗决策的制定以及临床路径的改善,提出一种全新的临床诊疗过程挖掘方案,通过将相关临床诊疗事件进行合理打包来减少作为过程挖掘算法输入的事件个数,从而简化挖掘到的临床诊疗过程模型。针对临床诊疗事件打包,提出一种基于条件概率的打包算法,该算法将条件概率作为衡量事件之间关联程度的标准,并将关联程度达到一定程度的事件进行打包。实验结果表明,所提出的临床诊疗过程挖掘方案确实能够得到清晰可理解的过程模型,所提出的打包算法能够在更高容忍度的基础上得到更加精确、合理的结果。  相似文献   

6.
传统的模糊C均值算法直接基于原始数据进行聚类,数据的内在结构可能会被噪声、异常值或其他因素破坏,因此聚类性能会受到影响。为提升FCM算法的鲁棒性,提出了一种基于自适应近邻信息的模糊C均值聚类算法。近邻信息指的是一种基于数据点之间相似度的度量,每个数据点都可以看作其他数据点的近邻,但是不同数据点之间的相似度是不同的。将样本点的近邻信息GX和类中心点的近邻信息GV融入基础FCM模型中,为聚类过程提供更多的数据结构信息,用于指导聚类算法中的簇划分过程,以提升算法的稳定性,并提出了3个迭代算法求解本文提出的聚类模型。与其他先进聚类算法对比,在部分基准数据集上聚类性能有10%以上的提升,同时还从参数敏感性、收敛性、消融实验等方面对算法进行评价。实验结果可以充分显示本文提出的聚类算法的可行性与有效性。  相似文献   

7.
变频器设备机理复杂、设备监测数据异常样本少,导致在实际应用中基于经验和基于模型的异常检测方法操作性难、常规的数据驱动方法可行性差。针对上述问题,结合密度峰值聚类与时序运行数据的转移特点,提出一种基于大数据分析的变频器异常检测方法。该方法首先通过密度峰值聚类将运行数据聚类,然后将时序过程数据在不同类簇间的动态变化规律用概率表示,并基于聚类结果和转移概率提出异常检测体系框架,最后通过异常案例验证该方法的有效性,表明该方法能够正确识别变频器异常行为。  相似文献   

8.
标准临床路径对于规范治疗流程、提高治疗效果具有重要作用,但当前的临床路径是面向同一病种的所有患者制定的,无法体现患者或者医疗部门的个性化信息。为了实现符合患者和医疗部门特点的个性化临床路径,从医疗信息化系统中记录的患者处方数据出发,进行药物治疗临床路径的挖掘。首先由处方数据结合DrugBank数据库生成患者的每日用药疗效文档;然后使用词对隐狄利克雷分布模型对这些药物疗效文档进行主题聚类,得到患者每日所用药物对应的疗效主题;最后以各个患者的药物疗效主题序列为输入,训练概率后缀树模型作为药物治疗的临床路径模型,该模型既可以辅助专家进行个性化临床路径的制定,也可以用于患者后续服用药物的推荐。以MIMIC-Ⅲ数据库中肺炎患者的处方数据为实例,对所提方法的可行性和有效性进行了验证。  相似文献   

9.
异常节点监影响通信网络路由性能,其敏感信息有利于发现网络攻击行为。为此,针对通信网络异常节点及其敏感信息监测,提出基于马尔可夫聚类改进的通信网络异常节点敏感信息监测方法。算法基于网络采集并预处理的流数据建立能够表征网络状态的邻接矩阵;然后在分析敏感词距离及敏感信息敏感度基础上,对邻接矩阵进行马尔可夫聚类处理,根据核心聚类节点在聚类前后的结构差异,实现通信网络中的敏感信息的自动监测。实验结果验证了算法在监测识别敏感信息方面的有效性和准确率。  相似文献   

10.
针对雷达扫描角分辨能力不高,远处点云较稀疏,导致对目标的分割聚类不准确的问题,提出了一种基于四线激光雷达的障碍物检测算法。在对原始雷达数据进行栅格化及滤除之后,对滤波结果进行了聚类分割。依据栅格深度值确定聚类距离阈值,结合连通区域标记算法得到准确的聚类范围;通过匹配相邻障碍物运动状态信息,进一步提高聚类的准确率。实车实验表明,所提方法较已有的分割聚类算法,可以准确地得到路面障碍物信息,并能有效避免过分割现象。  相似文献   

11.
针对当前森林火灾报警系统只能发出报警无法准确获得着火点的缺陷,设计了一个基于无线传感网络的森林火灾准确预警系统.通过Zigbee无线通信技术得到各无线传感器采集的数据信息,然后利用改进的核模糊聚类算法对该数据集进行聚类分析,从而得到准确的聚类结果,最后把着火点具体位置发送至火灾报警控制中心.实验结果表明,与其它方法相比,该系统实现了数据的准确采集和高速传输,能够实现森林火灾实时监测并自动识别着火点,检测灵敏度及准确率高,对预防火灾和消防救灾具有重要的意义.  相似文献   

12.
为有效利用汽车行驶工况中与类别属性间的统计特征,提高汽车行驶工况判别的准确性与快速性,首先选择车速和踏板信号的数据信息构建特征集,利用相关性分析和核主元分析对特征集中能敏感反映工况类别的特征数据信息进行二次特征提取,按累计贡献率大于90%的标准进行主要特征量的选择,实现输入变量的二次约简;利用小波核函数的非线性映射能力构建半监督核模糊C均值聚类方法进行车辆行驶工况的判别。通过长春某混合动力公交车试验结果表明,该方法更全面准确地反映了工况特性,有效降低了输入特征参数的维数,更加准确有效地提取了不同工况条件下汽车行驶状态的数据特征,通过半监督核模糊C均值聚类算法中加入少量的训练样本来引导聚类过程,聚类精度可达到98.75%。  相似文献   

13.
基于分段线性MPCA的充液氨过程建模及监控   总被引:1,自引:0,他引:1       下载免费PDF全文
为深入分析晶变改性装备中反应釜充液氨工艺过程特性,同时也为了进行更精确、有效的过程监控,提出了一种分段线性多向主元分析(MPCA)方法,实现该间歇过程的建模及故障诊断。首先将三维建模数据降维展开并进行主元分析(PCA),得到采样点数据特征矩阵;然后基于间歇过程的多操作时段特性,根据特征矩阵相似度最大隶属原则,通过设定窗口长度可调的滑动聚类器,在系统运行轨迹上分别从数据变异的方向和幅值对采样点进行2次聚类划分,将间歇过程操作周期分割为一系列运行特性相同的子时段,最后利用各个子时段的线性MPCA模型逼近系统非线性运行过程,实现间歇生产过程建模及在线监测。通过反应釜充液氨工艺过程的实际应用,结果表明提出的建模方法能够对该间歇生产进行合理的、易于从过程特性角度解释的时段划分,所建模型具有可靠的监控性能,能及时准确检测出系统运行过程中的异常情况。  相似文献   

14.
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。  相似文献   

15.
针对摩擦提升机主轴系统故障耦合、特征微弱且故障样本不易获得的问题,提出一种基于复杂网络聚类的故障诊断方法。该方法从故障数据表现出社团结构的本质出发,以各数据样本为节点,样本间相似度为有权边,构建加权无向复杂网络模型。将欧氏空间的距离概念推广到样本的相似性度量上提出广义Ward距离,并以此为划分准则,采用凝聚型合并过程实现网络模型中社团的聚类,即故障样本的模式识别。对主轴系统过载、滚动轴承元件故障及减速器齿轮磨损的分析结果表明,该方法能准确对已知故障类型数据进行聚类,且在过程中不预设类别数,为收集异常数据以便未知故障的发现与诊断提供了数据支持。与多元支持向量机与快速Newman算法的对比结果表明,该方法具有更高的识别精度与效率。  相似文献   

16.
随着传感器和监测技术的快速发展,大量工程装备运行数据被记录和保存下来,为提升装备设计、分析和运行水平提供了数据基础。这些数据内部存在的异常值会对数据建模与分析产生严重干扰。为此,文中提出一种基于模糊聚类与多项式回归的异常值识别与鲁棒建模方法,通过多项式回归来刻画数据属性之间的关联关系,采用模糊聚类计算数据的隶属度信息判断数据是否为异常值,并基于非异常值数据建立预测模型,最终实现数据的鲁棒建模。数值案例、隧道掘进机和联合收获机监测数据试验结果表明,提出方法能够准确识别出数据中的异常值,并显著提升数据建模精度。  相似文献   

17.
朱波  刘飞 《中国机械工程》2013,24(21):2895-2902
针对多变量过程均值异常,提出了选择性有向无环图支持向量机(DAG-SVM)集成,以之为模式识别工具对过程状态进行识别,以探测异常和判别异常源。集成结合Bagging方法的重复采样技术和对DAG-SVM结构的调整,对数据和模型进行双重扰动,以获得差异的候选个体;再通过二进制粒子群优化(BPSO)算法得到最优集成方案。离线仿真测试证明所提选择性DAG-SVM集成具有分类正确率和效率的双重优势;在线仿真测试表明基于选择性DAG-SVM集成的模型探测过程均值阶跃异常优于χ2图和BPN(误差反传神经网络)模型,且判别异常源比BPN模型更准确。针对实际齿轮加工过程数据的应用验证进一步证实了模型的有效性和实用性。  相似文献   

18.
因集中供热建筑结构、住户行为习惯等差异,末端住户供暖数据具有特征差异大、非线性强、数据量大、响应时间长等特征,在原数据空间中利用聚类分析进行异常检测造成类间数据交叉,精确性无法保证。本文提出高维高斯混合聚类算法,将数据集映射到高维空间进行聚类,利用核函数映射、内积运算与高维特征空间分解等计算方法,提高精确度,规避维数灾难。搭建工业大数据分析平台,对比K-Means、高斯混合、恒虚警率、高维高斯混合算法聚类结果与异常检测精确度,本文所提算法将准确性提高到90.72%,误报率降低到5.92%,结合该算法完成4类异常用热数据集的解释与辨识。高维高斯混合聚类可以有效分析用户用热特征、检测异常数据,辅助降低采暖能耗,实现建筑节能。  相似文献   

19.
针对卫星典型构件在工艺设计过程中重复性工作繁多、大量历史工艺数据未得到充分利用的问题,进行了典型工艺过程发现的研究,以提高典型工艺过程的利用率,达到提高工艺设计效率的目的。对典型工艺过程的发现问题进行了描述,建立了工艺过程的属性有向图模型,通过工艺单元的相似性度量和工艺路线的相似性度量得到了工艺过程的相似性;基于工艺过程的相似性,通过近邻传播算法对工艺过程进行聚类分析,并根据Silhouette指标和IGP指标对聚类结果进行评价分析,得到有效聚类结果和最佳聚类数目。以卫星结构板的机加工艺为例,验证了算法的有效性,并获得了卫星结构板的5类典型机加工艺过程。  相似文献   

20.
随着信息技术的发展和教育信息化进程的不断推进,数据资产管理平台中积累了大量的数据,如何合理的分析这些数据,从中提取隐含的并有价值的信息,已经成为亟需解决的问题。提出一种基于机器学习的大数据聚类分类方法,该方法分为离线和在线两部分。离线部分采用LDA主题模型对历史数据进行主题特征提取,结合k-means对LDA的主题特征进行聚类,离线部分加快了运行数据分类的速度。在线部分主要主要采用word2vec对新输入数据进行向量化,直接与表征类向量进行在线对比,自动进行分类。测试结果表明,所提方法在聚类效果上相对传统的聚类方法精确率提高12.2%,在运行数据分类上准确率超过97.5%,提高了数据资产管理能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号