首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 269 毫秒
1.
在癌症研究中,随着高通量测序技术发展已经产生了海量的复杂数据。尽管有了一些利用深度学习和统计学方法进行多组学数据整合的研究,但目前仍缺乏较为有效率的整合方法。因此提出一种基于深度自编码器的多组学数据整合方法(deep autoencoder for multi-omics integration,DAEMI)。它利用自编码器中的瓶颈层,学习多组学数据的特征表示。与先前利用深度学习整合的研究相比,DAEMI可以发现明显生存差异的癌症亚型。同时因为不需要生存数据来选择特征,DAEMI可以使用更多特征进行[K]均值聚类,进而完成癌症分型任务。将DAEMI应用于模拟数据集与四个癌症数据集实验,通过与高阶路径相似度网络的融合模型(HOPES)、相似性网络融合(SNF)、iClusterPlus和moCluster进行比较,结合模拟数据集测试结果与真实癌症数据集测试结果来看,DAEMI要优于其他方法。相应的生物功能分析揭示,神经退行性疾病与线粒体功能障碍可能与癌症共享某些生物学通路。  相似文献   

2.
针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在监督阶段将训练的权重迁移到生存分析模型,并对传递权重进行微调和稀疏编码。实验结果表明,在八种不同癌症类型的数据集上,VAESCox模型在消融和对比实验中均取得了较高的C指数值。与其他四种基准生存分析方法相比,所提算法不仅缓解了多组学数据融合的过拟合问题,也显著提高了生存预测性能,表明不同组学数据的融合有助于预后生存结果的精准预测。  相似文献   

3.
脑图谱是研究脑结构和功能及脑疾病的基础,不同类型的脑图谱从不同角度提供了脑的组织模式或连接信息。随着图像采集和生物检测技术的发展,不同模态的脑影像和生物组学数据迅速增长。相较于单模态,多模态融合数据能够同时考察不同模态数据间的多元化信息,挖掘蕴含的未知新信息。因此,开展跨模态脑图谱数据融合研究有助于更全面地理解大脑的结构和功能,并辅助加深对脑发育、老化和病变机理的理解。本文根据参与融合的模态是否具有空间信息,将近年来有代表性的跨模态脑图谱融合技术分为脑影像融合和脑数据融合两大类。脑影像融合是指对宏观脑影像(磁共振等)和组织学脑影像(胞体染色、轴突染色等)等具有空间信息的数据进行融合,构建涵盖脑结构和功能信息的跨模态多尺度脑图谱,为研究宏观特征的介观机制以及介观特征的宏观表征提供了重要途径。脑数据融合是指对缺乏脑空间信息的生物大数据,包括基因组、电生理、认知和行为等,利用脑图谱提供精细空间信息,挖掘高维、异构生物大数据蕴含的信息,明确脑图谱的生理意义,并提升其应用价值。本文将针对这两类融合类型阐述国内外有代表性的研究进展,并对比国内外研究现状的差异。此外,为促进跨模态脑图谱数据融合领域的交流和发展,总结了部分有代表性的大样本公开数据集。最后讨论了当前该领域待解决的问题以及未来的发展趋势。  相似文献   

4.
困扰配电网规划的主要问题包括基础数据收资和分析困难,规划项目管理无专业技术支持、完全依赖人工管理等,解决这些问题能够有效提升配电网规划工作成效,能更有效和针对性的从规划层面解决配电网运行问题。本文以贵州电网规划研究中心“配电网规划基础数据应用研究项目”的工程实践为基础,分析总结项目实践经验,论述了通过多源数据融合实现对配电网规划基础数据的全面、快速整合,提出了配电网规划基础数据分析及应用路线,其研究成果对提升配电网规划管理和技术有较大作用和意义。  相似文献   

5.
针对面向多种专业工程图学类课程考试与评价的试题库建设需求,提出一种自底向 上的工程图学试题库建设方案,从工程图学试题的描述表达入手,结合工程图学课程特点,构建 了多属性多关联的试题模型,分析工程图学课程的选题组卷过程,对基于试题属性参数的多路径 选题组卷方法、历史试卷特征提取的试卷智能再生技术,试卷图形化交互布局方法进行了研究, 开发了相应的工程图学试题库组卷系统。  相似文献   

6.
从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍.  相似文献   

7.
分析数据去重的重要意义, 根据现有的数据去重技术和算法, 改进MD5码指纹的计算算法并进行优化, 分析并重组指纹计算的流水化方法, 利用缓存组代替单个缓存的方式, 提出一种基于多CPU的两级指纹流水计算方法, 对该方法进行分析研究, 并通过相关试验和试验数据来支持该方法的有效性.  相似文献   

8.
针对传统的放射多组学(影像组学、剂量组学和轮廓组学)模型往往采用特征拼接的方式,容易忽略不同组学特定统计属性、产生过拟合的问题,提出了以一致性约束和自适应权重为核心构建的多组学协同学习算法(multi-omics collaborative learning, MOCL)。该算法采用一致性约束挖掘不同组学特征之间的互补模式,再通过香农熵自适应学习不同组学特征的权重,最后引入紧致度图来避免过拟合现象。通过将MOCL在311名鼻咽癌患者组成的临床影像数据上得到的实验结果与3种传统的机器学习算法以及2种多视角算法进行比较,结果表明MOCL在多组学协同学习上,具有一定的优势,能为鼻咽癌自适应放疗资格预测提供有价值的决策依据。  相似文献   

9.
代谢组学数据处理研究的进展   总被引:2,自引:0,他引:2  
代谢组学是继基因组学和蛋白质组学之后,于上世纪90年代新近发展起来的一个新的科学研究热点.代谢组学数据往往非常复杂,因此数据处理已经成为代谢组学研究中的关键技术和瓶颈之一.本文按照代谢组学数据预处理一代谢物靶标分析和代谢轮廓分析中的数据处理-代谢指纹分析中的数据处理的线索,评述国内外在代谢组学数据处理方面的最新进展,并介绍代谢组学数据处理软件.  相似文献   

10.
组播技术综述   总被引:9,自引:0,他引:9  
组播通信技术提供了一种点对点或多点对多点的数据传输模型 ,作为下一代 Internet应用的重要技术 ,组播相关技术研究引起了广泛关注 .本文从分布式系统特点出发 ,分析了组播研究的内容和特点 ,描述了组播设计所涉及的技术及难点 ,概括了现有工作和相关进展  相似文献   

11.
12.
对国内关于档案数据的研究进行评述,发掘档案数据这一对国家经济发展和社会进步具有重要作用的信息资源的战略意义,为相关研究提供参考。采用文献计量学方法,选取CNKI作为数据源,检索出2012-2020年的论文数据并运用CiteSpace软件从文献数量年度分布、发文期刊和发文作者等维度进行计量分析,并绘制关键词聚类知识图谱。目前国内档案数据研究主要有"档案数据"基础理论、档案数据备份与长期保存、档案数据服务、档案数据治理、档案数据与新学科和新技术融合等方面,未来可能深入发展的主题有档案数据治理理论和实践研究、新技术对档案数据研究的帮助和档案数据在学科融合背景下的新应用等。档案数据相关研究的未来走向需在实践中进一步探索。  相似文献   

13.
Wu  Jingli  Zhu  Kai  Li  Gaoshi  Wang  Jinyan  Cai  Qirong 《Applied Intelligence》2022,52(1):127-140

It is generally acknowledged that driver pathway plays a decisive role in the occurrence and progress of tumors, and the identification of driver pathways has become imperative for precision medicine or personalized medicine. Due to the inevitable sequencing error, the noise contained in single omics cancer data usually plays a negative effect on identification. It is a feasible approach to take advantage of multi-omics cancer data rather than a single one now that large amounts of multi-omics cancer data have become available. The identification of driver pathways by integrating multi-omics cancer data has attracted attention of researchers in bioinformatics recently. In this paper, a weighted non-binary mutation matrix is constructed by integrating copy number variations, somatic mutations and gene expressions. Based on the weighted non-binary mutation matrix, a new identification model is proposed through defining new measurements of coverage and exclusivity. Then, a cooperative coevolutionary algorithm CGA-MWS is put forward for solving the presented model. Both real cancer data and simulated one were used to conduct comparisons among methods Dendrix, GA, iMCMC, MOGA, PGA-MWS and CGA-MWS. Compared with the pathways identified by the other five methods, more genes, belonging to the pathway identified by the CGA-MWS method, are enriched in a known signaling pathway in most cases. Simultaneously, the high efficiency of method CGA-MWS makes it practical in realistic applications. All of which have been verified through a number of experiments.

  相似文献   

14.
The rapid development and extensive application of geographic information system (GIS) and the advent of the age of big data bring about the generation of multi-resources spatial data, which makes data integration and fusion share more difficult due to the differences on data source, data accuracy and data modal. Meanwhile, study for multi-resources spatial data fusion methods has an important practical significance for reducing the production cost of geographic data, accelerating the updating speed of existing geographical information and improving the quality of GIS big data. To expound the formation and developing trends of multi-resources spatial data fusion methods systematically, and on the basis of referring to lots of related technical documents both at home and abroad, this paper makes a conclusion and discussion about multi-resources spatial data fusion methods, and foresees the prospects of data fusion in big data environment, which has certain reference value for the related research work.  相似文献   

15.
分析学科题目含义、模拟人类解决问题,是当前“人工智能+教育”融合研究的重要方向之一。近年来,智能教育系统的快速发展积累了大量学科题目资源,为相关研究提供了数据支撑。为此,利用大数据分析与自然语言处理相关的技术,研究者提出了大量面向学科题目的文本分析方法,开展了许多重要的智能应用任务,对探索人类知识学习等认知能力具有重要意义。该文围绕智能教育与自然语言处理交叉领域,介绍了若干代表性研究任务,包括题目质量分析、机器阅读理解、数学题问答、文章自主评分等,并对相应研究进展进行阐述和总结;此外,对相关数据集和开源工具包进行了总结和介绍;最后,展望了多个未来研究方向。  相似文献   

16.
数据挖掘的一个重要任务便是从数据库中挖掘出有趣的关联规则。传统的关联规则挖掘方法一般基于支持度-置信度体系,时常会挖掘出虚假规则或忽略掉有用的规则。针对这一问题,本文借鉴对照实验的思想,提出基于T统计量的关联规则挖掘方法,用显著度代替置信度,使挖掘出的规则更具有统计显著性。算例分析和数据实验表明,这种方法可以解决传统关联规则方法存在的上述问题,提高关联规则的有效性。  相似文献   

17.
数据是天文学发展的重要驱动。分布式存储和高性能计算(High Performance Computing,HPC)为应对海量天文数据的复杂性、不规则的存储和计算起到推动作用。天文学研究中多信息和多学科交叉融合成为必然,天文大数据已进入大规模计算时代。高性能计算为天文大数据处理和分析提供了新的手段,针对一些传统手段无法解决的问题给出了新的方案。文中根据天文数据分类和特征,以高性能计算为支撑,对天文大数据的数据融合、高效存取、分析及后续处理、可视化等问题进行了研究,总结了现阶段的技术特点,提出了处理天文大数据的研究策略和技术方法,并对天文大数据处理面对的问题和发展趋势进行了探讨。  相似文献   

18.
舰船信息系统装备形态多样、技术状态复杂,性能数据和质量数据庞大,需要采用信息化、智能化手段,实现对海量数据的采集、提取、整合与调用,供状态监测和性能评估使用;通过研究信息系统装备相关设计、测试、试验、使用维护数据的获取方式和手段,开展信息采集、图像处理以及应用架构设计等关键技术研究工作,解决质量数据的采集接口不统一,质量数据存储分散,数据分析和利用不够的诸多问题,提高工作效率、降低使用维护成本;在信息采集的基础上,通过研究面向舰船信息系统装备研制、试验、运行、维护等多环节统一的数据环境,开展质量数据建模分析、成功数据包络、性能评估及辅助决策等关键技术研究工作,构建舰船质量数据的高速处理和分析体系,解决辅助决策过程信息多、依据多、流程复杂的问题,可辅助快速生成技术决策建议,缩短决策时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号