首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
DNA-N6甲基腺嘌呤(6-m A)甲基化修饰是重要的表观遗传修饰标记之一。异常的6-m A位点会影响基因表达,进而引发多种重大疾病,因此预测6-m A位点对理解治病机理和治疗疾病具有重要意义。提出一种基于K-mer方法和One-hot方法复合特征编码的长短期记忆(Long Short-Term Memory,LSTM)神经网络用于基因甲基化位点预测,通过K-mer编码方法增加基因序列字符信息量,再使用One-hot编码方法对编码后的字符序列进行扩展,形成复合编码矩阵。改进后的序列编码矩阵可增加LSTM模型从基因序列数据中可提取的特征维度和种类,以提高LSTM模型对基因序列的处理性能。通过交叉验证实验表明本方法在公共数据集上的准确率可达93.7%,敏感度、特异性和马氏相关系数分别为93.0%、94.5%、0.875,均优于现有方法。进一步,在其他6个不同物种的基因数据集上,受试者工作特征曲线线下面积(Area Under the Curve,AUC)值介于0.905 5~0.926 2,表明本方法可适用于动物、植物和微生物的甲基化位点预测。本方法对水稻NC_029258.1基因序列进行...  相似文献   

2.
对苯酚类化合物小鼠腹腔注射LD50的定量构效关系进行了研究。利用计算机应用程序,在AM1和PM3模式下计算了51个苯酚类化合物的17种量化参数,用40个化合物研究他们对小鼠腹腔注射急性毒性(LD50)的影响,经统计分析,又引入了5个参数的交叉项,利用线性回归方法并获得9个苯酚类化合物小鼠经口急性毒性预测模型。经模型验证及leave-one-out交互验证,筛选得到一个预测模型。用另11个化合物作为测试集,证明该模型具有很好的预测能力,可用于苯酚类化合物的毒性机理研究和毒性预测。  相似文献   

3.
针对X射线图像违禁品检测中存在的漏检和误检问题,提出基于改进胶囊网络的模型(DMF and SE Capsule)用于X射线图像违禁品检测。该模型在传统胶囊网络的基础上增加了特征增强(dilated convolution multi-scale feature fusion,DMF)模块和特征筛选(squeeze-andexcitation block,SE)模块。首先使用特征增强模块提取图像特征,通过增加空洞卷积层,并且将所得的高低层语义特征进行拼接融合,从而得到丰富的特征信息;然后再用特征筛选模块,以挤压激励的方式将得到的特征进行筛选;最后再经过网络的胶囊层,从而完成对违禁品的检测。为了验证模型对复杂场景下X射线图像中违禁品的检测能力,在SIXray数据集上进行实验,模型的检测准确率达到79.254%,与原始的胶囊网络(71.350%)相比提升了7.904%,因此,改进模型的检测能力提升明显。  相似文献   

4.
在B3LYP/6-31G*水平上采用高斯09全优化计算了50个P450 1A2抑制剂的量子化学参数,应用基于预测的模型变量选择方法(VSMP)选择描述子最佳子集,建立了最高轨道占有能(EHOMO)和分子体积(Vm)与萘、内酯衍生物及其他化合物对细胞色素氧化酶P450 1A2抑制剂的两变量线性QSAR模型,结果表明:所选的2个分子结构描述符与50个抑制剂的活性之间具有很强的线性关系(相关系数r2=0.907 0)和内部预测能力(留多法交叉验证相关系数q2=0.751 7)。同时,将50个化合物分成奇数集和偶数集各自进行筛选建模,并彼此进行外部预测,对全部样本集、奇数集和偶数集样本模型进行了y-Randomization检验,结果表明描述符EHOMO和Vm建立的模型均非常稳定并具有很高的预测能力。  相似文献   

5.
利用生物信息学方法筛选与胶质瘤预后相关的衰老基因,并进行相关预后风险模型的构建与验证。首先,从中国脑胶质瘤基因组图谱数据库中获取胶质瘤患者的表达谱和临床信息,通过单因素回归、拉索回归、多因素回归的方法构建相关预后模型;其次使用外部数据集进行验证;再使用箱线图表明各临床亚型的风险评分差异;最后使用富集分析(GSEA)探讨可能涉及的机制。结果筛选出4个用于预后的基因。训练集和验证集的生存曲线显示,高风险组的总生存率显著低于低风险组(p<0.001)。受试者工作特征曲线分析结果显示,训练集在1、3和5 a的曲线下面积分别为0.91、0.95和0.95,验证集在1、3和5 a的曲线下面积分别为0.73、0.80和0.80,说明该模型对患者的预后预测具有很强的预测效能。临床亚型箱线图显示多种临床亚型分组的风险得分具有显著差异。GSEA分析富集的通路主要涉及JAK-STAT信号路径、P53信号通路、泛素介导的蛋白水解、长期电位富集等通路。以上结果表明这4个衰老相关基因可能为胶质瘤预后潜在的生物标志物。  相似文献   

6.
为了提高HIV-1型蛋白酶剪切位点的预测准确性,提出一种基于特征选择和支持向量机的剪切位点预测模型。首先,通过对5830个样本的HIV-1型蛋白酶剪切位点数据集进行分析,根据最小冗余最大相关理念,采用可自动终止法选择剪切位点的特征向量;然后,将特征向量输入到支持向量机进行学习和训练,建立HIV-1型蛋白酶剪切位点的分类模型;最后,采用Matlab 2014的仿真工具箱进行仿真测试。实验结果表明:本文模型在特征最少的条件下,剪切位点预测精度优于参比模型及文献报道,且所选择的特征向量具有较好的可解释性及生物学意义。  相似文献   

7.
针对驾驶员期望轨迹预测问题,设计了一种考虑周车信息的自车期望轨迹预测模型。建立了单独的自车和周车历史轨迹信息编码器,将编码后的自车历史轨迹信息送往意图识别模块用于识别驾驶员意图;通过注意力机制对自车和周车编码信息进行处理,并与意图识别的结果共同作为解码器模块的输入,最终输出车辆未来位置。最后,采用数据集对模型进行训练,验证了模型的有效性。  相似文献   

8.
为了有效辅助脑胶质瘤的精确分级,提出一种基于影像组学的脑胶质瘤分级方法。首先,提取脑胶质瘤患者的T1加权磁共振图像的影像组学特征,在十折交叉验证框架下采用Boruta算法进行特征筛选得到重要特征;其次,采用随机森林将筛选得到的重要特征构建脑胶质瘤预测分级模型;最后,对脑胶质瘤预测分级结果进行评价与分析,用统计学方法检验不同级别特征的差异性。实验结果表明,提出方法的平均准确率达到84.75%,平均特异性达到85.32%,平均敏感性达到84.19%,平均受试者操作特征曲线下面积(Area Under Curve, AUC)达到0.92。  相似文献   

9.
释义识别技术(Paraphrase Identification, PI)被广泛用于问答系统、抄袭检测、个性化推荐等领域.针对已有释义识别方法缺乏有效的特征提取机制问题,提出了一种新的释义识别模型.与传统“编码-匹配”模式不同,采用“编码-匹配-提取”模式,通过添加特征提取层进一步提取分类信息.所提出模型由6层组成:输入层、嵌入层、编码层、匹配层、特征提取层、输出层.在编码层,采用基于注意力机制的上下文双向长短期记忆网络对文本上下文进行编码,充分利用句子的前向和逆向两个方向的上下文信息;在匹配层,通过多种矩阵运算,从不同角度获得句子对匹配信息;在特征提取层,利用Xception网络以便更有效地从匹配结果中提取分类信息.此外,本文采用多特征融合的方法,将GloVe预训练的词向量、字符向量和附加特征向量的连接作为最终的词向量,较普通的词向量携带更丰富的语义信息.实验结果表明,所构建的模型在Quora和SemEval-2015 PIT两个公开数据集上(分别作为大型数据集和中小型数据集的代表)都达到了竞争性效果.  相似文献   

10.
针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度差异,影响预测准确性的问题,提出基于多尺度特征与注意力机制的轴承RUL预测方法. 在多个尺度下计算轴承原始振动信号的若干时域和频域特征,作为输入特征集. 将多尺度特征集输入到网络中,以注意力模块为不同特征自适应地分配最佳权重,以卷积神经网络(CNN)模块进行深层特征提取与多尺度特征融合,通过前馈神经网络(FNN)模块映射得到RUL预测值. 通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越.  相似文献   

11.
为有效提高视频内容管理的准确性和高效性,本文借鉴生物信息学的方法,提出了一种降维改进的SURF算法和K-means算法相结合的视频DNA提取算法。该算法通过提取关键帧的SURF特征得到特征点集合,并对其进行K-means聚类构建视觉词袋模型,并将SURF特征通过视觉词袋模型量化为视觉词汇,并最终编码生成视频DNA。实验结果表明,采用改进的SURF算法生成的视频DNA具有良好的准确性和鲁棒性,并能在时间开销方面得到一定的提高。  相似文献   

12.
提出了一种基于时频联合分析的鼠标动力学认证方法.对用户操作鼠标行为的连续时序信号进行小波包变换,依据不同频带的子信号提取其时频联合分布特征,并使用递归特征消除法筛选出特征.采用随机森林算法建立用户独特的鼠标行为模式,据此进行用户身份认证.为验证方法的有效性,采取单因素实验设计,以特征分析方法为唯一因素,采集真实网络环境中40个用户在31个月内的鼠标行为数据,对其中18个用户分别采用时序分析和时频联合分析提取并筛选特征;使用相同算法建立用户鼠标行为模式,对比了基于2种特征分析方法的可信身份认证系统的性能差异.结果显示,相比时序分析方法,所提方法将可信身份认证的操作特性曲线下的面积从97.02%提升为99.10%.  相似文献   

13.
针对图像数据库日渐庞大的问题,研究了将特征提取与深度学习相结合进行图像检索的方法,提出了基于Gabor小波变换和受限玻尔兹曼机(RBM)的特征提取和降维模型.将整幅图像划分成局部图像块,利用Gabor滤波器组提取图像特征,通过RBM对特征进行学习和编码,从而实现图像特征的降维处理.采用基于深度信念网络(DBN)和Softmax分类器的图像检索算法,利用Corel图像库进行新方法的图像检索实验,并与其他两种方法进行比较.结果表明,本文方法在准确率、查全率和检索时间上均具有较好的性能,能得到更好的图像检索结果.  相似文献   

14.
基于mRIVIR和SVM的弹性图像特征选择与分类   总被引:1,自引:0,他引:1  
为客观的评价弹性图像,利用图像处理与模式识别技术进行分析.首先通过彩色变换获取弹性信 息,然后提取弹性图像用户感兴趣区域的一阶统计特征和纹理特征,采用“最小冗余最大相关”( mRMR)算 法选择优化的特征,最后使用带有核函数的SVM分类器对弹性图像进行分类.实验结果表明:该方法具有较 高的准确率(92%).采用计算机辅助诊断技术对弹性图像进行定量分析可有助于提高诊断准确率  相似文献   

15.
基于编码器-解码器(encoder-decoder)框架的生成式方法在关键词抽取任务上得到了广泛应用并取得了较好的性能,然而该方法面临的主要挑战为建模有效的文档向量表示,及生成覆盖整个文档主题的关键词集合,这些挑战都会直接影响关键词抽取的结果.该文提出了结合邻域知识的文档级关键词抽取模型以应对这些挑战.具体来说,通过给...  相似文献   

16.
面向人体动作识别的局部特征时空编码方法   总被引:2,自引:0,他引:2  
为克服BoF特征袋模型在视频人体动作识别中忽视局部特征间时空位置关系的问题,本文提出局部特征时空编码方法。将局部特征时空位置坐标引入特征编码中,直接对它们的时空位置关系建模。首先,将局部特征投影到人体运动子时空域,获得局部特征的时空位置坐标;然后,在特征编码阶段同时对局部特征的出现信息和时空位置坐标进行编码;最后,采用特征池提取该时空域内局部特征的统计信息用于动作分类。为进一步提高性能,多尺度时空编码和局部约束时空编码方法也一并被提出,并在分类阶段采用局部约束块稀疏表示分类方法提高动作识别精度。在KTH, Weizmann, UCF sports等标准测试集的实验表明,本文算法能够有效表示局部特征间时空位置关系、提高动作识别精度。  相似文献   

17.
蛋白质结构-功能关系研究是结构生物学领域的热点问题之一,具有重要的理论和实际应用价值.弹性网络模型(elastic network model,ENM)是获取蛋白质结构本身固有动力学性质,进而揭示其生物学功能的有效方法,在蛋白质结构-功能关系研究中得到了广泛应用.简要介绍了ENM的基本原理及其在蛋白质结构-功能关系中的应用,主要包括蛋白质功能性运动分析和关键位点识别等.  相似文献   

18.
城际快速路客运站点设置方法   总被引:1,自引:0,他引:1  
为方便城际快速路沿线居民出行,提出城际快速路客运站点设置方法.针对城际快速路客运线路的运营特点,提出一种寻求最少数量的居民点集对沿线居民点进行全覆盖的算法;以居民步行总距离最小为目标建立优化模型,确定每个居民点集所对应客运站点的最佳位置;为了提高客运线路的运行效率,引入灰色聚类方法,建立量化的聚类指标体系及标准,通过评估每个站点的重要度对站点的数量进行优化;最后以一条城际快速路为例对上述方法进行验证.结果表明:该方法是一种行之有效的站点设置方法,实现了站点位置和数量的双优化,能够满足城际快速路沿线主要居民出行需求和线路快速运行的需要,从而使得城际快速路上客运站点的布局更加合理.  相似文献   

19.
基于联合Delaunay三角网的等高线地形特征提取研究   总被引:2,自引:0,他引:2  
分析了基于等高线的地形特征自动提取过程,提出了一种“联合Delaunay三角网”来探测和分析等高线群的弯曲,同时提出了“三角形局域连接方法”来解决地形特征线连接的难点.结果表明:与传统Delaunay三角网方法相比,利用“联合Delaunay三角网”和“三角形局域连接方法”能自动提取更完整的具有树结构的地形特征线.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号