期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

融合抽象层级变换和卷积神经网络的手绘图像检索方法 总被引：1，自引：1，他引：0

刘玉杰庞芸萍李宗民李华《浙江大学学报(理学版)》2016,43(6):657-663

针对人工设计的描述子（HOG、SIFT等）在基于手绘的图像检索（Sketch Based Image Retrieval,SBIR）领域的局限性,提出了一种融合抽象层级变换和卷积神经网络构建联合深度特征描述子的手绘图像检索方法.首先,提取常规图像的边缘概率图,在此基础上进行不同抽象层级的图像变换,将抽象层级变换图像输入到深度神经网络并提取不同隐层的输出向量,最后,联合不同隐层的输出向量作为手绘图像检索的特征描述子（即联合深度特征描述子）.在Flickr15k数据库上对本方法进行了实验验证,结果表明：融合抽象层级变换和联合深度特征描述子的检索效果相较HOG、SIFT等传统方法有显著提高.本方法从图像预处理和特征描述子构建2个方面,对SBIR问题进行了改进,具有更高的准确率. 相似文献

2.

基于循环生成对抗网络的道路场景语义分割

李智张娟方志军黄勃姜晓燕黄正能《武汉大学学报(理学版)》2019,(3)

在无人驾驶技术中,道路场景语义分割是一个非常重要的环境感知任务。传统的基于深度学习方法需要大量像素级标注样本,限制了应用范围。本文提出一种基于循环生成对抗网络的道路场景语义分割方法,无需成对数据也可实现图像语义分割,降低对数据集的要求;使用L2范数和最小二乘损失方法解决训练过程中出现的模式崩溃现象,增加了训练过程的稳定性,并提高了图像分割的质量。为了验证本文方法的有效性,在常用的道路场景数据集进行实验,结果显示该方法的分割精确度有明显提高。相似文献

3.

一种侧视图的三维人脸重建方法

下载免费PDF全文

蒋玉赵杰煜陈能仑《宁波大学学报(理工版)》2016,(3):62-67

三维形变模型(3D Morphable Model, 3DMM)和从运动中恢复结构(Structure From Motion, SFM)方法被广泛用于三维人脸重建. 基于单视图进行三维人脸重建需要正视图和先验模型, 会受到计算复杂度高、容易陷入局部极小值和易受姿态变化的影响. 本文提出一种针对侧视图的三维人脸重建方法, 首先对侧视图使用改进的三维形变模型, 得到初始的三维人脸正视图及特征点; 然后根据人脸对称性, 得到侧视图对称的视图及对应的面部特征点; 最后用SFM方法将正视图、原始视图和对称视图重建, 得到稀疏三维模型. 并用不同姿态的面部图片对该方法进行了评估, 结果表明该方法比已有的方法对姿态变化更具鲁棒性. 相似文献

4.

扩展型HMM在表情识别中的应用研究

郑芳颖赵杰煜《宁波大学学报(理工版)》2008,21(1):55-61

根据表情与人脸表情特征关系,提出采用隐马尔可夫模型进行人脸表情识别;又鉴于人脸图像二维特性,提出了更具健壮性、更易处理二维数据的扩展型隐马尔可夫模型.该模型相比伪二维隐马尔可夫模型,简化了复杂度.为提高模型的识别效率,根据敏感度不一,提出多重感兴趣区域替代单一的感兴趣区域.为提高表情子库内样本的聚合度及库间样本离散度,提出相应的改进方案.首先通过人脸检测,实现表情样本采集;然后采用二维离散余弦实现图像频域转化,并结合低频数据生成特征向量;最后采用扩展型隐马尔可夫模型进行表情建模,实现表情训练与识别.实验表明：采用扩展型隐马尔可夫模型可有效识别表情,尤其是优化后的设计方案. 相似文献

5.

基于差分图像的人脸检测与跟踪研究

俞海珍史旭华《宁波大学学报(理工版)》2007,20(4):425-428

人脸检测与跟踪是人脸信息处理领域中的一项关键技术,提出了一种可通过自适应阈值分割运动区域,根据人脸几何特征验证得到人脸模板,再运用GA跟踪人脸,并且用M6215摄像头进行实时采集、定位与跟踪的新的快速有效的人脸跟踪方法.实验表明:本系统不仅跟踪速度快,还可以在人的手势变化干扰或背景有干扰的情况下,进行令人满意的人脸检测与跟踪. 相似文献

6.

基于遗传算法的人脸精确定位

廖频《南昌大学学报(理科版)》2012,36(3):286-290

提出一种基于遗传算法的人脸图象精确定位方法,作为人脸检测与人脸识别之间的一个中间优化处理过程,以解决由于人脸检测技术的定位误差导致人脸识别错误的问题。精确定位问题转化为一个在离散空间中的优化搜索问题,以遗传算法作为优化搜索方法,利用其收敛速度较快、鲁棒性强和全局寻优等优点,改进了基于身份子空间统一模型的人脸识别系统的识别效果。实验结果表明,基于遗传算法的人脸图象精确定位方法能够有效地提高人脸识别系统的识别率。相似文献

7.

3D人脸线框模型的自动调整 总被引：1，自引：0，他引：1

下载免费PDF全文

杨承根姚庆栋虞露《浙江大学学报(理学版)》2004,31(6):634-638

3D人脸线框模型是自然人脸表述的重要方法.如何将通用的模型调整到特定的人脸上涉及脸部特点的自动提取和模型的调整两个主要过程.对通过皮肤颜色分割和形态滤波得到复杂背景的视频场景中的候选人脸,用区域惯量椭圆方向进行调整并用先验人脸模板校验以找出人脸和脸部特征区域.根据人脸特征区域所具有的颜色特性和空间分布采用基于特征的人脸识别算法提取部分重要的脸部特征点,由曲线和活动轮廓模型拟合脸部特征边缘,从中提取特征点,用来估计头部姿势和作为插值结点的使用径向基函数插值,可将3D人脸线框模型自动调整到特定的人脸上. 相似文献

8.

应用于平扫CT图像肺结节检测的深度学习方法综述 总被引：1，自引：0，他引：1

下载免费PDF全文

胡伟俭陈为冯浩哲张天平朱正茂潘巧明《浙江大学学报(理学版)》2017,44(4):379-384

肺癌是一种致死率很高的癌症.通过肺部平扫CT影像检测肺结节对肺癌早期诊断、治疗意义重大.全面介绍了一种革命性的图像识别技术——深度学习方法,在肺结节检测中的应用.首先,横向对比了不同卷积神经网络的结构及其在图像识别上的效果,其次着重分析了不同深度学习方法在训练肺结节分类器上的应用,包括faster-RCNN、迁移学习、残差学习以及迁移学习.还介绍了一些可用的肺部CT影像数据集供读者参考. 相似文献

9.

基于图像深度预测的景深视频分类算法

钱立辉王斌郑云飞章佳杰李马丁于冰《浙江大学学报(理学版)》2021,48(3):282-288

景深视频因高清、美观广受大众喜爱。然而，要从海量视频中检出此类视频十分困难。已有较多研究基于景深图像成像原理，开展景深像素分割算法研究，但难以直接应用于实际视频分类场景。本文针对景深视频类型，设计了可预测视频类型的深度网络。根据景深成像原理，各语义物体之间相对相机的景深深度存在一定的逻辑关系。为此提出以图像深度为指导，利用深度预测模块预测图像的景深深度信息，将其合并后输入至分类网络进行训练检测，以降低景深视频误检率，提升网络模型的性能。此外，针对现实需求中该领域有标数据较少，而不同数据集分布会降低性能的问题，设计了迭代式景深视频数据集收集方法，以较低的劳动成本快速收集所需要的视频数据，具有一定的实际应用价值。本文算法在快手线上的景深视频数据集中识别准确率达85.7%。相似文献

10.

基于集成学习的PET/CT混合成像肺癌检测

张瑞程超沈琳琳左长京《南昌大学学报(理科版)》2022,46(6):666

提出了一种基于多模态多尺度的Mask R-CNN集成学习模型对PET/CT混合成像进行人工智能肺癌检测。首先，通过5个深度学习模型对肺癌候选区进行提取。5个深度学习模型通过对不同尺度及不同模态训练数据进行Mask R-CNN迁移学习生成。然后利用集成学习方法将5个Mask R-CNN模型进行加权投票，有效减少假阳性数量，最终实现肺癌确诊。实验数据包括69例肺癌患者及11例正常例，训练数据集包括1242个肺癌横断面；验证数据包括270个横断面，其中58个PET肺癌横断面和58个CT肺癌横断面，77个PET正常横断面和77个CT正常横断面。该方法的F-score、Precision和Recall为0.95、0.90和1,与单模型和现有方法相比，本文方法对于PET/CT混合成像的肺癌检测具有更强的有效性，可以为医生提供有意义的辅助诊断信息. 相似文献

11.

基于迁移学习的蔬菜图像识别方法

赖佩霞王晓东章联军《宁波大学学报(理工版)》2019,(5)

为解决蔬菜识别领域缺少带标签样本的问题,提出了一种基于迁移学习的图像识别方法.首先,将原始数据集利用数据增强扩大样本数据量后引入到大规模数据集上的预训练模型.针对迁移过程中高层特征的领域特定性导致的网络泛化性能差,通过加入两层自适应层参数初始化后重新训练得到基本模型;对该基本模型再利用参数冻结的迁移方式进一步调优参数,得到用于蔬菜图像识别的最终网络模型.实验表明,基于CaffeNet和ResNet10两个小型网络的迁移策略可以较好地处理小样本的蔬菜图像识别,训练得到的模型准确率分别为94.97%、96.69%.与其他迁移算法及传统的神经网络方法相比,该算法具有更高的识别性以及更强的鲁棒性. 相似文献

12.

一种基于Kohonen神经网络Web用户行为模式的挖掘方法

朱敏段隆振王靓明《南昌大学学报(理科版)》2009,33(6):1

根据Kohonen自组织特征映射神经网络中学习阶段的性质,对标准Kohonen神经网络进行了改进,通过选取不同的学习率和邻域函数,将学习阶段分为粗调整学习和微调整学习二个阶段,使Kohonen神经网络的训练速度和收敛效果有一定程度的提高,改善了聚类效果。同时在Kohonen神经网络的输出相似文献

13.

径向基神经网络模型在滇东南金矿潜力预测中的应用

下载免费PDF全文

柏坚俞乐《浙江大学学报(理学版)》2011,38(3):354-361

采用人工网络神经法（Artificial Neural Network,ANN）有助于理解成矿系统的非线性动力学行为和对矿产资源进行预测.其中的径向基神经网络（Radial Basis Function Neural Network,RBFNN）具有优秀的逼近特性,优化过程简单,训练速度快,适合于需要大量数据综合的矿产预测.采用RBFNN方法对成矿地质条件复杂的中国滇东南地区开展金矿成矿预测.研究结果表明,该模型能快速获取成矿潜力信息.通过采用受试者工作特征（Re-ceiver Operating Characteristic,ROC）曲线进行精度验证,表明该模型具有优越的预测能力. 相似文献

14.

基于并行的F-LSTM模型及其在电力通信设备故障预测中的应用

杨济海刘洋刘杰余伟李石君《武汉大学学报(理学版)》2019,(3)

电力通信网设备时序故障预测的目标是通过过去设备告警数据,预测设备在下一个时间段是否发生故障,这对设备的管理和维护起着重要作用。为了预测电力设备未来的状态,提出一种Forward-LSTM(F-LSTM)学习模型,对设备故障的时序特征和非时序特征(静态信息)进行并行训练,探索出一种新的对静态-时序数据的训练方法,将其应用在电力通信网故障预测中。F-LSTM结合了两个组件,一个学习时序特征的长短期记忆神经网络(LSTM)与一个处理静态数据的前向全连接神经网络(forward full connection neural networks,FC),数据的静态/时序属性被自动判断并传递给FC或LSTM来并行训练。对于具有同时产生动态数据与静态数据的电力通信网络,Forward-LSTM(F-LSTM)模型能以较高速度与精度预测其故障发生的位置。此外,本文采用一种加权的损失函数,可以更好地捕捉设备故障的时序规律。选取某电力通信网络系统中2016—2017年设备故障数据,对本方法进行测试。实验结果显示,与Xgboost模型相比,F-LSTM模型对故障预测的召回率提高5%,同时F-LSTM模型较LSTM模型缩减了计算量,加快了模型的训练速度。相似文献

15.

基于数据预处理深度置信网络的药物与非药物分类（英文）

禹龙牛苗田生伟孙霞李莉王梅孔军《新疆大学学报(理工版)》2018,(1)

制药工业的一个主要趋势是整合传统意义上被认为早期阶段药物发现的分子描述.为了更好的将药物和非药物分类,本文提出了基于深度信念网络(DBN)的分类模型.首先,对分子特征进行预处理以保证有价值的信息得到保留,其次,该模型将DBN和反向传播(BP)分类器结合去对药物/非药物进行检测和分类.DBN由几个受限玻尔兹曼机(RBM)层组成,当特征向量转移到下一层时这些RBM层尽可能多的保留具有重要的影响的信息.BP层训练的最后一个RBM层生成特征分类.结果表明,该方法是提取高层次特征的药物和非药物分类任务中一种成功的方法,分类精度高达85.3%,高于传统的支持向量机和神经网络方法.同时,预处理对分子特征的提取更为有效,从而在一定程度上提高了分类的准确性. 相似文献

16.

基于小波变换网络的自监督单目深度与位姿估计

乔善宝高永彬黄勃余文俊《武汉大学学报(理学版)》2023,(6):777-786

基于小波变换与运动恢复结构的自监督学习范式,将二维离散小波变换嵌入神经网络并实现梯度传播,提出了一种新的单目深度与位姿估计算法。传统的神经网络在降采样过程中会造成信息丢失,且丢失的信息在后续阶段无法复原,对于深度估计任务,结构信息的丢失会降低模型性能。本文使用二维离散小波变换层替代传统的降采样操作,更好地保留图像中的结构细节并避免噪声累积。在上采样解码深度图的阶段,采用小波逆变换层取代传统的插值上采样方法,更有效地恢复图像信息,得到更精确的深度图。提出的算法相比传统的神经网络对噪声更有鲁棒性。在KITTI数据集上进行实验,证明了所提出的算法在自监督单目深度与位姿估计任务中有优异的性能表现。相似文献

17.

基于生成对抗网络的图像艺术风格迁移

董伟赵杰煜《宁波大学学报(理工版)》2019,(5)

提出了一种新颖的图像艺术风格化算法,利用结构相似性指数和最小二乘生成对抗网络,搭建图像艺术风格化模型.通过对模型生成器和判别器的对抗训练以及重建约束,该模型可以生成一幅逼真的风格化作品.根据在人脸肖像素描sketch-photo数据集和中国水墨画风格beihong-photo数据集实验表明,与目前流行的DualGAN算法、Cycle GAN算法、Pix2Pix算法和GAN算法相比,本文提出的方法具有更好的风格化效果. 相似文献

18.

吞水音信号的数字特征提取与识别

薛鲁华《南昌大学学报(理科版)》1992,16(2):1

本文介绍了提取吞水音信号的数字特征,利用统计模式识别的方法对数字特征进行分析选择。获得分类能力较强的特征。用这些特征形成训练集,设计了多级二分类的Ficher线性分类器和最小错误概率Bayes分类器,并对这两种分类器进行比较。用Baycs分类器对正常人(N类)、炎症病人(I类)、相似文献

19.

基于图卷积神经网络的软件缺陷分派方法

《武汉大学学报(理学版)》2020,(3)

软件缺陷的高效自动分派是保障开源软件质量的重要手段。已有研究多基于机器学习技术,从缺陷报告的文本内容和开发者之间的关系入手,研究软件缺陷的自动分派,而对缺陷报告之间的相关关系和基于深度学习技术的缺陷自动分派关注甚少。针对此问题,本文提出了一种基于图卷积神经网络的开发者推荐方法。该方法利用带权重的余弦相似度构建缺陷报告网络,再在增量学习方法下训练图卷积神经网络模型用于开发者推荐。将近年提出的3种方法设置为实验对照组,在大型开源软件项目Eclipse和Mozilla数据集平台上分别进行实验,结果表明本文提出的方法平均推荐准确率比其他3种方法最高提升了60%和70%左右。相似文献

20.

融合遥感与社会感知数据的城市土地利用分类方法

吴郁文林杰《浙江大学学报(理学版)》2023,50(1):83-95

传统的土地利用分类方法大多基于对资料或影像的人工解译,存在一定的局限性。近年来,结合空间大数据和自然语言处理技术进行低成本快速的土地资源管理已成为研究热点。以美国纽约市曼哈顿区为例,提出了融合遥感影像和社会感知数据的城市土地利用分类方法。从遥感影像中提取光谱特征、从推特数据中提取用户活动时空和主题特征,基于随机森林法和深度神经网络法,构建了细粒度的城市土地利用分类模型。通过对比不同特征组合分类方法的精度,得到结合光谱特征和用户活动时空、主题特征的深度神经网络方法的结果最优,总体精度达82.65%,Kappa系数为70.1%。结果表明,社会感知数据中隐含的用户活动时空模式和活动主题信息均有助于提高城市土地利用分类的精度,而神经网络法可有效融合多源数据,为快速、低成本获取城市土地利用信息提供了新的途径。相似文献