首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 265 毫秒
1.
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。  相似文献   

2.
已有的睡眠分期研究大部分采用监督学习的方法,其模型训练高度依赖于大量优质的标签数据,所提取的特征也较为粗糙。为此,提出了将半监督学习应用于分组卷积神经网络的睡眠分期方法。首先,采用分组残差卷积网络作为骨干网络,使不同分组学习的特征多样化,让整个网络关注来自不同子空间的信息,从而提取多角度特征; 其次,为减少标注技师的工作负担,采用半监督学习的方法,从大量未标注数据中提取特征与标注数据提取的特征进行对抗,以获得更多细粒度特征。实验结果表明,在Sleep-EDFx数据集上的睡眠分期准确率能够达到0.837±0.001,卡帕系数达到0.774±0.002,均优于对比算法。  相似文献   

3.
为了快速、准确地标注大型图像数据集中的图片,提出了一种利用图像分割和基于kNN(k-nearest neighbor)图的半监督学习来标注图像的算法.该算法先将图像分割为若干个局部区域,使用局部敏感的哈希表来构建图像局部区域的kNN图,并基于图像局部区域的kNN图来构建原始图像的kNN图,利用基于图的半监督标签传递算法来标注未标注的图像.在具有269 648张图像的大型图像数据集NUS-WIDE和具有5 000张图像的Corel数据集上的实验结果表明,该算法能获得较快的标注速度和标注精度.  相似文献   

4.
岩石薄片图像的分析往往依赖于专业人员在显微镜下观察并给出鉴定结果,不但费时费力,并且受设备限制影响较大。近些年,针对于薄片图像的自动识别方法已经被提出,然而这些方法大多采用监督学习与深度学习相结合的方式,进而受限于大量人工标注,为方法的推广与应用带来了巨大困难。此外模型在不同的地层、岩性等目标应用时,其泛化性也因此受到极大限制。本文针对该问题提出了一种超像素算法SLIC与半监督自训练结合的方法,仅依靠6%的人工标注便能够实现岩石图像的自动化分割与组分识别,极大的增强该方法在实际应用中的价值。该方法首先使用超像素算法SLIC对岩石图像进行预分割,随后基于分割片的颜色特征进行粗合并,并根据最小外接矩形进行切割;切割下来的岩石组分分割图像作为后续处理的基础数据集,这里仅需要人工标注6%的岩石组分数据;随后这些数据通过一个改进的半监督自训练方法,以改进的VGG16模型作为主模型、ResNet18模型作为评判模型,不断生成高置信度的伪标签,利用迭代优化调整,将其扩展到整个数据集,最终获得一个具有较高的稳定性、准确性以及一致性的组分识别模型。通过实际数据的测试与分析,本文所提出SLIC和半监督自训练结合的方法,对6类岩石组分的识别准确率可达到96%。该方法能够在数据差异不大的条件下,帮助用户基本实现自动化的组分识别。而当数据集产生较大差异时,仅需标注少量部分样品即可实现自动的组分识别。通过理论验证与实际数据测试,本方法具有较高的泛化性和可靠性,能够在实际应用提供足够的准确性与便利性。  相似文献   

5.
针对全断面隧道掘进机的传送带上岩碴片重叠造成的图像分割不准确问题,提出一种基于深度学习的密集岩碴片图像分割方法.该方法将原图像做预处理,标注并制作岩碴片图像数据集;改进U-Net模型的结构,通过深度监督以及新的混合损失函数优化模型学习分割表示的能力;训练改进后的模型分割图像,利用OpenCV获取面积与长、短轴等参数;与...  相似文献   

6.
针对Web图像标注问题,提出一种基于深度半监督跨模态学习的Web图像标注方法。该方法引入了堆栈式自编码网络(SAE)作为整体训练框架中的基分类器,首先,在有标签数据集上分别基于图像和文本训练得到各自的分类器,接着,通过多模态融合方法对图像和文本分类器进行融合得到一个多模态分类器,并利用该分类器预测出无标签的样本数据的类别标签,最后,将预测标签加入到原始数据集中,共同基于图像进行训练,得到一个单模态图像分类器,该分类器能够预测不含任何其它模态信息的单一图片数据的语义。实验结果表明,该方法有效地提高了图像标注效果且优于传统图像标注方法。  相似文献   

7.
针对当前图像多标签标注方法只能标注图像内容信息(本体),而不能同时标注图像寓意信息(隐义)的问题,提出了一种基于多任务学习的双层多标签标注模型(MTL-DMAM).首先将图像的本体标注和隐义标注视为两个关联任务,以ResNeXt-50作为共享特征的主干网络,然后利用注意力机制分别为每个任务构建一个分支结构,实现了图像双层标注,同时为消除图像内各物体大小差异对标注结果的影响,在模型中加入ELASTIC结构,进一步提高了模型性能.在对比实验中,本文模型在单任务MS-COCO数据集和多任务传统服饰数据集上优于其他同类模型.最后,利用Grad-cam方法可视化模型MTL-DMAM在标注时重点关注的图像区域,实验结果表明本文模型能有效学习标签对应的图像显著特征.  相似文献   

8.
为缓解基于半监督学习的水面目标检测对有限标注样本过拟合的问题,提高无标注样本中目标提取的有效性,提出了基于多视图交叉一致性学习的半监督水面目标检测算法。首先,该算法通过数据增强的方式为训练样本生成不同的视图以丰富数据集的多样性;然后,利用所提出的多视图目标判别器为无标注样本在线生成伪标签,有助于提取无标注样本的有效信息;最后,利用所提出的多视图交叉一致性学习使同一目标实例的不同视图的输出实现交叉一致性正则化,以促进检测模型学习判别性的特征从而降低过拟合的风险。在海上和内河数据集上的实验结果表明:文中所提算法能够提高特征提取的判别性,对多类别的水面目标检测精度达到91.0%,比全监督检测算法提高了18.7%,比其他半监督检测算法提高了3.8%以上;在检测速度上,该算法达到13.1帧/s,基本满足实时性要求。所提算法通过多视图交叉一致性学习提高特征的判别性和缓解检测模型的过拟合风险,有助于提高半监督水面目标检测的性能。  相似文献   

9.
针对现有商标特征提取方法无法有效捕捉重点区域的关键信息和图像标注成本过高的问题,提出一种基于注意力机制的无监督商标检索方法。该方法基于实例区分算法,将注意力模块同时运用在神经网络特征映射层的空间维度和通道维度上,通过对各个通道进行权重的分配以及对空间变换参数的学习,增强无监督网络的特征表达能力。该方法在公开的商标数据集上进行了验证,实验表明检索效果优于传统的商标检索方法,甚至优于一些有监督商标检索方法。  相似文献   

10.
提出面向水下场景的图像语义分割网络,考虑到速度和准确度之间的权衡问题,网络采用轻量且高效的编解码器结构.在编码器部分,设计倒置瓶颈层和金字塔池化模块,高效地提取特征.在解码器部分,构建特征融合模块融合多水平特征,提升了分割的准确度.针对水下图像边缘模糊的问题,使用辅助的边缘损失函数来更好地训练网络,通过语义边界的监督细化分割的边缘.在水下语义分割数据集SUIM上的实验数据表明,对于320像素×256像素的输入图像,该网络在NVIDIA GeForce GTX 1080Ti显卡上的推理速度达到258.94帧/s,mIoU达到53.55%,能够在保证高准确度的同时,达到实时的处理速度.  相似文献   

11.
针对无监督的主题模型无法对图像主题进行类别标记、有监督主题模型中类别信息的标记繁琐且受主观因素影响的问题,提出了一种半监督主题模型。提取图像中与位置无关的局部特征,用尺度不变特征变换对特征进行描述,用词袋模型将人脸图像表示成一组视觉单词的集合;在基于隐含狄利克雷分配(latent Dirichlet allocation, LDA)方法中的主题-单词层分布上引入少量的类别标记指导未标记样本的分类的基础上提出半监督隐含狄利克雷分配方法。在多姿态人脸判别任务上的测试结果表明该算法比无监督LDA算法分类率高9.0%~24.7%;对于部分遮挡人脸图像、未对齐的人脸图像的分类率比多姿态主成分分析法分别提高8.8%和21.5%~39.8%。结果表明该方法在少量样本标记的情况下,性能逼近有监督的隐含狄利克雷分配方法,且适用于其它图像分类问题。  相似文献   

12.
目的 为提取有效的鉴别特征和降低鉴别向量的维数来识别人脸表情图像.方法 将流行学习(Manifold leaming,ML)和半监督学习(Semi-Supervised leaming,SSL)结合起来,利用人脸表情图像数据本身的非线性流形结构信息和部分标签信息来调整点与点之间的距离形成距离矩阵,而后基于被调整的距离矩阵进行线性近邻重建来实现维数约简,提取低维鉴别特征用于人脸表情识别.结果 该方法 能充分利用数据的结构信息和有限的标签信息,使具有标签信息的同类样本之间的距离最小化,不同类数据之间的距离最大化,进而可以有效地提取数据的低维鉴别子流形,使得分类性能要优于非监督的雏数约简方法 .结论 笔者提出的半监督局部线性嵌入算法能有效地提高人脸表情识别的性能.  相似文献   

13.
针对传统服饰图像分割中标签易混淆和小目标易丢失带来的目标边缘细节难以保留等问题,提出了一种基于卷积注意力特征的残差期望最大化注意力语义分割网络模型。该模型首先以ResNeXt-50作为共享特征的主干网络,并通过在特征提取阶段引入一组平行的卷积注意力模块,可以有效地抑制无效特征,使目标区域的特征更加显著。然后利用残差思想对期望最大化注意力(EMA)单元进行优化,以解决迭代过程中梯度爆炸或者消失的问题,从而更好地建立特征图中位置间的关联,最终实现基于显著性融合学习的语义分割模型。最后在传统民族服饰数据集上通过定性与定量的实验验证了所提模型的有效性,其中平均交并比分割指标达到83.91%,取得了同类算法中最优效果。  相似文献   

14.
针对传统K-means聚类彩色图像分割方法需要人为设定初始分割类别数目、易受噪声干扰等缺陷,提出一种多方法融合非监督彩色图像分割算法。该算法对原始图像进行光谱信息增强处理以提高图像信息提取效率,对K-means聚类引入戴维森堡丁指数(Davies-Bouldin index, DBI)自动化确定最佳分割类别数目,通过图像聚类分析并进行像素标签标记,并结合高斯马尔科夫随机场(Gauss-Markov random field, GMRF)理论对标记图像进行分割,最后使用形态学算子进行后处理完成分割操作。试验结果表明。本研究方法具有一定的鲁棒性,且分割效果更接近真实性。通过对分割结果进行量化评价,进一步说明本研究方法在分割精度和准确性方面更具优势。  相似文献   

15.
一种基于Gaussian-Hermite矩的SAR图像分割方法   总被引:1,自引:0,他引:1  
图像分割在SAR图像处理中具有很重要的意义。文中提出了一种基于Gaussian-Hermite矩的SAR图像分割方法。该方法针对合成孔径雷达(SAR)图像斑点噪声对现有分割方法带来的影响,利用Gaussian-Hermite矩的不同阶矩并结合SAR图像特征将目标从含噪背景中分割出来。实验部分同时采用了仿真数据和实测SAR数据,通过与小波能量等4种方法的分割结果进行比较,显示出了该方法的有效性。  相似文献   

16.
针对乳腺超声图像分类中的标签噪音问题,该文设计了一种协作标签修正网络(COLC-Net)。该方法基于乳腺超声BI-RADS评级噪音分布特点,为乳腺超声图像定义了软标签,并设计了双网络协作训练,以蒸馏优秀知识修正软标签。随着软标签准确性的增加,可以降低噪音标签负作用,并增强准确标签知识的学习。与现有最新方法进行比较,结果证实了该方法具有更好的效果。  相似文献   

17.
针对腹部CT医学图像中结肠组织自身局部特征的问题,研究了一种基于交互式Graph Cuts结肠组织的分割方法。首先人工标定一部分体素标记为"目标"和"背景"种子点。然后将图像映射成网络图,通过相邻像素间的灰度特征分配边的权重值,采用26邻域系统实现三维图像的分割。最后使用最大流/最小割方法最小化能量函数,得到结肠区域。实验结果表明,交互式的图割算法能够准确地从三维腹部CT医学图像中提取出结肠组织,体现了结肠数据的局部特征。算法能自动将所有腹部CT切片的结肠组织分割出来,实验获得的结果有利于结肠病变的发现和精确定位。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号