排序方式: 共有16条查询结果,搜索用时 0 毫秒
1.
2.
3.
4.
传统胶囊网络(CapsNet)在计算时使用的动态路由算法需要多次迭代,针对这一问题,文章提出一种基于谱聚类的胶囊网络模型(Spectral Clustering Capsule Network,SC-Caps)并将其应用于文本分类任务.这种模型首先使用卷积层对文本进行特征提取,在初级胶囊层将提取的标量特征转化为向量特征,再利用谱聚类算法将高维的向量特征转化为较低维的子向量特征,并在卷积胶囊层学习局部与全局之间的关系映射.在搜狗语料库SougoCA进行实验,结果与LSTM、C-LSTM以及采用其他路由方法的胶囊网络进行比较,证明该算法有效提高了文本分类的分类效果. 相似文献
5.
提出了一种以Unet++为基础的卷积神经网络,适用于人群密度估计。该网络的优点是用并行连接的方式进行多尺度融合结合浅层网络的细节信息和深层网络的高阶语义信息来消除两者之间过大的语义鸿沟。此外,还引入了膨胀卷积来提高网络性能。在Shanghai Tech和UCF_CC_50两个通用人群密度估计数据集上进行实验选取平均绝对误差(MAE)和均方误差(MSE)作为评价指标。实验结果表明在这两个数据集上该网络均有效降低了MAE和MSE,说明其在人群密度估计方面有较好的准确度和鲁棒性。 相似文献
6.
在数字芯片后端设计中,全局布局需要同时兼顾线长与合法化,是一个组合优化问题。传统的退火算法或者遗传算法耗时且容易陷入局部最优,目前强化学习的解决方案也很少利用布局的整体视觉信息。为此,提出一种融合视觉信息的强化学习方法实现端到端的全局布局。在全局布局中,将电路网表信息映射为多个图像级特征,采用卷积神经网络(convolutional neural network, CNN)和图卷积网络(graph convolutional network, GCN)将图像特征和网表信息相融合,设计了一整套策略网络和价值网络,实现对全局布局的全面分析和优化。在ISPD2005基准电路上进行实验,结果证明设计的网络收敛速度加快7倍左右,布局线长减少10%~32%,重叠率为0%,可为数字芯片全局布局任务提供高效合理的方案。 相似文献
7.
可视媒体中的基于学习的三维人体运动分析是计算机视觉领域中非常有挑战性的课题.本文在Gauss动态隐变量模型与共享隐结构的基础上,给出一种新的共享动态隐变量模型用于三维人体运动跟踪.该模型针对高维非线性动态系统,可以计算出高维状态向量和高维观测向量的共享动态低维隐变量,同时也能计算出隐变量对高维状态向量、高维观测向量的双向映射、以及隐变量自身的动态关系.使用该模型可以将传统的高维人体运动估计分层为先估计低维隐变量状态,再重建高维人体运动.在实验结果中,用仿真图像序列与真实图像序列证明了方法的有效性. 相似文献
8.
针对现实场景图片中的文字区域具有仿射变换和多方向的问题,设计了一种带有仿射变换锚点,能够生成仿射变换文本预测框的文本检测网络。按照常见文字实例的仿真变换形状,给定了6种固定角度和5个固定变换量。检测过程中对预测候选框的角度和偏移值进行了调整拟合,最后对边框进行了回归,让检测结果更适应真实文字区域的边界框。与以往的文字检测网络相比,该检测方法能够有效适应文字区域,在检测精度和平均指标上分别有了7%和10%的提升。 相似文献
9.
由于自然场景中的图像背景复杂、文字排列不规则、光照条件不确定等因素文字检测难度较大,且传统检测方法的效果并不理想。在研究文字分割检测方法PSENet(Progressive Scale Expansion Network)的基础上,提出了一种针对自然场景文字检测的改进方法。该方法由卷积神经网络提取特征模块,再通过渐进式规模扩张对文字区域进行分割检测。改进点主要是使用高精度的语义分割网络RefineNet(Refinement Network)对卷积网络特征提取模块进行优化,且增加较多的残差连接及链式池化,提高网络对文字区域的检测精度。通过对数据集ICDAR2015的实验结果对比表明所提出的改进算法在精度方面略高于改进前,且能更好地解决文字粘连问题。 相似文献
10.