排序方式: 共有19条查询结果,搜索用时 265 毫秒
1.
针对捕获手语动作的全局特征和局部特征以及保留图像中原有的结构和捕获上下文联系,提出了一种改进的卷积多层感知机鄄自注意力(CM-Transformer)方法用于连续手语识别。 CM-Transformer 将卷积层的结构一致性优势与自注意力模型编码器的全局建模性能相结合,以捕获长期的序列依赖。 同时将自注意力模型前馈层替换为多层感知机,以发挥其平移不变性和局部性。 使用随机帧丢弃和随机梯度停止技术,减少时间和空间上的训练计算量,防止过拟合,由此构建一种高效计算的轻量级网络;最后使用连接主义时间分类解码器对输入和输出序列对齐,得到最终的识别结果。 在两个大型基准数据集上的实验结果表明了所提方法的有效性。 相似文献
2.
一种非线性约束优化的微粒群新算法 总被引:7,自引:1,他引:7
通过对标准微粒群算法(PSO)改进,采用动态罚函数的方法,提出了一种求解非线性约束优化问题的新算法.由于使用了一种新的适应度函数,该算法具有很强的全局寻优能力. 相似文献
3.
多智能体系统混合智能学习算法研究 总被引:5,自引:0,他引:5
针对Agent个体学习与群体学习各自的不足,探讨了多智能体系统(MAS)中的合作与协商及Agent学习技术,提出了一种新的混合智能学习算法.将个体学习与群体学习有效结合起来,提高了Agent的个体性能及系统整体的智能水平.在足球机器人仿真系统中进行了实验,结果表明了算法的可行性与有效性. 相似文献
4.
5.
针对常用的基于视点位置进行地形分块调度方法存在可视窗口固定、调度范围和时机不能根据视点运动特点进行调整而导致内存利用率低的问题,提出一种基于运动估算的地形分块调度方法.以数据密度为标准进行多分辨率地形划分,结合四叉树和二维矩阵对地形分块建立空间索引,重点研究以视点位置、视线方向、视点运动向量和地形分块数据量为参数的调度方法;通过计算预加载区域和卸载区域的地形分块,实时更新其调度范围和调度时机.实验结果表明,与基于视点位置的方法相比,该方法平均能提高3~4倍左右的内存有效数据比例和绘制帧速. 相似文献
6.
医学影像报告的自动生成可以减轻医生的工作强度,减少误诊或漏诊的情况发生。由于医学影像的独特性,通常病灶比较小,与正常区域灰度差异难以分辨,导致文本生成时关键词的缺失,报告不够准确。对此提出一种面向医学影像报告生成的门归一化编解码网络,通过门控通道变换单元优化视觉特征提取,加强特征间的差异,自动筛选关键特征;提出门归一化算法,沿通道维度整合上下文信息,在浅层网络激活、深层网络抑制通道间神经元活性,过滤无效特征,使文本和视觉语义充分交互,提高报告生成质量。在2种广泛使用的基准数据集IU X-Ray和MIMIC-CXR上的试验结果表明,模型能够取得先进的性能,生成的影像报告也具有更好的视觉语义一致性。 相似文献
7.
基于体的可视外壳重建不需要复杂的几何计算,易于实现,但其精度和效率仍不理想。提出一种基于统一计算架构(CUDA)和行进立方体(MC)的体素可视外壳并行优化建模方法,将体素相交判断和等值面抽取过程并行分解,利用CUDA的内核多线程机制加速建模;在MC网格化阶段,提取准确交点并消除冗余边计算;利用像素着色器实现混合权重的纹理映射,提高模型精度。在多摄像机采集装置DreamWorld上的实验结果表明,本文方法能够对多个动态物体进行实时准确的3维建模。 相似文献
8.
9.
10.