排序方式: 共有31条查询结果,搜索用时 15 毫秒
1.
PTZ视频监控的大场景形成方法研究 总被引:1,自引:0,他引:1
针对PTZ摄像机跟踪监控系统,提出一种基于关键帧和Speeded Up Robust Features(SURF)特征的图像拼接方法,以构建大的监控场景.利用局部梯度极值平均法对监控视频各帧的清晰度进行评价,剔除模糊帧,选择若干清晰帧作为关键帧进行拼接,以提高大场景的形成速度和准确度.对于图像拼接,采用效果近似于Sca... 相似文献
2.
融合场景及交互性特征的多人行为识别 总被引:1,自引:0,他引:1
人类的行为复杂多样,场景、外观、位置等信息均与行为息息相关.本文针对如何高效地综合利用这些信息的问题,提出了融合场景及交互性特征的多人行为识别方法,使用双通道的方式分别提取个体外观特征与场景特征.对于个体通道,采用注意力机制模块来关注与行为相关度更大的区域,并将提取的个体外观特征结合位置特征输入图卷积网络进行关系推理.其中,图卷积网络采用了余弦相似度的方法度量个体特征之间的相关性,并结合个体之间的位置特征进行关系推理;对于场景通道,使用在place365数据集上预训练的ResNet 50提取场景特征.最后,本文将个体以及场景通道所得的特征进行加权融合,得到群组以及所有个体的行为识别结果.在Collective Activity Dataset(CAD)数据集上的实验表明,该方法能提高行为识别的准确率,群组行为以及个体行为的准确率分别达到了92.29%与78.19%. 相似文献
3.
情绪识别作为计算机视觉的一项基本课题已经取得很大进展,然而在无约束自然场景中的情绪识别仍具挑战性.现有方法主要是利用人脸、姿态以及场景信息识别情绪,但是忽略了人物个体在场景中的不确定性,以及不能很好地挖掘场景中的情绪线索.针对现有研究存在的问题,提出了基于人物与场景线索的双分支网络结构,两个分支独立学习,通过早期融合得到情绪分类结果.对于人物在场景中的不确定性,引入身体注意力机制预判人物情绪置信度进而获得人体的特征表示,场景中引入空间注意力机制和特征金字塔以便充分获得场景中不同粒度的情绪线索.实验结果表明,此方法有效融合人物与场景信息,在EMOTIC数据集下能够明显提高情绪识别率. 相似文献
4.
介绍了视频芯片CX2388x的主要性能特点,分析了应用DriverStudio编写WDM驱动程序的优势,采用DriverStudio+VisualC++的开发方式实现了基于CX2388x的PCI图像采集卡的驱动。 相似文献
5.
针对统计特征函数和传统的球面调和函数不能有效刻画岩心三维模型形态特征的问题,提出了一种岩心球面调和函数.首先将三维岩心分解成同心球模型,并根据同心球的不同半径得到一系列的球面函数.然后对生成的球面函数进行调和分析获得形态特征描述子.最后通过相似性判定函数比较形态特征描述子获得不同岩心三维模型的形态相似性.利用多组砂岩岩心样本进行了比较实验,结果表明新算法能够有效描述岩心三维模型的形态特征,并且比统计特征函数和传统的球面调和函数具有更为准确的刻画能力. 相似文献
6.
针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。 相似文献
7.
JPEG压缩编码在DM642平台上的实现及优化 总被引:2,自引:2,他引:0
结合TMS320DM642处理器VP口视频采集原理和JPEG压缩编码原理,研究了在TMS320DM642处理器平台上实现图像采集和JPEG压缩编码的具体方法.以此为基础,深入探索了JPEG压缩编码在TMS320DM642处理器平台上的优化,并提出了基于DCT系数低通滤波原理的JPEG压缩编码优化算法,最后对优化结果做出了数值分析.分析结果表明,该算法不仅保证了图像的质量,而且提高了JPEG压缩编码的速度和效率. 相似文献
8.
基于TI DM642硬件平台,设计了运动目标快速检测与跟踪算法.首先改进了Running Average 背景实时更新建模的方法,消除了原有算法背景更新时产生的运动目标重影.采用背景差分方法检测运动目标,速度较快.使用Otsu算法自适应求取最佳二值分割阈值分割目标,提高检测精度.在此基础上,提出了一种快速的运动目标形状中心线性预测算法,估计运动目标中心,再结合MCD(Maximum Close Distance)高精度模板匹配,进行目标的精确定位. 相似文献
9.
在分布式视频编码中,准确的相关噪声模型(correlaiton noise model,CNM)是影响系统的关键因素。通过研究变换域中WZ帧与相应边信息的残差系数的分布关系,发现实际的残差分布与拉普拉斯分布模型存在一定的偏差。通过分析相关噪声模型的特性,提出相关改进算法。即根据残差系数的大小与实际概率置信度的关系,采用不同的分布参数,使得改进后的拉普拉分布模型更接近实际的残差分布。实验结果表明,该优化算法有效提高了系统的率失真性能,不仅降低了系统解码的码率,同时提升了最小均方误差(minimun mean square error,MMSE)重建的质量。 相似文献
10.
对于基于高光谱图像的植被分类,利用三维卷积神经网络和空谱结合可以取得良好的效果。但存在计算代价大、参数过多容易过拟合等问题。基于此,设计了一种三维卷积与二维卷积相结合的深度网络,通过数据分块的思想减小了计算量;并提出了一种融合植被指数的特征提取方法,改善了现阶段因高光谱图像样本数量少、光谱层间信息相关度高,造成的容易过拟合的问题。在植物园数据集、IP数据集和PU数据集上的实验结果表明该算法以较低的计算复杂度取得了出色的分类效果,具有较好的应用价值。 相似文献