共查询到19条相似文献,搜索用时 171 毫秒
1.
2.
结合兴趣点和边缘的建筑物和物体识别方法 总被引:1,自引:0,他引:1
提出了多种图像特征相结合的建筑物和物体识别方法.使用尺度不变特征描述器描述的Harris-Laplace兴趣点以及边缘颜色直方图描述的边缘特征表示图像.边缘和兴趣点包含图像的重要信息.对2种特征的抽取同时进行:基于Harris检测器可以直接得到边缘特征;在多个尺度下进行Harris兴趣点检测,利用Laplace公式得到Harris-Laplace兴趣点.进行物体识别时,根据兴趣点的数目自适应地改变兴趣点和边缘特征的相似性权重.与同类方法相比较表明,该方法具有更高的识别正确率,在视点变化、光照条件变化等情况下具有较好的性能. 相似文献
3.
研究三维物体识别问题,摄像机从不同角度拍摄三维物体,获取的三维物体图像变化比较大,传统方法采用单一特征或简单多特征难以正确描述三维物体,导致三维物体识别的准确率较低.为了提高三维物体识别准确率,提出一种多特征和支持向量机相融合的三维物体识别方法.首先分别提取三维物体的颜色特征、纹理特征和不变矩特征,然后采用主成分分析消除各特征间的冗余信息,最后采用支持向量机建立三维物体识别模型.采用三维物体图像数据库COIL-100进行测试实验,结果表明,相对于传统识别方法,改进方法不仅提高了三维物体识别准确率,同时加快识别速度,为三维物体识别提供了一种新的识别方法. 相似文献
4.
5.
三维点云数据通常具备无序排列的结构。在三维点云数据处理领域,深度学习模型通常会利用最大池化等对称操作来处理点云的排列不变性。最大池化方法一方面会破坏点云的信息结构,使得局部信息与全局信息难以交互。另一方面,最大池化方法对点云信息过度压缩,得到的特征对局部细节描述不足。针对上述问题,提出了AttentionPointNet的网络结构。该网络利用注意力机制,使每个点与点云其余部分进行特征交互,实现了局部与全局信息的综合。为降低最大池化造成的信息损失,提出了一种稀疏卷积方法来替代池化操作。这种方法利用大步长的稀疏卷积实现全局信息的提取。在ModelNet40数据集上,AttentionPointNet取得了87.2%的准确率。不使用池化层,完全采用卷积层实现的模型取得了86.2%的分类准确率。 相似文献
6.
7.
童莹 《计算机工程与设计》2014,(11):3918-3922,3979
传统HOG特征是一种有效的图像边缘信息描述符,但它忽略了局部特征之间的空间排列信息,针对此缺点,提出空间多尺度HOG模型。逐层将图像细化分成一系列不同尺度的子区域;采用改进HOG算子分别计算各个子区域的梯度方向直方图,按层按顺序将其连接,得到整幅图像的“空间多尺度”HOG特征。在JAFFE数据库上的实验结果表明,该算法在识别效果和运行时间方面优于HOG、LBP、Gabor等传统特征描述子,通过多尺度梯度方向准确描述了面部肌肉褶皱变化所蕴含的表情信息,是一种更有效的表情特征描述子。 相似文献
8.
提出一种新的基于局部描述符的点云物体识别算法。算法根据点云的位置信息提取出邻域以及曲率信息,进而得到形状索引信息。根据形状索引提取到特征点,在每个特征点根据样条拟合原理得到测地距离和矢量夹角分割曲面得到曲面片集。每个曲面片的等距测地线构成了曲面片指纹,通过矢量和半径的变化描述,可以把每个模型物体得到的曲面片集描述存入数据库。对于给定的一个物体,根据上面步骤同样得到其曲面片集描述,通过和数据库中模型物体曲面片集的比对,得到初始识别结果。对每对初始识别结果进行对应滤波后,通过最近点迭代方法得到最终的识别结果。最后通过具体的实验说明了算法的有效性和高效性。 相似文献
9.
提出一种基于特征点LBP信息的表情识别方法。在分析了表情识别中的LBP特征之后,选择含有丰富表情信息的上半脸眼部周围和下半脸嘴部周围的特征点,计算每个特征点邻域的LBP信息作为表情特征进行表情识别。实验表明,基于特征点LBP信息的方法不需要对人脸进行预配准,较传统的LBP特征更有利于表情识别的实现。 相似文献
10.
11.
12.
13.
14.
为了获得更好的面部表情特征,提出了一种融合离散余弦变换(Discrete Cosine Transform,DCT)特征和局部二值模式(Local Binary Pattern,LBP)特征的表情特征提取方法。该方法将人脸图像经过DCT后所获得的低频系数作为表情的整体特征;通过对人脸图像进行分块,计算每个子块的LBP直方图,将这些LBP直方图连接起来形成LBP特征,对该LBP特征使用拉普拉斯特征映射(Laplacian Eigenmaps,LE)降维后得到表情的局部特征。将得到的整体特征和局部特征进行加权融合,使用最近邻分类器进行分类。在JAFFE和Cohn-Kanade表情库上的实验结果表明,该方法比单独使用LBP或者DCT特征,具有更好的效果。 相似文献
15.
基于粒子滤波与稀疏表达的目标跟踪方法 总被引:1,自引:0,他引:1
针对视频序列图像目标跟踪中的光照变化问题,提出一种在粒子滤波器框架内,基于目标的局部二元模式(LBP)纹理特征,使用稀疏表达进行目标跟踪的方法。当前帧的跟踪粒子由前一帧的跟踪结果按高斯分布来生成。通过解l1正则化最小二乘方问题,获得每个粒子对应于模板子空间的稀疏表达,确定当前帧图像中的跟踪目标。然后使用粒子滤波器生成下一帧跟踪的粒子分布。在跟踪过程中采用新的动态模板更新策略更新模板空间中的模板。实验结果证明该方法的有效性和先进性。 相似文献
16.
基于多模态融合的人体动作识别技术被广泛研究与应用,其中基于特征级或决策级的融合是在单一级别阶段下进行的,无法将真正的语义信息从数据映射到分类器。提出一种多级多模态融合的人体动作识别方法,使其更适应实际的应用场景。在输入端将深度数据转换为深度运动投影图,并将惯性数据转换成信号图像,通过局部三值模式分别对深度运动图和信号图像进行处理,使每个输入模态进一步转化为多模态。将所有的模态通过卷积神经网络训练进行提取特征,并把提取到的特征通过判别相关分析进行特征级融合。利用判别相关分析最大限度地提高两个特征集中对应特征的相关性,同时消除每个特征集中不同类之间的特征相关性,将融合后的特征作为多类支持向量机的输入进行人体动作识别。在UTD-MHAD和UTD Kinect V2 MHAD两个多模态数据集上的实验结果表明,多级多模态融合框架在两个数据集上的识别精度分别达到99.8%和99.9%,具有较高的识别准确率。 相似文献
17.
为了充分利用RGB-D图像的深度图像信息,提出了基于张量分解的物体识别方法。首先将RGB-D图像构造成一个四阶张量,然后将该四阶张量分解为一个核心张量和四个因子矩阵,再利用相应的因子矩阵将原张量进行投影,获得融合后的RGB-D数据,最后输入到卷积神经网络中进行识别。RGB-D数据集中三组相似物体的识别结果表明,利用张量分解融合RGB-D图像的物体识别准确率高于未采用张量分解的物体识别准确率,并且单一错分实例的准确率最高可提升99%。 相似文献
18.
手势识别除了为触屏智能设备提供人机交互,还可以成为一种新的用户信息收集方式,用以优化基于个人移动终端的购物推荐系统。文章在现有研究基础之上,讨论了手势识别数据用于收集用户兴趣点信息的可能性和有效性,并以智能手机为例,用两个小样本的实验进行验证,为进一步研究奠定了基础。 相似文献