期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Robust Video Text Detection with Morphological Filtering Enhanced MSER

诸葛云志卢湖川《计算机科学技术学报》2015,(2)

Video text detection is a challenging problem, since video image background is generally complex and its subtitles often have the problems of color bleeding, fuzzy boundaries and low contrast due to vi... 相似文献

2.

基于ML-pLSA模型的目标识别算法 总被引：1，自引：0，他引：1

陈琳卢湖川《电子与信息学报》2011,33(12):2909-2915

为了避免图像目标识别过程中识别结果对分割结果的过度依赖,该文提出了一种基于多尺度的概率潜在语义分析目标识别方法(Multi-Level-probabilistic Latent Semantic Analysis, ML-pLSA)。该方法利用多种分割算法对图像进行多尺度分割,再利用pLSA算法和词袋方法(Bag Of Words, BOW)对分割区域进行目标类别估计,最后联合多尺度的估计值给出最终分割结果。在目标尺度、目标角度、外界光照变化都相对较大的GRAZ-02数据库上进行实验,结果表明：与传统目标识别算法相比,该方法鲁棒性更强;在识别准确率方面,也有了很大的提高,取得了很好的效果。相似文献

3.

目标跟踪算法综述

卢湖川李佩霞王栋《模式识别与人工智能》2018,31(1):61-76

作为计算机视觉领域的一个重要课题,在线目标跟踪在导弹制导、视频监控、无人机跟踪等众多领域中具有重要作用.尽管现在已有大量研究,但是仍然存在很多问题亟待解决,如光照变化、尺度变化、形变、遮挡和相机移动等.为了更清楚地梳理现存的算法,文中对典型的目标跟踪算法进行分析总结.首先,简单介绍研究意义及相关工作.然后,从传统算法和深度学习算法两方面对经典算法进行概述和分析.最后,讨论算法目前存在的问题,给出未来的研究趋势. 相似文献

4.

一种改进的运动目标检测和阴影消除算法 总被引：1，自引：0，他引：1

下载免费PDF全文

黄英杰卢湖川《计算机工程》2008,34(6):207-209

提出一种改进的运动目标检测算法,以准确检测不同光照条件下的运动目标。针对前景检测时出现的阴影,提出基于边缘信息的阴影消除算法。该算法与阴影方向无关,能去除目标各方向的大部分阴影,为视频监控系统的后续高级处理排除了阴影干扰。在配置为 2.0 GHz的P4计算机上运行,速度约为20帧/s。实验结果表明了算法的实时性、可靠性和准确性较好。相似文献

5.

基于场景几何信息的显著性目标检测方法综述

吴岚虎李智玮刘垒烨朴永日卢湖川《模式识别与人工智能》2023,(2):120-142

显著性目标检测在图像和视频压缩、伪装物体检测、医学图像分割等领域具有重要作用.随着深度传感器和光场技术的广泛应用,深度图像和光场数据等场景几何信息开始应用于显著性目标检测,可提升模型在复杂场景下的性能,由此学者们提出一系列基于场景几何信息的显著性目标检测方法.文中旨在分析总结经典的基于场景几何信息的显著性目标检测方法.首先,介绍方法的基本框架及评估标准.然后,围绕多模态特征融合、多模态信息优化、网络模型轻量化三方面,分类概述和分析经典的RGB-D显著性目标检测方法和光场显著性目标检测方法.同时,详细介绍基于场景几何信息的显著性目标检测方法的工作进展.最后,讨论方法目前存在的问题,展望未来的研究方向. 相似文献

6.

深度学习的目标跟踪算法综述

下载免费PDF全文

李玺查宇飞张天柱崔振左旺孟侯志强卢湖川王菡子《中国图象图形学报》2019,24(12):2057-2080

目标跟踪是利用一个视频或图像序列的上下文信息,对目标的外观和运动信息进行建模,从而对目标运动状态进行预测并标定目标位置的一种技术,是计算机视觉的一个重要基础问题,具有重要的理论研究意义和应用价值,在智能视频监控系统、智能人机交互、智能交通和视觉导航系统等方面具有广泛应用。大数据时代的到来及深度学习方法的出现,为目标跟踪的研究提供了新的契机。本文首先阐述了目标跟踪的基本研究框架,从观测模型的角度对现有目标跟踪的历史进行回顾,指出深度学习为获得更为鲁棒的观测模型提供了可能;进而从深度判别模型、深度生成式模型等方面介绍了适用于目标跟踪的深度学习方法;从网络结构、功能划分和网络训练等几个角度对目前的深度目标跟踪方法进行分类并深入地阐述和分析了当前的深度目标跟踪方法;然后,补充介绍了其他一些深度目标跟踪方法,包括基于分类与回归融合的深度目标跟踪方法、基于强化学习的深度目标跟踪方法、基于集成学习的深度目标跟踪方法和基于元学习的深度目标跟踪方法等;之后,介绍了目前主要的适用于深度目标跟踪的数据库及其评测方法;接下来从移动端跟踪系统,基于检测与跟踪的系统等方面深入分析与总结了目标跟踪中的最新具体应用情况,最后对深度学习方法在目标跟踪中存在的训练数据不足、实时跟踪和长程跟踪等问题进行分析,并对未来的发展方向进行了展望。相似文献

7.

基于知网的中文常问问答系统

下载免费PDF全文

李辉张琦卢湖川杨德礼《计算机工程》2008,34(23):62-64,6

句子相似度算法是基于常问问题集的问答系统(FAQ)的关键。针对汉语中一词多义现象,提出一种改进的基于知网的词义消歧算法,确定词语在不同上下文环境的义项号,利用知网系统及义项号,使用改进的相似度计算方法进行相似度计算模块设计。结合实际应用,实现一个实际的FAQ系统。实验证明,改进的词义消歧方法提高了消歧的精度和速度。而词义消歧的引入提高了问答系统的精度和速度。相似文献

8.

一种有效的实时人群计数方法

下载免费PDF全文

卢湖川张明修张继霞马洪连《计算机工程》2008,34(5):222-224

对固定镜头下视频序列中运动人体的检测和跟踪方法进行研究,利用灰度图像差分双向投影信息检测人体目标,提出一种基于统计运动区域几何特征固定比例的分割算法,使用最近邻匹配方法对人体进行跟踪。完整地实现了一个有效的实时人群计数系统。大量室内和室外场景实验结果表明,该算法具有很好的实时性(每秒处理25帧~30帧且可并行处理4路视频)、对光照变化的鲁棒性以及对稀疏人群检测精度高等特点。相似文献

9.

分割一切模型SAM的潜力与展望：综述

下载免费PDF全文

王淼黄智忠何晖光卢湖川单洪明张军平《中国图象图形学报》2024,29(6):1479-1509

随着基于对比文本—图像对的预训练（contrastive language-image pre-training,CLIP）方法或者模型、聊天生成预训练转换器（chat generative pre-trained Transformer,ChatGPT）、生成预训练转换器-4（generative pre-trained Transformer-4,GPT-4）等基础大模型的出现,通用人工智能（artificial general intelligence,AGI）的研究得到快速发展。AGI旨在为人工智能系统赋予更强大的执行能力,使其能够自主学习、不断进化,解决各种问题和处理不同的任务,从而在多个领域得到广泛应用。这些基础模型在大规模数据集上进行训练后,能够成功应对多样的下游任务。在这一背景下,Meta 公司提出的分割一切模型（segment anything model,SAM）于 2023 年取得重要突破,在图像分割领域获得了优异的性能,以至于被称为图像分割终结者。其原因之一是,通过 SAM数据引擎方法用三阶段采集的、包含 1 100万图像和超过 10 亿掩码的分割一切—十亿（segment anything 1 billion,SA-1B）图像分割数据集,同时保证了掩码的品质和多样性,继续导致在分割领域的突破。在 SAM开源后不久,科研人员提出了一系列改进的方法和应用。为了能全面深入了解分割一切模型的发展脉络、优势与不足,本文对 SAM的研究进展进行了梳理和综述。首先,从基础模型、数据引擎和数据集等多个方面简要介绍了分割一切模型的背景和核心框架。在此基础上,本文详细梳理了目前分割一切模型的改进方法,包括提高推理速度和增进预测精度两个关键方向。然后,深入探讨分割一切模型在图像处理任务、视频相关任务以及其他领域中的广泛应用。这一部分详细介绍了模型在各种任务和数据类型上的卓越性能,突出其在多个领域的泛用性和发展潜力。最后,对分割一切模型未来的发展方向和潜在应用前景进行了深入分析和讨论。相似文献

10.

背景与时间感知的相关滤波实时视觉跟踪

下载免费PDF全文

朱建章王栋卢湖川《中国图象图形学报》2019,24(4):536-549

目的传统的相关滤波跟踪算法采用对跟踪目标（唯一准确正样本）循环移位获取负样本,在整个学习过程中没有对真正的背景信息进行建模,因此当目标与背景信息极其相似时容易漂移。大多数跟踪算法为了提高跟踪性能,在时间序列上收集了大量的训练样本而导致计算复杂度的增加。采用模型在线更新策略,由于未考虑时间一致性,使得学习到的滤波器可能偏向背景而发生漂移。为了改善以上问题,本文在背景感知相关滤波（BACF）跟踪算法的基础上,加入时间感知,构建了一个带等式限制的相关滤波目标函数,称为背景与时间感知相关滤波（BTCF）视觉跟踪。该算法不但获取了真正的负样本作为训练集,而且仅用当前帧信息无需模型在线更新策略就能学习到具有较强判别力的相关滤波器。方法首先将带等式限制的相关滤波目标函数转化为无约束的增广拉格朗日乘子公式,然后采用交替方向乘子方法（ADMM）转化为两个具有闭式解的子问题迭代求最优解。结果采用OTB2015数据库中的OPE（one pass evaluation）评价准则,以成功率曲线图线下面积（AUC）和中心点位置误差为评判标准,在OTB2015公开数据库上与10个比较优秀的视觉跟踪算法进行对比实验。结果显示,100个视频序列和11个视频属性的成功率及对应的AUC和中心位置误差均明显优于其他基于相关滤波的视觉跟踪算法,说明本文算法具有良好的跟踪效果。本文的BTCF算法仅采用HOG纯手工特征,在OTB2015数据库上AUC较BACF算法提高了1.3%;由于颜色与边缘特征具有互补特性,本文融合CN（color names）特征后,在OTB2015数据库上,AUC较BACF算法提高了4.2%,采用纯手工特征跟踪性能AUC达到0.663,跟踪速度达到25.4帧/s。结论本文的BTCF算法能够适用于光照变化、目标旋转、遮挡等复杂情况下的视觉跟踪,具有良好的鲁棒性和一定的实时性。相似文献