首页 | 官方网站   微博 | 高级检索  
     

基于压缩域特征话者识别的电视节目分类检索
引用本文:吴飞,庄越挺,郑科,刘骏伟,潘云鹤.基于压缩域特征话者识别的电视节目分类检索[J].模式识别与人工智能,2002,15(1).
作者姓名:吴飞  庄越挺  郑科  刘骏伟  潘云鹤
作者单位:浙江大学人工智能研究所,杭州,310027
基金项目:国家自然科学基金,教育部高校骨干教师资助计划,高等院校骨干教师基金
摘    要:本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注

关 键 词:压缩域  隐马尔可夫链  话者识别  电视节目检索

COMPRESSED FEATURE BASED TV PROGRAM CLASSIFICATION AND RETRIEVAL USING SPEAKER IDENTIFICATION
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号