基于压缩域特征话者识别的电视节目分类检索 COMPRESSED FEATURE BASED TV PROGRAM CLASSIFICATION AND RETRIEVAL USING SPEAKER IDENTIFICATION期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于压缩域特征话者识别的电视节目分类检索

引用本文：	吴飞,庄越挺,郑科,刘骏伟,潘云鹤.基于压缩域特征话者识别的电视节目分类检索[J].模式识别与人工智能,2002,15(1).

作者姓名：	吴飞庄越挺郑科刘骏伟潘云鹤

作者单位：	浙江大学人工智能研究所,杭州,310027

基金项目：	国家自然科学基金，教育部高校骨干教师资助计划，高等院校骨干教师基金

摘要：	本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注
关键词：	压缩域隐马尔可夫链话者识别电视节目检索
COMPRESSED FEATURE BASED TV PROGRAM CLASSIFICATION AND RETRIEVAL USING SPEAKER IDENTIFICATION

Abstract:

Keywords:
本文献已被万方数据等数据库收录！