基于压缩域特征话者识别的电视节目分类检索 |
| |
引用本文: | 吴飞,庄越挺,郑科,刘骏伟,潘云鹤. 基于压缩域特征话者识别的电视节目分类检索[J]. 模式识别与人工智能, 2002, 15(1) |
| |
作者姓名: | 吴飞 庄越挺 郑科 刘骏伟 潘云鹤 |
| |
作者单位: | 浙江大学人工智能研究所,杭州,310027 |
| |
基金项目: | 国家自然科学基金,教育部高校骨干教师资助计划,高等院校骨干教师基金 |
| |
摘 要: | 本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注
|
关 键 词: | 压缩域 隐马尔可夫链 话者识别 电视节目检索 |
COMPRESSED FEATURE BASED TV PROGRAM CLASSIFICATION AND RETRIEVAL USING SPEAKER IDENTIFICATION |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|