基于隐马尔可夫链的音频语义检索 HIDDEN MARKOVIA MODEL BASED AUDIO SEMANTIC RETRIEVAL期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于隐马尔可夫链的音频语义检索

引用本文：	吴飞,庄越挺,张引,潘云鹤. 基于隐马尔可夫链的音频语义检索[J]. 模式识别与人工智能, 2001, 14(1)

作者姓名：	吴飞庄越挺张引潘云鹤

作者单位：	1. 浙江大学人工智能研究所浙江大学微软视觉感知联合实验室 2. 浙江大学

基金项目：	国家自然科学基金，教育部高校骨干教师资助计划，高等院校骨干教师基金

摘要：	作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略.为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被按层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,并用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索.实验数据表明,这样的音频查询处理方式取得了良好效果.
关键词：	分层分割隐马尔可夫链音频检索
HIDDEN MARKOVIA MODEL BASED AUDIO SEMANTIC RETRIEVAL

Abstract:

Keywords:
本文献已被万方数据等数据库收录！