首页 | 官方网站   微博 | 高级检索  
     

基于隐马尔可夫链的音频语义检索
引用本文:吴飞,庄越挺,张引,潘云鹤. 基于隐马尔可夫链的音频语义检索[J]. 模式识别与人工智能, 2001, 14(1)
作者姓名:吴飞  庄越挺  张引  潘云鹤
作者单位:1. 浙江大学人工智能研究所浙江大学微软视觉感知联合实验室
2. 浙江大学
基金项目:国家自然科学基金,教育部高校骨干教师资助计划,高等院校骨干教师基金
摘    要:作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略.为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被按层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,并用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索.实验数据表明,这样的音频查询处理方式取得了良好效果.

关 键 词:分层分割  隐马尔可夫链  音频检索

HIDDEN MARKOVIA MODEL BASED AUDIO SEMANTIC RETRIEVAL
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号