首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
基于内容的音频检索综述   总被引:14,自引:0,他引:14  
朱爱红  李连 《微机发展》2003,13(12):58-60,64
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索。为此,基于内容的音频检索技术应运而生。文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。  相似文献   

2.
设计和实现基于语音识别与编辑的自动作曲系统,旨在解决视觉障碍者和音乐初学者在乐谱访问和音乐理解方面的困难。研究内容包括音符识别、音符编辑和多种文件生成。通过音符识别算法和语音技术的集成,用户的音频输入可以转换为乐谱中的音符和时值。音符编辑功能允许用户灵活地修改音符的音高。系统能够生成多种文件格式,例如,图片、音频、可编辑版乐谱和盲文文件,以满足用户的展示和编辑需求。该研究对音乐辅助技术的发展具有重要意义,为视觉障碍者和音乐初学者提供了创新的学习工具和音乐创作方式。未来,自动作曲系统有望进一步发展,提高算法准确性、用户体验和创作自由度。同时,与其他领域技术的融合将进一步扩展其功能和应用场景,推动音乐辅助技术的进一步发展。  相似文献   

3.
灰关联分析与语音/音乐信号识别   总被引:1,自引:0,他引:1  
将灰关联分析方法应用于语音/音乐信号的分类和识别,并给出了对音频信号进行灰关联分析的方法和步骤。利用语音和音乐信号的短时能量均方根的概率统计特征建立目标的参考数据和比较数据,进行语音和音乐信号的灰关联分析,确定目标识别与分类的判据,并对两类信号进行识别。仿真结果表明灰关联分析方法应用于音频信号分类和识别具有一定的可行性。  相似文献   

4.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等.最后展望了音频检索技术的发展前景.  相似文献   

5.
音频信息检索   总被引:10,自引:0,他引:10  
回顾了国内外现行的音频信息检索方法,分析了常见的音频数据处理技术,包括语音识别技术和基于内容的音频检索技术,提出了基于内容的音频检索的一般方法,并指出了相应研究中的关键问题。  相似文献   

6.
音频检索技术研究   总被引:4,自引:2,他引:2  
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类.基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义.分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景.  相似文献   

7.
广播电视语音识别现状与应用策略   总被引:1,自引:0,他引:1       下载免费PDF全文
综合分析了与广播电视语音智能化处理相关的连续语音识别、关键词检出、语种识别以及固定音频检索技术的国内外发展现状,提出了计算机自动音频处理技术在一般应用条件下已经基本达到实用要求。在此基础上,分析了将自动音频处理技术应用于我国广播电视内容管理的应用前景。  相似文献   

8.
本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注  相似文献   

9.
基于隐马尔可夫模型的音频自动分类   总被引:27,自引:0,他引:27  
卢坚  陈毅松  孙正兴  张福炎 《软件学报》2002,13(8):1593-1597
音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此,提出一种基于隐马尔可夫模型的音频分类算法,用于语音、音乐以及它们的混合声音的分类.实验结果表明,隐马尔可夫模型的音频分类性能较好,最优分类精度达到90.28%.  相似文献   

10.
李晨  ;周明全 《微机发展》2008,(8):215-218
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类。基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景。  相似文献   

11.
语音/音乐区分是音频高效编码、音频检索、自动语音识别等音频处理和分析的重要步骤。本文提出一种新颖的语音/音乐分割与分类方法,首先根据相邻帧间的均方能量差异检测音频的变化点,实现分割;然后对音频段提取低带能量方差比、倒谱能量调制、熵调制等八维特征,用人工神经网络做分类。实验结果显示,本文算法和特征具有很高的分割准确率和分类正确率。  相似文献   

12.
The audio channel conveys rich clues for content-based multimedia indexing. Interesting audio analysis includes, besides widely known speech recognition and speaker identification problems, speech/music segmentation, speaker gender detection, special effect recognition such as gun shots or car pursuit, and so on. All these problems can be considered as an audio classification problem which needs to generate a label from low audio signal analysis. While most audio analysis techniques in the literature are problem specific, we propose in this paper a general framework for audio classification. The proposed technique uses a perceptually motivated model of the human perception of audio classes in the sense that it makes a judicious use of certain psychophysical results and relies on a neural network for classification. In order to assess the effectiveness of the proposed approach, large experiments on several audio classification problems have been carried out, including speech/music discrimination in Radio/TV programs, gender recognition on a subset of the switchboard database, highlights detection in sports videos, and musical genre recognition. The classification accuracies of the proposed technique are comparable to those obtained by problem specific techniques while offering the basis of a general approach for audio classification.
Liming ChenEmail:
  相似文献   

13.
高效精准的乐器识别技术可以有效地推动声源分离、音乐识谱、音乐流派分类等研究的深入发展,可广泛应用于播放列表生成、声学环境分类、乐器智能教学和交互式多媒体等众多领域。近年来,随着乐器识别研究的不断推进,乐器识别系统在性能上有了大幅提高,但依旧存在着部分乐器难以识别、乐器音频特征提取较为困难、复音乐器识别精准度较低等诸多问题,如何借助人工智能技术对乐器进行高效精准的识别成为当前研究的热点和难点。针对当前研究现状,从乐器识别常用音频特征、乐器识别模型及方法和常用数据集三个方面进行综述,并对当前研究中存在的局限性和未来发展趋势进行总结,为乐器识别研究提供一定的借鉴参考。  相似文献   

14.
音乐是表达情感的重要载体,音乐情感识别广泛应用于各个领域.当前音乐情感研究中,存在音乐情感数据集稀缺、情感量化难度大、情感识别精准度有限等诸多问题,如何借助人工智能方法对音乐的情感趋向进行有效的、高质量的识别成为当前研究的热点与难点.总结目前音乐情感识别的研究现状,从音乐情感数据集、音乐情感模型、音乐情感分类方法三方面...  相似文献   

15.
基于内容的戏曲分类与分析   总被引:1,自引:0,他引:1  
张一彬  周杰  边肇祺 《计算机工程》2006,32(12):182-183,186
中国传统戏曲是世界艺术园地中的一支奇葩。该文使用音频分析技术和模式识别技术相结合的方法对8种典型的中国传统戏曲(京剧、昆剧、评剧、豫剧、越剧、河北梆子、黄梅戏和晋剧)进行了自动分类和相似性分析研究。实验结果表明,在一个包含了680个唱段的测试数据库上,该方法可以达到82.4%的平均分类正确率。研究结果还表明在这8种传统戏曲中,昆剧和评剧最为相似,豫剧和越剧之间差别最大。  相似文献   

16.
在分析应用视频数据的过程中,视频分段是分析,组织,应用视频数据的基础。由于视频数据的多样性,传统的分段方法不能给出令人满意的结果,一般需要通过人机交互来进行。文中将较为成熟的文本分析、语音处理、图像处理三种技术进行综合,互为补充,对视频流进行分割。文本分析的对象是语音转换成的文本、标题、注释等。语音处理包括语音识别和语音信号分析。语音识别将视频中的自然语言转换为文字。语音信号分析对视频材料中的语音成分进行基础分析。图像处理主要用来处理视频中的图像部分。文章阐述了视频流的分段层次,文本分析,语音处理算法以及镜头突变,镜头渐变识别算法的思想。  相似文献   

17.
Music is the language of emotions. In recent years, music emotion recognition has attracted widespread attention in the academic and industrial community since it can be widely used in fields like recommendation systems, automatic music composing, psychotherapy, music visualization, and so on. Especially with the rapid development of artificial intelligence, deep learning-based music emotion recognition is gradually becoming mainstream. This paper gives a detailed survey of music emotion recognition. Starting with some preliminary knowledge of music emotion recognition, this paper first introduces some commonly used evaluation metrics. Then a three-part research framework is put forward. Based on this three-part research framework, the knowledge and algorithms involved in each part are introduced with detailed analysis, including some commonly used datasets, emotion models, feature extraction, and emotion recognition algorithms. After that, the challenging problems and development trends of music emotion recognition technology are proposed, and finally, the whole paper is summarized.  相似文献   

18.
声学事件检测是指对连续音频信号流中具有明确语义的片段进行检测与标定的过程。它是机器对环境声音场景进行识别和语义理解的重要基础,并将在未来类人机器人声音环境的语义理解、无人车行车周边环境的声音感知等方面发挥重要的 作用。本文分别从与声学事件检测相关领域的发展历程以及应用需求出发,对声学事件检测的历史进行了回顾,介绍了典型的研究工作,并分析了未来的发展方向。在相关领域的分析 中,重点介绍语音识别、基于计算的音乐处理及基于听觉特性的声音处理等方面的工作;在应用需求方面,介绍机器的环境声音感知与多媒体信息检索方面的工作;最后分析本领域的研究现状,并展望其未来的发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号