首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
光学乐谱识别对推动音乐智能化与数字化有着重大意义。传统的乐谱识别流程冗杂,易导致错误积累,但目前基于序列建模的乐谱识别方法不能从全尺度上获取音符上下文信息,在识别效果上仍有提升空间。为此,提出一种基于残差门控循环卷积和注意力机制的端到端光学乐谱识别方法。以残差门控循环卷积作为骨干网络,丰富模型提取上下文信息能力;结合一个注意力机制解码器,能更好地挖掘乐谱特征信息及其内部相关性,增强模型表征能力并对乐谱图像中的音符及音符序列进行识别。实验结果表明,改进后的网络与原卷积循环神经网络(CRNN)模型相比,符号错误率和序列错误率均显著下降。  相似文献   

2.
哼唱音符音高的准确划分,对哼唱音乐检索系统识别率的提高起着很大的作用。目前,大部分的哼唱音乐检索系统都是采用能量划分的方法,在很大程度上并不能对哼唱波形文件顺利完成单音切割,因此,论文提出的一种新的音符音高划分方法,在基于一般能量划分的基础上,采用基于倍音列的音高识别模型对划分结果进行二次划分、规整,最终实现哼唱音符音高的划分。实验表明,该划分方法能够有效地实现哼唱音符音高的准确划分。  相似文献   

3.
任瑞 《微型电脑应用》2022,(3):58-61,69
由于当前乐曲节拍识别系统的识别间隔较长,乐曲节拍识别的准确率较低.为了解决该问题,设计一种新的基于音频技术的乐曲节拍识别系统.系统硬件由乐音识别器、节拍控制器和动态显示器等3部分组成:乐音识别器通过处理数据与信号的信息将音频乐曲节拍转换成音符表示的简谱,以此保证对乐曲的识别功能;节拍控制器内部拥有多个缓冲识别器,能够提...  相似文献   

4.
一种分段式音乐情感识别方法   总被引:1,自引:0,他引:1  
为了体现音乐情感跌宕起伏的变化,本文将乐曲划分为音符、小节和乐段,并提出一种分段式音乐情感识别方法.该方法从MIDI文件中提取音符特征,根据音符特征提取小节特征,并根据若干相邻小节的相似性将乐曲划分成若干独立的乐段,在提取乐段特征后利用BP神经网络识别乐段情感,最终获得整首乐曲的情感.实验结果表明,本文提出的音乐情感识别方法具有较好的识别效果.  相似文献   

5.
在基于音高的音乐识别中,基音周期是音符识别中最重要的参数之一。本文以钢琴乐曲为例,提出一种基于权值分配的基音检测算法。在基音周期自相关检测的基础上,分析音乐信号的帧样本,并利用基于权值分配的改进方法检测音符基频,能够有效提高基频识别精度。  相似文献   

6.
多基频估计被广泛应用于音乐结构分析、乐音辅助教育、信息检索等各个领域.为了满足准确识别乐曲中随机和弦的需求,提出了基于生成对抗网络去影像的多基频估计算法.首先将完整音频切分成音符段,提出了一种谐音指纹图提取音符段频谱特征;然后通过卷积神经网络识别谐音指纹图当前的主导基频,将已识别出的主导基频作为干扰下一个基频识别的影像...  相似文献   

7.
一种基于子带处理的PAC说话人识别方法研究   总被引:1,自引:1,他引:0  
目前,说话人识别系统对于干净语音已经达到较高的性能,但在噪声环境中,系统的性能急剧下降.一种基于子带处理的以相位自相关(PAC)系数及其能量作为特征的说话人识别方法,即宽带语音信号经Mel滤波器组后变为多个子带信号,对各个子带数据经DCT变换后提取PAC系数作为特征参数,然后对每个子带分别建立HMM模型进行识别,最后在识别概率层中将HMM得出的结果相结合之后得到最终的识别结果.实验表明,该方法在不同信噪比噪声和无噪声情况下的识别性能都有很大提高.  相似文献   

8.
设计和实现基于语音识别与编辑的自动作曲系统,旨在解决视觉障碍者和音乐初学者在乐谱访问和音乐理解方面的困难。研究内容包括音符识别、音符编辑和多种文件生成。通过音符识别算法和语音技术的集成,用户的音频输入可以转换为乐谱中的音符和时值。音符编辑功能允许用户灵活地修改音符的音高。系统能够生成多种文件格式,例如,图片、音频、可编辑版乐谱和盲文文件,以满足用户的展示和编辑需求。该研究对音乐辅助技术的发展具有重要意义,为视觉障碍者和音乐初学者提供了创新的学习工具和音乐创作方式。未来,自动作曲系统有望进一步发展,提高算法准确性、用户体验和创作自由度。同时,与其他领域技术的融合将进一步扩展其功能和应用场景,推动音乐辅助技术的进一步发展。  相似文献   

9.
针对用小波分解提取肺音特征后特征向量维数较高的问题,提出了一种结合线性判别分析和小波分解的肺音特征提取方法。在该方法中,首先对肺音信号进行小波分解,然后将小波分解得到的小波系数转化成小波能量特征向量,接着使用线性判别分析法对该特征向量进行降维处理,得到新的低维特征向量,最后用SVM对低维特征进行识别。在实验中,选取了三种肺音信号:正常肺音、爆裂音、哮鸣音,用所提出的方法将8维的小波能量特征降为2维特征,在2维特征上进行了分类识别,并和降维之前的结果进行了比较,实验结果表明利用线性判别分析对小波能量特征降维后极大地提高了识别精度。同时,和其他几种典型的肺音特征提取方法进行了比较,实验结果表明结合线性判别分析与小波分解的特征提取方法得到了更高的识别精度。  相似文献   

10.
DCT系数重组在特征脸中的应用研究   总被引:1,自引:1,他引:0       下载免费PDF全文
针对现在图像压缩主要采用DCT变换方法,提出了一种对DCT系数进行重组的方法,获取三级多分辨率子带。通过对各单独子带实施特征脸方法可得到不同的识别效果。提出在子带[S0]和子带[S1],[S2]和[S3]上进行特征脸方法识别,如两者结果不一致,则在满足一定门限条件下输入多张人脸,分析了所提出方法与原方法所需识别时间的关系。在ORL库和YALE库上的实验表明,提出方法的识别率要远高于直接采用特征脸方法。  相似文献   

11.
描述了工尺谱记谱法(GCN,Gong-che Notation)的一些基本知识,指出了它和五线谱记谱法之间的异同点,然后利用MIDI1.0协议提出了具有兼容性的工尺谱乐谱的CGCN(Code of GCN)类MIDI文件的文件结构,最后对CGCN类MIDI文件的软件接口设计进行了必要的说明。提出的工尺谱乐谱的类MIDI文件结构具有较强的兼容性、鲁棒性和容错性,能实现音乐作品的音序信息和乐谱信息的同步传播,有效解决了工尺谱乐谱译谱过程中的歧义性问题,使中国传统音乐作品在数字时代得到良好的传播和复用。  相似文献   

12.
计算机光学乐谱识别技术   总被引:10,自引:0,他引:10  
计算机光学乐谱识别是计算机技术在音乐领域的发展和应用,主要利用图像处理,模式识别,文档图像分析等相关技术,把乐谱图像转化成通用的数字音乐格式,OMR实现传统乐谱数字化,在计算机音乐、计算机辅助音乐教学,数学音乐图书馆等众多领域有着广泛的应用前景,OMR包括乐谱图像预处理,谱线检测与删除,原始音符对象识别和特征音符对象解释与重组等主要过程,音符对象的识别,解释与重组是其中的难点和关键。  相似文献   

13.
音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入时,可以识别出从大字组到小字三组的25类音符,并可以获得95.6%的平均识别率;在识别过程中,特征CQT比特征MFCC的贡献更大。实验数据充分说明,利用分类的思想提取音符信号的MFCC和CQT特征来进行音符识别,可以取得很好的识别效果,并且不受音符基频范围的限制。  相似文献   

14.
哼唱音乐一般是一种波形文件,这样的格式并不利于检索和查找。在使用哼唱音乐检索音乐内容时,需要将哼唱文件转换为音高和时值的形式,作为检索关键字。这些步骤都建立在哼唱已经被按音符切分的基础上。论文采用一种基于振幅能量的多层次音符切分方法,实现对哼唱文件的快速切分。基于能量的划分方法具有简便快速的特点。分层次的划分方法能够针对各种不同音符情况,采用最合适的方法切分。论文还讨论了一种基于音高识别技术的音符划分方法。  相似文献   

15.
嵌入式MIDI文件格式解析设计与实现   总被引:1,自引:0,他引:1  
建立在嵌入式系统平台上的电子乐谱阅读器可以代替传统纸质乐谱和谱架的组合成为乐谱阅读的理想方式,因此在嵌入式系统上阅读MIDI等文件格式的数字乐谱具有重要的意义。本文详细说明了从一个MIDI文件解析出五线谱信息的全过程,介绍了MIDI文件格式以及在MIDI格式读取的过程中遇到的种种问题的解决方法。  相似文献   

16.
In this paper, we propose a unified approach to fast index-based music recognition. As an important area within the field of music information retrieval (MIR), the goal of music recognition is, given a database of musical pieces and a query document, to locate all occurrences of that document within the database, up to certain possible errors. In particular, the identification of the query with regard to the database becomes possible. The approach presented in this paper is based on a general algorithmic framework for searching complex patterns of objects in large databases. We describe how this approach may be applied to two important music recognition tasks: The polyphonic (musical score-based) search in polyphonic score data and the identification of pulse-code modulation audio material from a given acoustic waveform. We give an overview on the various aspects of our technology including fault-tolerant search methods. Several areas of application are suggested. We describe several prototypic systems we have developed for those applications including the notify! and the audentify! systems for score- and waveform-based music recognition, respectively.  相似文献   

17.
在电子出版及许多音乐研究中,均需将原文乐谱转化为被计算机可读的数据。本文提出一种用字符识别方法的乐谱图象识别系统。它基于拆分结构技术,将原文转换为局部结构图切分乐符,有效地减少了数据量,且不受图象弯曲和倾斜的影响。文中给出了识别结果的文本输出及其图象恢复。  相似文献   

18.
为了解决混合乐器音乐数据的成分识别与解析研究中,现有方法过度依赖数据标签,且往往基于单纯频域或物理特征,与乐器固有性质关联不明显、对复杂成分的敏感度不足的问题,提出了一种基于稀疏分解和多种乐器成分字典的稀疏特征提取方法,通过对稀疏系数向量进行深入分析,得到可以独立使用,具有高可解释性的稀疏音乐特征。实验结果证明,这种特征能够直观地反映乐器成分组成与音乐情绪的变化,在混合乐器成分分析和其他各类时变信号分析领域具有显著的应用价值。  相似文献   

19.
聂子卿  杨士颖 《微机发展》2012,(7):17-19,23
文中的目的是介绍一种将WAVE格式的二胡音乐文件转换成MIDI格式的设计过程。具体方法如下:首先,利用小波变换和快速傅里叶变换联合提取出音符的基频;其次,根据MIDI音乐的消息格式,将得到的各基频转换成相应的MII音符;再次,根据二胡音乐的特性,设定双门限阈值筛选出有效的音符。最后加入其他控制信息,最终结果是组合成MI-DI的音轨文件。经实验得出结论,该方法针对二胡音乐的音高提取有较高的准确率,同时能够生成所需的有效MIDI文件。  相似文献   

20.
李晨  ;周明全 《微机发展》2008,(8):215-218
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类。基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号