期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈雪芳《科学技术与工程》2013,13(12):3297-3300

提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。相似文献

2.

基于特征语谱图和自适应聚类SOM的快速说话人识别

贾艳洁陈曦于洁琼王连明《科学技术与工程》2019,19(15):211-218

为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。相似文献

3.

一种多说话人角色聚类方法

李威贺前华李艳雄《华南理工大学学报(自然科学版)》2015,43(1)

为有效找出会议语音中的说话人角色个数及各角色的说话人语音,提出了一种多说话人角色聚类方法.首先定义说话人角色聚类的特征,然后采用测地距离度量特征的相似度,进而提出了一种利用类内距离来控制类间合并的多说话人角色聚类方法,最后采用4种不同类型的会议语音对该方法进行测试.结果表明:对手工分割和自动分割后的会议语音进行说话人角色聚类时,如果采用相同的聚类方法,则使用测地距离的性能优于使用传统距离的性能;如果采用相同的距离度量方法,则文中方法的性能优于传统层次聚类方法. 相似文献

4.

基于K-means聚类算法的研究

步媛媛关忠仁《西南民族学院学报(自然科学版)》2009,35(1):198-200

原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性．为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息．采取对数据进行预处理的方式来选取初始中心．实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度．相似文献

5.

自适应的k-means聚类算法SA-K-means

周慧芳《科技咨询导报》2009,(34):4-5,8

传统的k-means聚类算法对初始聚类中心非常敏感,聚类的结果也常常随着初始聚类中心而波动。为了降低聚类算法的这种敏感性,本文提出了一种自适应的聚类算法（SA—K—means）,该方法通过计算数据对象区域的密度,选择相互距离最远的高密度区域的中心作为初始聚类中心。实验表明SA—K—means聚类算法能有效地消除聚类算法对初始聚类中心的敏感性,得到满意的聚类结果。相似文献

6.

基于矢量量化的时序说话人聚类方法

陈祝允李艳雄杜佳媛《科学技术与工程》2014,14(2)

针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。相似文献

7.

一个基于k-means算法的聚类

陈勇陈健《东莞理工学院学报》2010,17(3):27-31

用k-means算法对二维数据进行聚类分析,并用C#语言实现了该算法。先按照样本点的距离进行初始划分,然后再按照各样本点和初始中点的距离远近进行聚类。结果表明,k-means算法对二维数据的聚类是有效的,实现该算法的程序对二维数据的聚类具有通用性。相似文献

8.

基于2D-Haar声学特征的大规模说话人识别方法

谢尔曼罗森林潘丽敏《北京理工大学学报》2014,34(11):1196-1201

随着待识别人数的增加,文本无关的说话人识别准确率下降明显. 针对这一问题提出了一种高准确率大规模说话人识别方法,该方法采用多个连续音频帧的声学帧特征构成声学特征图,进而获得高维度的2D-Haar声学特征,为训练出性能更优的分类器提供可能;再利用AdaBoost.MH算法筛选出具有较好区分度的2D-Haar声学特征组合进行分类器训练. 实验结果表明,600人规模下的正确识别率为89.5%,100～600人规模下的平均准确率为91.3%. 该方法适用于大规模说话人的识别,引入的2D-Haar声学特征有效,识别准确率高. 此外,该方法还具有较低的算法复杂度和较高的时间效率. 相似文献

9.

基于话者聚类的多系统输出评分融合话者确认

上官葳戴蓓蒨《兰州大学学报(自然科学版)》2008,44(3)

针对短电话语音条件下文本无关说话人确认问题中语音数据不充分和电话信道失配问题,利用说话人特征参数之间的互补性,提出了一种对多子系统输出评分采用多个网络的融合策略,提高了话者确认系统的整体性能.实验结果表明:与传统的所有话者共享一个输出评分融合网络相比,应用多个融合网络,在采用KLD和GLR模型相似性测度时,系统等误识率分别下降了12.7%和10.8%. 相似文献

10.

基于期望最大化的K-Means聚类算法

景源郝金山《辽宁大学学报(自然科学版)》2020,47(2):106-111

针对高维数据下的聚类效果需要提高,提出一种基于期望最大化的k-means聚类改进算法.该算法在没有降维和破坏原有数据结构的情况下,把期望最大化算法和k-means算法相结合,用期望最大化算法选取k-means的算法的初始聚类中心.并针对高维数据提出一种新的距离算法,代替传统的距离算法.实验结果表明提出的算法的可行性,并且在处理高维数据时的有效性. 相似文献

11.

基于组合神经网络和模糊聚类的话者分类 总被引：2，自引：0，他引：2

戴蓓倩朱斌《中国科学技术大学学报》1997,27(1):25-30

基于话者分类的自适应语音识别是实现非限定人、大字表语音识别的一种很有前途的有效方法．本文设计了一种用于话者分类的主从式组合神经网络，以神经预测模型作为从网络，可以从短语音（一个音节，约０．３秒）中有效地提取、规正和压缩话者个人性信息；主网络采用具有很强聚类功能的自组织特征映射网络．针对话者个人性信息的模糊性，提出了模糊系统聚类算法和双类心聚类算法．实验验证了组合神经网络对于话者分类的有效性以及模糊聚类算法对不同文本的语音样本具有较好的适应性相似文献

12.

基于Relief算法的特征学习聚类 总被引：3，自引：0，他引：3

吴艳文胡学钢陈效军《合肥学院学报(自然科学版)》2008,18(2):45-48

聚类作为数据挖掘常用工具之一,是按照事物间的相似性进行的一种无监督分类．然而传统的聚类方法较少考虑特征权值．为此,通过研究、分析Relief算法及其在聚类应用中存在的问题,提出了一种基于Relief算法的特征评价函数,并将此函数运用到特征学习聚类中,以解决特征权值取值不当对聚类产生的负面影响．相似文献

13.

变异特征加权的异常语音说话人识别算法 总被引：1，自引：1，他引：0

何俊李艳雄贺前华李威《华南理工大学学报(自然科学版)》2012,40(3):106-111

常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%. 相似文献

14.

基于全局注意力的多级特征融合目标检测算法

吴稳稳吴晓红刘强卿粼波何小海《科学技术与工程》2020,20(27):11185-11191

针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。相似文献

15.

基于半监督的K-means聚类改进算法

李小展《东莞理工学院学报》2011,18(1):29-32

针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集... 相似文献

16.

基于特征选择和聚类的分类算法

郭凯文潘宏亮侯阿临《吉林大学学报(理学版)》2018,56(2):395-398

针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率. 相似文献

17.

基于二元树复数小波变换的特征融合算法 总被引：1，自引：0，他引：1

徐云翔吴秀清李滔《中国科学技术大学学报》2005,35(2):264-269

提出了一种利用二元树复数小波变换(DT-CWT)提取遥感图像纹理特征的方法，不仅使得纹理分析具备小波分析的多尺度特性，而且具备了6个方向的选择性、良好的重构性和近似的平移不变性．利用DT—CWT变换提取目标图像的纹理特征，构造目标概率密度函数，并采用基于D-S证据理论的特征层融合算法对目标进行识别处理，实验结果表明，采用基于DT-CWT纹理特征的特征层融合算法对多源低分辨率可见光遥感图像中小目标的识别是有效的．相似文献

18.

卷积特征图融合与显著性检测的图像检索

聂一亮杜吉祥杨麟《华侨大学学报(自然科学版)》2018,(6):937-941

针对基于深度学习的图像检索提取特征往往包含了复杂的背景噪声,导致图像检索的精确率并不高的问题,提出一种特征图融合与显著性检测的方法.首先,训练用于分类的深度卷积神经网络模型.然后,并将图像卷积之后的特征图谱进行融合,得到图像的显著性区域.最后,通过计算图像显著性特征的余弦距离来进行检索.实验结果证明:相比目前主流的方法,文中方法能够有效提高检测精度,且鲁棒性较高. 相似文献