共查询到19条相似文献,搜索用时 31 毫秒
1.
2.
3.
班智达藏文语料切分词典的建立与算法研究 总被引:2,自引:0,他引:2
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。而语料文本的处理与加工以语法信息词典作基础。结合藏文语料库切分标注规范,论述了对藏文语料库切分与标注用的藏文语法信息词典的建立和设计,重点讨论了该词典的内容建设、语法信息的标注、索引结构及查找算法。 相似文献
4.
5.
面向语音合成的维吾尔语音素自动切分算法研究 总被引:2,自引:0,他引:2
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。 相似文献
6.
7.
为实现语音转换,建立符合要求的汉语语音转换语料库,提出一种基于半音节模型的语料自动选取算法。根据语音转换训练时需要语料数量较少的特征,选择半音节作为语料库的基本单位。在此基础上,从原始语料中自动选取语料,根据语音转换对说话人特征较敏感的情况,利用评估函数并根据半音节的出现次数对原始语料中的句子进行打分。实验结果表明,与传统算法相比,该算法在语音库自动选取615句汉语语料时,可以覆盖97.8%的带声调半音节,其覆盖效率、覆盖率和稀疏度有较大改进。 相似文献
8.
THUUyMorph (Tsinghua University Uyghur Morphology Segmentation Corpus)是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库。原始语料从2016年的天山网维文版http: //uy.ts.cn/下载,题材内容包含新闻、法律、财经、生活等。语料库构建步骤为: 爬虫、校对原始语料、分句、校对分句、人工和自动形态切分结合、人工标注语音和谐变化现象、人工校对形态切分和语音和谐变化现象。语料库包含10 596个文档、69 200个句子,词语类型为89 923个,分为词级和句子级两类标注,开源网址为http://thuuymorph.thunlp.org/。该研究不仅对维吾尔语语料库的建设具有参考意义,而且为维吾尔语自然语言处理的研究提供了有益的资源。 相似文献
9.
研究汉语自然语音音节切分方法具有明显现实意义,比较准确的自然语音切分方法可以代替人工对一些拥有参照文本的语音进行标注。然而至今为止并没有完全准确的汉语语音音节切分方法。依据相同发音环境下汉语语音音节时间长度服从某种高斯分布和相邻语音音节之间存在短时能量波谷两个假设,提出了基于音节时间长度高斯拟合的汉语音节切分方法。对算法进行分析,根据初步切分短时能量波谷分散到各分语音段的特性,提出了简化算法,有效降低了该音节切分方法的时间复杂度。实验结果表明,音节切分准确度(与人工标注切分时间距离平方的均值)达到小数点后3位,在台式机Matlab环境下运算时间均不超过1 s,可以达到应用要求。 相似文献
10.
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。 相似文献
11.
针对有声出版物语音分割系统,提出了一种阈值自适应加相似度判决的系统分割模型,基于脚本中的先验知识提出了能量阈值自适应分割算法.对于传统的端点检测算法无法排除的干扰,为提高系统的抗干扰能力以增强其适用性,提出了基于语音单元相似性进行分析判决的新方法.测试结果表明,无干扰时,系统分割的正确率100%,每个语音文件包含两个人为干扰信号时,系统分割正确率98.8%,能够满足有声出版物语音自动分割的需要. 相似文献
12.
语音/音乐区分是音频高效编码、音频检索、自动语音识别等音频处理和分析的重要步骤。本文提出一种新颖的语音/音乐分割与分类方法,首先根据相邻帧间的均方能量差异检测音频的变化点,实现分割;然后对音频段提取低带能量方差比、倒谱能量调制、熵调制等八维特征,用人工神经网络做分类。实验结果显示,本文算法和特征具有很高的分割准确率和分类正确率。 相似文献
13.
Text-independent speech segmentation is a challenging topic in computer-based speech recognition systems. This paper proposes a novel time-domain algorithm based on fuzzy knowledge for continuous speech segmentation task via a nonlinear speech analysis. Short-term energy, zero-crossing rate and the singularity exponents are the time-domain features that we have calculated in each point of speech signal in order to exploit relevant information for generating the significant segments. This is down for the phoneme or syllable identification and the transition fronts. Fuzzy logic technique helped us to fuzzify the calculated features into three complementary sets namely: low, medium, high and to perform a matching phase using a set of fuzzy rules. The outputs of our proposed algorithm are silence, phonemes, or syllables. Once evaluated, our algorithm produced the best performances with efficient results on Fongbe language (an African tonal language spoken especially in Benin, Togo and Nigeria). 相似文献
14.
基于二维直方图的图像模糊聚类分割新方法 总被引:6,自引:0,他引:6
基于二维直方图的模糊聚类分割算法可以有效地抑制噪声的干扰。但是,FCM算法用于图像数据聚类时的最大缺陷是运算的开销太大,这就限制了这种方法在图像分割中的应用。该文根据FCM算法和灰度图像的特点,提出了一种适用于灰度图像分割的抑制式模糊C-均值聚类算法(S-FCM)。通过调节抑制因子α来提高分割速度和分类的正确率。实验结果表明,新算法对小目标灰度图像的分割效果优于FCM算法。 相似文献
15.
16.
为提高现有小波去噪法的处理效果,准确有效判断出连续语音中各个音节的起止点,提出了基于分形理论的算法。该算法首先利用分形维与小波变换相结合的动态阈值算法进行语音去噪,从而提取出尽可能纯净的语音信号;在此基础上,计算分形维轨线,根据其均值对音节分割点进行判定。实验结果表明,该算法较好地实现了语音去噪和音节分割,鲁棒性较好,使得系统在低信噪比情况下仍保持较高准确率,在语音识别方面有较好应用前景。 相似文献
17.
通过修改离差预测的方式,对高斯马尔可夫随机场(Gauss Markov Random Field)模型加以改进,提出层次型多光谱高斯马尔可夫随机场 (Hierarchical Multispectral Gauss Markov Random Field,HMGMRF) 模型及其相应的分割算法。影像分割时,先通过HMGMRF模型分析地物在各波段光谱特征的变化趋势(即地物各波段的纹理特征),期间结合了"谱间相关"这一特性,将离差预测时的邻域空间由原先的单层扩展为多层,增加了纹理特征的维度,从而提高了模型在描述纹理特征方面的能力;接着,基于贝叶斯原理,采用EM (Expectation Maximization)算法对各类地物的模型参数进行迭代估算;最后,基于增强型纹理特征,依据MAP (Maximum A Posteriori)原则,实现影像分割。实验结果表明,所提出的基于HMGMRF模型的分割算法具有较强的识别地物能力,可以获得较高的分割精度。 相似文献
18.
基于对话语音的与文本无关的说话人确认系统的研究 总被引:1,自引:2,他引:1
本文建立了一个基于对话语音的与文本无关的说话人确认系统,它和传统的与文本无关的说话人确认系统的关键不同在于,训练及测试语音不再只包含一个人而都是对话语音,因此需要分割出属于不同说话人的语音段,以建立说话人模型和实现最终判决。文中详细介绍了高斯混合模型-背景模型(GMM-UBM)这种说话人确认系统的框架,重点讨论了基于GLR(Generalized Likelihood Ratio)距离测度的无监督语音分割算法。最终阐述的输出评分的规整方法即ZNORM(Zero Normalization)和持续时间修正,可以使确认系统的性能提高近10%。 相似文献
19.
一种基于主动轮廓模型的医学图像序列分割算法 总被引:7,自引:0,他引:7
介绍了一种结合live wire算法和活动轮廓模型的医学图像序列的分割方法.通过把live wire算法和图像分割中一般的区域增长方法结合,对传统live wire算法进行了改进,并用改进后的算法对医学图像序列中的单张或多张切片进行交互式地准确分割.然后计算机利用活动轮廓模型自动分割相邻的未分割切片.还通过在活动轮廓模型的边缘点中引入记录已分割物体边缘附近局部区域特征的灰度模型,把已分割切片中的物体与背景的局部区域特征带入相邻的未分割切片中,并用由灰度模型定义的区域相似性代替活动轮廓模型中的外能来引导边缘轮廓收敛到物体的实际边缘.最后介绍了一种基于live wire算法思想的简单的分割结果交互式修复方法.实验结果表明该算法仅需少量用户交互就能快速准确地从医学图像序列中分割出感兴趣的物体,在医学图像分析中具有实用价值. 相似文献