首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
该文结合最小上下文构成代价模型,借鉴并利用统计机器翻译的方法,尝试解决蒙古文形态切分问题。基于短语的统计机器翻译形态蒙文切分模型和最小上下文构成代价模型分别对词表词和未登录词进行形态切分。前者选取了短语机器翻译系统中三个常用的模型,包括短语翻译模型、词汇化翻译模型和语言模型,最小上下文构成代价模型考虑了一元词素上下文环境和词缀N-gram上下文环境。实验结果显示 基于短语统计机器翻译形态切分模型对词表词切分,最小上下文构成代价模型对未登录词处理后,总体的切分准确率达到96.94%。此外,词素融入机器翻译系统中后,译文质量有了显著的提高,更进一步的证实了本方法的有效性和实用性。  相似文献   

2.
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原.在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩.  相似文献   

3.
灰度图像中字符切分方法的研究   总被引:5,自引:1,他引:5  
字符切分目前已经成为限制OCR技术发展的瓶颈,对于图像质量较差、中英文混排和背景色变化的文本图像,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理,再根据分级连通域的概念把整个图像构造成树状结构,然后确定主层次级别,根据一定的规则在部分节点上进行合并、分割等进一步处理,最后得到最优的切分结果。实验结果表明,该方法能够取得比常规切分方法更好的切分效果。  相似文献   

4.
THUUyMorph (Tsinghua University Uyghur Morphology Segmentation Corpus)是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库。原始语料从2016年的天山网维文版http: //uy.ts.cn/下载,题材内容包含新闻、法律、财经、生活等。语料库构建步骤为: 爬虫、校对原始语料、分句、校对分句、人工和自动形态切分结合、人工标注语音和谐变化现象、人工校对形态切分和语音和谐变化现象。语料库包含10 596个文档、69 200个句子,词语类型为89 923个,分为词级和句子级两类标注,开源网址为http://thuuymorph.thunlp.org/。该研究不仅对维吾尔语语料库的建设具有参考意义,而且为维吾尔语自然语言处理的研究提供了有益的资源。  相似文献   

5.
该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。  相似文献   

6.
老挝语是一种无空格切分的字母语言,在进行自然语言处理工作时需要首先进行分词处理。现有分词算法主要为首先使用规则进行音节切分,然后根据音节切分结果进行老挝语分词,存在错误传递等问题。该文提出一种基于神经网络的端到端老挝语分词方法,基于多任务联合学习思想,将老挝语音节切分与分词工作进行结合,实现了基于双向长短时记忆循环神经网络(BiLSTM)的端到端老挝语分词模型。实验表明,端到端的老挝语分词模型准确率达到89.02%,较以往分词模型有所提升。  相似文献   

7.
王皓亮  高建华 《计算机科学》2017,44(9):190-194, 199
基于模型的GUI测试方法(MBGT)可自动化生成测试用例,在MBGT中引入多级形态模型(Multilevel Morphology Model,MMM)可以实现从不同的形态角度考察系统,可控地提高模型的错误检测效力。但多级形态模型只能整体扩展到高阶,且随着模型的扩展,测试用例的长度与数量急剧增长,极大地影响了测试效率。对此提出一种可进行局部扩展的多级形态模型的分割方法以及相应的测试用例生成策略。该方法通过GUI事件的分类,实现了对基础模型的分割与化简,并采用广度优先搜索(BFS)与中国邮递员问题(CPP)求解算法生成测试用例。该方法使得GUI模型的表达更为清晰直观,在有效区分测试重点的同时,缩小了测试集规模,极大地提高了多级形态模型在GUI测试中的灵活性与测试效率。实验证明,经模型分割后的多级形态模型具有与未分割模型基本等同的错误检测效力,且随着模型级数的提高,模型分割对测试效率的提升增大。  相似文献   

8.
剩余油的形态分布情况对油田的深度开发有着重大意义. 针对剩余油数据量较少和传统的形态参数分类能力有限等问题, 提取一种基于深度学习的剩余油形态分类方法. 该方法在数据预处理部分, 利用生成对抗网络ACGAN的多类别数据生成特性对剩余油图像进行数据增强; 采用VGG19模型作为主干网络提取传统形态参数无法描述的深层特征, 同时引入SENet注意力机制, 改善模型特征表达能力, 使得最终的分类结果更加精确. 为验证本研究方法的有效性, 将本文方法与传统形态参数和其他深度学习模型的分类方法进行对比, 并通过主观视觉和客观指标进行评估, 结果表明本文方法分类更为精确.  相似文献   

9.
在字符识别领域,对粘连字符的识别是一个被广泛关注的技术难点,而且粘连字符的分割更是产生识别错误的主要原因之一.为了快速准确地进行字符分割,在总结已有方法的特点及不足的基础上,针对电子阅读笔系统的工作特点和实时性要求,提出并实现了一种面向电子阅读笔系统的基于词片识别的分割算法.该方法由于通过对字母组合的识别,降低了传统的基于孤立字符识别方法对于字符切分的要求,而且以中心生长法和改进的峰谷函数为切分工具来进行字符分割,简单实用,因而其在减少因粘连字符切分错误引起的识别错误的同时,不仅降低了运算复杂度,而且适合在阅读笔等嵌入式设备上应用.实验证明,该算法不仅效率高,而且实现简单,还能够降低分割错误带来的识别错误.  相似文献   

10.
随着网络多媒体和数字图象通信的发展,数据量越来越庞大,对图象的高保真实时传输要求也越来越高。而传统的JPEG算法,存在算法复杂、抗通道错误能力差等弱点,不太适合于图象的实时传输。本文推荐了一种能高品质重建的形态滤波器子波分解法。这种分解法具有实时性较好、通道错误不扩散的特点;用这种分解重建的图象与传统线性子波分解法相比,不会受振铃效应(ringefect)的影响。与JPEG的比较则显示:该方法在高保真压缩(压缩率约4倍)的情况下,PSNR和视觉效果接近JPEG,而在复杂度、抗通道错鲁捧性方面则明显优于JPEG。  相似文献   

11.
一种基于形态变换的小波分解运动补偿编码新算法   总被引:2,自引:2,他引:2       下载免费PDF全文
基于图象小波变换系数的多分辨率运动估值/补偿算法在信噪比、压缩率和视觉质量方面都比传统的"时域运动补偿+DCT”算法好,特别是对图象多分辨率和传输多码率的支持非常适合现今通信网的要求。但是算法中巨大的运动估值运算量制约了它的实际应用。使用潜在运动区进行运动估值是减少运算时间的可行方法之一。我们根据图象序列的运动内容在小波变换域呈现的方向性和局部性的特点,提出了一种基于形态变换的小波分解运动补偿新算法。该算法利用形态变换运算提取潜在运动区,使运动估值只集中在运动发生的区域进行,在保持一定的补偿误差时大大降低了运动估值时间,实验结果证明了新算法的有效性。  相似文献   

12.
一种计算图象形态梯度的多尺度算法   总被引:28,自引:1,他引:27       下载免费PDF全文
分水岭变换是一种非常适用于图象分割的形态算子,然而,基于分水岭变换的图象分割方法,其性能在很大程度上依赖于用来计算待分割图象梯度的算法。为了高效地进行分水岭变换,提出了一种计算图象形态梯度的多尺度算法,从而对阶跃边缘和“模糊”边缘进行了有效的处理,此外,还提出了一种去除因噪声或量化误差造成的局部“谷底”的算法,实验结果表明,图象采用本文算法处理后,再进行分水岭变换,即使不进行区域合并,也能产生有意义的分割,因而极大地减轻了计算负担。  相似文献   

13.
传统的分水岭算法直接对图像的梯度图进行分割,梯度算子由于受噪声或量化误差的影响而产生很多局部最小值,从而导致严重的过分割现象,如何消除其过分割现象一直以来都是研究的热点。本文介绍一种广义形态滤波器,使用两组适应不同形状要求的含有四个结构的结构元素来构成一个滤波器组,用于分水岭算法的预处理,在平滑原始图像的同时去除了易造成过分割的区域细节和噪声,有效地抑制了分水岭算法的过分割现象,然后使用分水岭算法,获得了较好的分割效果。  相似文献   

14.
一类自适应顺序形态滤波器   总被引:5,自引:1,他引:4       下载免费PDF全文
提出了一类自适应顺序形态滤波器,建立了排序运算的隐含表达式,并在最小均方误差(MSE)和最小平均绝对误差(MAE)准则下,实现了结构元素和百分位值的自适应处理,该滤波器不仅可以有效地抑制信号中的各种噪声,而且较好地保持了信号的几何特征,计算机仿真结果证实了滤波算法在噪声图象恢复方面有较好的效果。  相似文献   

15.
形态学梯度重建的改进快速分水岭算法   总被引:3,自引:0,他引:3  
提出一种基于形态学梯度重建的改进快速分水岭分割算法。该方法在形态学梯度图像基础上,利用形态学开闭重建运算对梯度图像进行重建;定义了分水岭的强度指标--落差,基于此对快速分水岭算法进行了改进,并将此算法结合图像重建进行了仿真实验,整个分割过程无需进行分割后的区域合并处理,降低了分割的复杂性。仿真实验证明,改进的算法无论从消除过分割还是区域轮廓定位等性能方面,均具有较好的分割效果。  相似文献   

16.
基于形态学梯度重构和标记提取的分水岭图像分割   总被引:12,自引:3,他引:9       下载免费PDF全文
为了解决传统分水岭算法的过分割问题,提出一种使用形态学梯度重构和标记提取技术进行图像预处理的分水岭图像分割方法。该方法基于多尺度概念,进行梯度重构时采用了不同尺寸的结构元素,在对重构后的各梯度图像的区域极小值进行标记后,将各标记点的并集作为最终标记图像,用其修改梯度图像,然后进行分水岭变换,实现图像的区域分割。实验结果表明,该方法既能有效解决分水岭算法的过分割问题,又保留了各尺度下的重要目标,并且可以根据图像特点和具体的分割要求,调整分割过程中所选参数,得到满意的图像分割效果。  相似文献   

17.
基于多尺度形态滤波的分水岭图像分割方法   总被引:20,自引:2,他引:20  
采用多尺度形态滤波器对输入噪声图像及滤波后图像的梯度图像进行平滑,实现了消除噪声、简化图像、保持物体重要轮廓信息的作用.最后,给出一种改进的快速区域合并算法优化分割结果.实验证明,采用文中分割方法可以获得很好的分割结果。  相似文献   

18.
基于形态学尺度空间的多尺度图像分割研究   总被引:1,自引:0,他引:1  
刘海华  陈州徽  谢长生 《计算机工程》2006,32(11):197-199,215
给出了图像层次分割的新架构,阐述了基于重构形态学操作的尺度空间产生方法,提出了基于形态学尺度空间和形态学分水岭的多尺度分割策略,其目的是生成图像的分割堆栈,并通过链接技术获得有意义的对象分割。该文给出了对各种图像的分割的实验结果,验证了分割策略的有效性。  相似文献   

19.
语音的电子伪装是指采用变声设备或语音处理软件改变说话人的个性特征,以达到故意隐藏该说话人身份的目的。电子伪装语音还原是指通过技术手段将伪装语音变回原声,这对基于语音的身份鉴别具有重要意义。本文将频域和时域伪装语音的还原问题抽象为伪装因子的估计问题,通过基于i-vector的自动说话人确认方法估计伪装因子,并引入对称变换进一步提高估计效果。该方法借助于i-vector的噪声鲁棒性,提高了真实含噪场景下伪装因子的估计精度,从而改进了噪声条件下电子伪装语音的还原效果。在干净语音库TIMIT上训练i-vector并在含噪语音库VoxCeleb1上对本文方法进行测试,结果表明,伪装因子估计的错误率从基线系统的9.19%降低为4.49%,还原语音在自动说话人确认等错误率和听觉感知方面也取得了提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号