首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 264 毫秒
1.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

2.
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语诃胜标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述.  相似文献   

3.
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.  相似文献   

4.
本文对维吾尔语智能输入法及其关键技术进行了研究和探讨.在对当前手机中使用的维吾尔语输入法进行分析的基础上,研发了一种手机维吾尔语智能输入法,该输入法具有用户按键次数少,输入速度快等特点.在Microsoft Visual C++6.0集成开发环境下,模拟手机键盘实现了本输入法.  相似文献   

5.
本文叙述了以大规模真实语料为事实依据的维吾尔语框架语义文档的基本结构,建立了维吾尔语框架语义文档的XML文档树数据模型及标记树,指出了树的阅读顺序,用XML标记建立维吾尔语框架语义文档的方法.  相似文献   

6.
维吾尔语句子边界识别算法的设计与实现   总被引:2,自引:0,他引:2  
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义.  相似文献   

7.
构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。  相似文献   

8.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

9.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

10.
在维吾尔语语音识别研究工作中,由于语音标注工作量大、精度要求高,人工标注之后不可避免的存在各种错误,因此通过专门的复查软件来检查已标注过的文件并修改错误是必不可少的。对已标注的语音文件进行复查操作在语音识别研究中具有十分重要的作用,本文介绍了维吾尔语语音标注复查软件的必要性及基本原理,复查软件的功能及其实现过程的一些技术。  相似文献   

11.
很多专业软件不支持标准维吾尔文Unicode字符表达,而软件本地化过程中迫切需要合适工具解决编码的转换问题.本文针对一个Visual Basic 6.0开发的地理信息系统工具软件维吾尔文本地化问题,运用了一种可将Unicode字符转换为Visual Basic 6中的Chrw函数表达式,有效解决了VB6开发工具采用ANSI编码而对Unicode编码的维吾尔文字符支持不够无法显示的问题.该转换工具用Visual C#开发,支持VB6环境下用标准维吾尔文Unicode字符编码替换各种文本,满足用标准维吾尔文Unicode编码编写程序底层代码,或是替换原有非Unicode维文字符的需求,经测试该工具达到预期目标.  相似文献   

12.
本文以维哈柯汉多语种、多向词典为背景,指出了语言所特有的一些技术难点,这些技术难题包括:如何识别书写方向,如何区分维哈柯字母。针对这些问题,本文给出了相应的解决方案,例如:用XML属性和Unicode区域分析来决定书写方向,计算特殊字母出现的频率并选择用户定义字体。最后通过实验验证我们的方案的可行性。  相似文献   

13.
本文对嵌入式Windows CE.Net操作系统的主要体系结构进行剖析.研究设计出了维吾尔文本地化环境,利用资源编译器编译和反编译功能,构建了基于Windows CE.Net平台的维吾尔文图形用户界面资源库,实现Windows CE.Net的界面维文化和基于Windows CE.Net的应用程序的维文支持;开发了输入法程序,实现Windows CE.Net的维吾尔文字键盘输入和软键盘输入;通过编制维吾尔文字库,为Windows CE.Net平台下维吾尔文字的显示、打印提供了基础.  相似文献   

14.
面向Android手机用户,特别是其中母语为维吾尔语的少数民族群众,提供一种对新疆县域天气情况可进行维汉双语查询的动态天气服务移动GIS系统客户端.解决方案:在移动终端设备安装自主研发获取的动态天气服务移动GIS系统客户端APK文件及维吾尔文MultiLing输入法,将服务端Google Maps API地图服务组件与实时Yahoo Weather RSS天气信息集成,在微软网页自定义字体技术的支持下,为移动用户提供维汉双语的动态天气信息查询系统.  相似文献   

15.
本文采用统计和规则相结合的混合策略,提出一种维吾尔人名的自动识别方法.该方法利用知识库中的统计信息,对维吾尔人名做初步的提取,分析维吾尔人名构成的各类特征,提取特征集,总结相应的识别规则,对候选人名进行识别,并消除歧义.在此基础上构建了维吾尔人名识别系统,并对系统进行了封闭和开放测试,实验结果表明,封闭测试的准确率达到88.47%,召回率达到85.1%.  相似文献   

16.
在研究Android平台文本排版显示引擎和维吾尔文特点的基础上,通过分析维吾尔文本在多款阅读器上显示时出现的问题,找出不支持显示维文文本的原因。最后根据维吾尔文特点进行分析并设计维文阅读器架构,该架构的核心是在阅读器应用层进行维文显示渲染引擎的设计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号