首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提.语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要.文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法.  相似文献   

2.
在自然语言处理中,词类划分属于基础研究,其重要性不可忽视。文章以明确藏语词类划分的标准入手,根据藏语自身的特点和规律性、系统性,从藏文信息处理的角度出发,提出了自己的见解和分类方法,致力于探索藏语词类的划分标准,为藏文信息处理各个层次的发展进行最基础的研究。  相似文献   

3.
基于藏语信息处理的词类体系研究   总被引:2,自引:0,他引:2  
在自然语言处理中,词类划分属于基础研究,其重要性不可忽视。文章以明确藏语词类划分的标准入手,根据藏语自身的特点和规律性、系统性,从藏文信息处理的角度出发,提出了自己的见解和分类方法,致力于探索藏语词类的划分标准,为藏文信息处理各个层次的发展进行最基础的研究。  相似文献   

4.
藏语虚词研究是藏语自然语言处理中一项不可缺少的基础性工作,有着极其广泛的实际应用价值.它是藏文信息处理的核心和藏语自然语言理解的基础,在藏文校对、信息检索、双语对译、自动分类等技术中有着广泛的应用前景.文章在前人研究的基础上,结合信息处理,从不自由虚词的分类体系、形式化描述等角度对藏语虚词la格的语法功能做了一些探讨,重点论述了藏语虚词la格的语法功能,提出藏语虚词规范的初步设想和处理方法.  相似文献   

5.
藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提。语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要。文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法。  相似文献   

6.
基于统计的语料库语言学已经成为语言信息处理研究的主要方法 .文章就1 341个藏文的单音节动词,从形态、句法和语义等层面归纳为17类属性,在此基础上,统计动词各类形态结构的数据,描述了每个动词的特征信息,分析藏语动词在句法和语义结构之间的对应关系,构建了一个以形态和句法特征为主、兼顾语义信息的藏语动词知识库,为进一步搭建藏语动词框架语义库和创建藏语句法树库奠定了基础.  相似文献   

7.
随着信息技术的飞速发展,办公套件是人们日常应用最为广泛的信息处理软件之一,作为藏文信息处理的重要组成部分,开发符合藏文应用习惯的办公套件产品对于传承民族文化具有重要意义。开源项目OpenOffice.org的不断发展和日益成熟,为藏文办公套件的研制与开发提供了有利的条件。文章以讲述0penomce.org为源代码基础,采用藏文编码字符集国家标准,并支持藏文书写和编排习惯的藏文办公套件研发的思路,研究和分析了OpenOffice.org的本地化框架实现的关键技术。  相似文献   

8.
随着信息技术的飞速发展,办公套件是人们日常应用最为广泛的信息处理软件之一,作为藏文信息处理的重要组成部分,开发符合藏文应用习惯的办公套件产品对于传承民族文化具有重要意义。开源项目OpenOffice.org的不断发展和日益成熟,为藏文办公套件的研制与开发提供了有利的条件。文章以讲述0penomce.org为源代码基础,采用藏文编码字符集国家标准,并支持藏文书写和编排习惯的藏文办公套件研发的思路,研究和分析了OpenOffice.org的本地化框架实现的关键技术。  相似文献   

9.
藏语文-音自动规则转换及其实现   总被引:2,自引:0,他引:2  
为满足语言学、音韵学和工程语音学的需要,该文根据现代藏文与3大方言语音之间的对应规律和藏文正字法,提出了从文字上对藏文声母和韵母拆分的"字丁分解法",实现了藏文到各方言国际音标的自动转换.并对算法和实现过程进行了详细的阐述,建立了藏语13个方言点的方音数据库.方音数据库的建立为藏语方言研究和语言教学提供了科学、方便的工具,为藏语标准音的制定、推广及应用提供原始的语音材料,也能作为藏语语音识别和语音合成的标音基础.  相似文献   

10.
藏文有着悠久的历史,是藏族人民交流思想的工具。1997年,藏文编码字符集国际、国家标准的制定作为藏文信息处理的开始,至今正好20年。这20年中藏文信息处理起步、发展,取得了较好的成绩。本文简要回顾了藏文信息处理中字、词、句、段、篇的特点、处理方法及取得的典型成果,也回顾了藏语资源建设和应用研究取得的成果,并对藏文信息处理未来的发展方向进行展望。希望能为迈入藏文信息处理的初学者展示一个藏文信息处理发展的脉络,提供一个参考。  相似文献   

11.
叶西切忠  安见才让 《科技信息》2011,(31):236-236,256
藏文分词是藏文信息处理领域的一项不可缺少的基础性工作,也是智能化藏文信息处理的关键所在。在藏文分词的研究过程中藏文分词的准确性,直接制约着藏文输入法研究、藏文电子词典建设、藏文词频统计、搜索引擎的设计和实现、机器翻译系统的开发、藏文语料库建设以及藏语语义分析研究等高层藏文信息处理技术的进一步发展。本文借鉴汉语的分词理论和方法,提出符合藏文特性的分词方法,以及歧义字段切分和未登录词识别等相关问题,并举例说明。  相似文献   

12.
本文针对语言信息处理中建设藏语语料库及藏文信息词典库需要,根据藏文的语法功能及特点,借鉴汉语信息词典建设研究的成功经验,用数学分类的思想———每个个体属于而且只属于其中一个类的原则,提出了现代藏文词性的分类方法.  相似文献   

13.
藏文文本资源的收集对藏语信息处理研究有着至关重要的作用.文章在分析国内外藏文网页主要编码方式的基础上,提出了藏文网页的编码识别、自动获取与过滤,文本编码统一转换的算法.系统主要包括网页编码识别网页、自动获取、文本过滤、编码转换等几个模块.在windows平台下对系统的测试结果良好,为藏语电子文本的收集和整理提供了方便、快捷的平台.  相似文献   

14.
藏文句子边界识别作为藏文信息处理研究领域中的一项重要工作,在词法分析、句法分析、语义分析和机器翻译等领域都具有广泛的应用.在分析藏语句子的概念、分类和边界特征的基础上,提出一种基于混合策略的藏文句子边界识别方法.经实验模型在测试数据集上的F值达99.25%.  相似文献   

15.
文章以藏文传统文法理论为依据,以具有黏着性和屈折性变化的动词特征作为研究对象,分析和说明了藏语动词的各个式和时态下其形态的变化情况,并从中总结了拟测式、判断式、否定式、命令式、推断式等5种式和3个时态的分类.这对藏语动词属性库的建立和分类精细化方面提供了新的视角,并且为词性标注、自动分词、机器翻译、自然语言理解等藏文信息处理领域的各项研究工作打下了基础.  相似文献   

16.
何明华 《科技资讯》2014,12(23):249-249
藏文有着非常悠久的历史,藏文作为一种文化符号对藏民族文化的传承起到了非常积极的作用,随着信息化时代的到来,藏文信息处理技术成为了藏文化传承的一种重要的手段,本文立足于藏文的信息处理现状,结合臧文的发展状况对藏文信息处理从技术层面和文化传承方面进行了分析.  相似文献   

17.
用框架表示知识是人工智能乃至语言工程中一项最为重要的基础工程和基础资源之一.文章结合实例分析了藏语词语语义框架,并通过对词语认知过程的理解来组织框架,进而对框架进行结构信息的描述.  相似文献   

18.
俗语和谚语是语言和文化的重要组成部分,作为熟语的一种,它们反映了各民族文化的精髓.从英汉俗语和谚语的研究入手,不仅有助于我们了解各民族的文化特征,同时有助于我们从不同文化的角度去体会俗语和谚语中的文化内涵.  相似文献   

19.
回顾藏文信息处理技术的发展   总被引:3,自引:1,他引:2  
藏文有着悠久的历史,藏文字包含着丰富的信息。信息时代,对藏文的处理提出了新的研究课题——用计算机来处理藏文信息。八十年代中后期开始了藏文信息的研究工作,并且取得了较好的成绩。文章详细回顾了藏文的字处理、藏语自然语言处理、藏文软件本地化以及藏文信息处理在应用领域中的研究。  相似文献   

20.
二十一世纪被誉为信息时代,在信息时代,信息技术的发展水平将成为衡量一个国家,一个地区或一个民族科学技术发展水平的重要标志。而文字的信息处理则是信息技术的重要组成部分。本文从藏文信息处理技术的现状、存在的问题及其前景三个方面概述了当前藏文信息处理技术的发展水平,应用情况以及在技术方面存在的问题和在计算机技术各个领域的发展前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号