首页 | 官方网站   微博 | 高级检索  
     

大型藏语平衡语料库建设中样本类别号的研究
引用本文:高定国,索郎桑姆.大型藏语平衡语料库建设中样本类别号的研究[J].西藏大学学报,2013(4).
作者姓名:高定国  索郎桑姆
作者单位:西藏大学工学院 西藏拉萨850000
基金项目:2011年度国家自然科学基金项目"基于虚词的藏语基本句型的形式化研究",2011年度国家自然科学基金项目"藏语依存树库的构建",2005年度年度国家语委项目"大型藏文基础语料库建设",2011年度西藏自治区科技计划项目"基于语料库的藏语词汇计量研究"阶段性成果
摘    要:藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提.语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要.文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法.

关 键 词:藏语  语料库  样本  类别号

Research on the Type number of Samples in the Construction of Large Tibetan Language Balanced Corpus
Affiliation:Gao Ding-guo Sonam-Sangmu
Abstract:
Keywords:
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号