共查询到20条相似文献,搜索用时 250 毫秒
1.
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 相似文献
2.
3.
4.
远程监督是关系抽取领域重要的语料扩充技术,可以在少量已标注语料的基础上快速生成伪标注语料。但是传统的远程监督方法主要应用于单语种文本,维吾尔语等低资源语言并不能使用这类方法得到伪标注语料。针对上述问题,提出一种针对维汉的跨语言远程监督方法,在无语料的情况下利用现有的汉语语料进行维语语料的自动扩充。将远程监督视为文本语义相似度计算问题而不是简单的文本查找,从实体语义和句子语义2个层面判断维语和汉语句子对是否包含同一关系,若为同一关系则将已有的汉语标注转移到维语句子上,实现维语语料从零开始的自动扩充。此外,为有效捕获实体的上下文和隐藏语义信息,提出一种带有门控机制的交互式匹配方法,通过门控单元控制编码层、注意力层之间的信息传递。人工标记3 500条维语句子和600条汉语句子用于模拟远程监督过程并验证模型的性能。实验结果表明,该方法 F1值达到73.05%,并且成功构造了包含97 949条维语句子的关系抽取伪标注数据集。 相似文献
5.
语义角色标注研究对自然语言处理具有十分重要的意义。英汉语语义角色标注研究已经获得了很多成果。然而藏语语义角色标注研究不管是资源建设,还是语义角色标注的技术探讨都鲜有报道。藏语具有比较丰富的句法标记,它们把一个句子天然地分割成功能不同的语义组块,而这些语义组块与语义角色之间存在一定的对应关系。根据这个特点,该文提出规则和统计相结合的、基于语义组块的语义角色标注策略。为了实现语义角色标注,文中首先对藏语语义角色进行分类,得到语义角色标注的分类体系;然后讨论标注规则的获得情况,包括手工编制初始规则集和采用错误驱动学习方法获得扩充规则集;统计技术上,选用了条件随机场模型,并添加了有效的语言特征,最终语义角色标注的结果准确率、召回率和F值分别达到82.78%、85.71%和83.91%。 相似文献
6.
提出了一种词汇和本体概念间的语义相似度计算方法。该方法利用编辑距离和维基百科从语法和语义两方面综合考虑词汇和概念间的语义相似度。在领域本体的指导下,将方法应用于语义标注过程,建立词汇与本体概念之间的映射。在标注过程中建立知识库,提高算法性能,实验结果说明该方法是行之有效的。 相似文献
7.
浑洁絮 《计算机工程与应用》2009,45(16):24-27
词语隐喻意义的机器识别和正确翻译是机译的难点。提出了语义语法模式的概念、提取方法以及一种基于语义语法模式集、固定搭配集和变量表示库的英语隐喻识别与汉译的合一算法。语义语法模式集包括语法隐喻模式集、词汇隐喻模式集、字面意义模式集、短语模式集、构句模式集等子集。以人体词为研究对象,构建了英语人体词的语义语法模式集、固定搭配集和变量表示库。实验表明,该方法能有效解决英语人体隐喻的识别与汉译问题。 相似文献
8.
手语是一门语言,手语语言学家从语言学的角度,对手语做了类似"语法"的总结而形成了音韵标注理论.针对目前中国手语无符号标记体系的现况,首先,根据中国手语的特点并结合汉语的语言习惯,文中提出了中国手语音韵标记体系.其次,针对目前音韵标注只给出一些形式化的描述或简单的手工标注的现况,文中借助基于数据手套的中国手语识别系统,提出了以手形数据模板与拉班舞谱相结合的方法,将上述的标记体系在计算机上以自动标注的方式加以实现.最后,针对数据手套的中国手语识别系统缺少先验信息的现况,应用上述音韵标记体系构建具有先验语义信息的易混词集,在构建的过程中说明并分析了音韵标记体系具备语义识别能力.实验表明,在基于统计识别的易混词集与基于先验语义信息的易混词集的识别效果相比较,在不改变统计模型的条件下,可以不同程度地辅助HMM,SOFM/HMM,Effort提高识别率. 相似文献
9.
设计并实现一个词汇知识获取及语义计算平台VKASCP,以及自然语言处理所需要的基础功能模块。系统主要功能模块包括合成词识别、合成词词性标注及分词修正、主题词提取、词汇语义计算,以及基于主题词集的自动文摘和文本相似度计算。VKASCP融文本语料库、词汇知识库于一体,为词汇知识获取及语义计算提供了一个良好的研究平台,并为今后构建词汇语义知识库打下了坚实的基础。 相似文献
10.
句法分析是自然语言处理的基础技术,主流的由数据驱动的神经网络句法分析模型需要大规模的标注数据,但是通过人工标注扩展树库成本很高,因此如何利用现有标注树库进行数据增强成为研究焦点。在汉语句法分析的数据增强任务中,对于给定的标注树库,要求数据增强所生成的句子满足如下条件:第一,要求生成句具有多样化且完整的句法树结构;第二,要求生成句具有合理的语义。对此,我们首次提出基于词汇化树邻接语法的数据增强方法。针对第一个需求,该文设计实现基于词汇化树邻接语法的词汇化树抽取算法与句法树合成算法,基于该语法可以在句法树之间进行“接插”和“替换”的操作,从而推导生成新的句法树,并且用语言学的知识保证生成句符合语法规则且具有完整的句法树结构。针对第二个需求,该文利用语言模型对生成句进行语义合理性评估,选取语义合理的句子作为最终的增强数据,从而获取高质量的标注树库。我们以汉语为例开展研究,在汉语树库CTB5上进行句法分析的数据增强评测实验。实验结果显示,在小样本(CTB5的20%)实验中,通过该方法得到的增强数据使依存句法分析和成分句法分析的精度分别提高1.39%和2.14%。在鲁棒性实验中,该文通过构建扩展... 相似文献
11.
ZHANG Guo-hua 《数字社区&智能家居》2008,(33)
该文在南京师范大学语言科技研究所《元语言研究》项目组的研究成果上,对其建构的释义元语言系统进行简单介绍并通过软件对《释义元语言词表》、《现汉受限词汇表》、《释义元语言微型词典》等若干词表作了查询、增补、修改等一系列功能,以完成对释义元语言和释义词的完善工作。 相似文献
12.
This paper describes two steps in the generalization of supervisory control theory to situations where the specification is modeled by a deterministic context free language (DCFL). First, it summarizes a conceptual iterative algorithm from Schneider et al. (2014) solving the supervisory control problem for language models. This algorithm involves two basic iterative functions. Second, the main part of this paper presents an implementable algorithm realizing one of these functions, namely the calculation of the largest controllable marked sublanguage of a given DCFL. This algorithm least restrictively removes controllability problems in a deterministic pushdown automaton realizing this DCFL. 相似文献
13.
由于微机的功能不断扩大,微机CAD用户不断增加,为适应微机CAD软件开发的要求,我们对微机CAD系统中的用户界面进行了研究.本文主要介绍菜单设计原理和方法,如主菜单和子菜单之间的结构关系.菜单项的定义和设计、菜单与应用程序之间的接口关系以及如何保存和恢复被菜单覆盖掉的屏幕上的有关信息等.本系统的程序采用C语言编写,可在286、386或486微机上运行,使用较为方便. 相似文献
14.
Hans Christian Boas 《Language Resources and Evaluation》2006,40(2):153-174
New methods of documenting languages with digital technologies has led to a multitude of different formats that are difficult
to reuse over time. To overcome the problems surrounding the portability of digital language documentation, linguists are
in the process of formulating best-practice recommendations to increase the likelihood of their work's long-term survival.
This paper describes the implementation of a comprehensive set of current best-practice recommendations pertaining to content,
format, discovery, access, citation, preservation, and rights in the context of the language documentation efforts of the
Texas German Dialect Project. This project is different from others in that it is not primarily concerned with digitizing
and archiving existing recordings. Instead, the archive it is creating is the end-result of a research project whose workflow
begins with data-collection in the filed and ends with depositing digitized and annotated language materials in a web-accessible
digital archive of Texas German. This paper shows how a number of conflicting best-practice recommendations can be resolved,
thereby satisfying the diverse needs of academic research, teaching, and outreach to the community. As such, the results reported
here are an important contribution to the search for strategies guaranteeing the long-term survival of digital language documentation
resources.
相似文献
Hans Christian BoasEmail: |
15.
16.
多层DGMM识别器在中国手语识别中的应用 总被引:4,自引:0,他引:4
手语是聋人使用的语言,是由手形动作辅之以表情姿势由符号构成的比较稳定的表达系统 ,是一种靠动作/视觉交际的语言.手语识别的研究目标是让机器“看懂”聋人的语言.手 语识别和手语合成相结合,构成一个“人-机手语翻译系统”,便于聋人与周围环境的交 流.手语识别问题是动态手势信号即手语信号的识别问题.考虑到系统的实时性及识别效率, 该系统选取Cyberglove型号数据手套作为手语输入设备,采用DGMM(dynamic Gaussian mixt ure model)作为系统的识别技术,并根据中国手语的具体特点,在识别模块中选取了多层识 别器,可识别中国手语字典中的274个词条,识别率为97.4%.与基于单个DGMM的识别系统比 较,这种模型的识别精度与单个DGMM模型的识别精度基本相同,但其识别速度比单个DGMM的 识别速度有明显的提高. 相似文献
17.
汉语比较句识别研究 总被引:2,自引:0,他引:2
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为“比较”和“非比较”两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。 相似文献
18.
19.
Marsot J 《Applied ergonomics》2005,36(2):185-192
As a marked increase in the number of musculoskeletal disorders was noted in many industrialized countries and more specifically in companies that require the use of hand tools, the French National Research and Safety Institute launched in 1999 a research program on the topic of integrating ergonomics into hand tool design. After a brief review of the problems of integrating ergonomics at the design stage, the paper shows how the "Quality Function Deployment" method has been applied to the design of a boning knife and it highlights the difficulties encountered. Then, it demonstrates how this method can be a methodological tool geared to greater ergonomics consideration in product design. 相似文献