排序方式: 共有4条查询结果,搜索用时 129 毫秒
1
1.
2.
词表的质量直接影响汉语语言模型的性能, 而当前汉语词典编撰工作同语言建模工作相脱离, 一方面使得现有的汉语语言模型受词表规模所限, 性能不能发挥到最优, 另一方面因为缺乏专业领域的词表, 难以建立面向特定领域的语言模型. 本文旨在通过建立优化词表的方式来提高现有汉语语言模型的性能, 并使其自动适应训练语料的领域. 本文首先将词表自动生成工作同汉语语言建模工作相结合, 构建一体化迭代算法框架, 在自动生成优化词表的同时能够获得高性能的汉语语言模型. 在该框架下, 本文提出汉字构词强度的概念来描述汉语的词法信息, 并将其作为词法特征与统计特征相结合, 构造一种基于多特征的汉语词表自动生成算法. 最后, 本文提出两种启发式方法, 自动根据训练语料的特点调整系统中的各项参数, 使系统能够自动适应训练语料的领域. 实验表明, 本文的方法能够在生成高质量词表的同时获得高性能的语言模型, 并且能够有效自动适应训练语料的领域. 相似文献
3.
针对基于数字键盘的语句级拼音汉字输入技术,提出了键音转换问题,并给出了解决方案.首先,形式化地定义了键音转换问题,并根据Bayes原理推导出两种键音转换处理模型.然后将键音转换问题转化为有向无环图的路径搜索问题,根据两种处理模型,分别描述了搜索空间并定义了搜索算法.实验结果表明提出的算法能够有效地解决该问题. 相似文献
4.
1