共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
3.
拼写纠正在拼音输入法中的应用 总被引:7,自引:1,他引:6
中文输入法一直是中文语言研究的一个难题,文中以拼音整句输入法为基础,提出了在中文输入过程中的拼写自动修改,通过对用户输入过程中所犯各种错误的分析,建立了一种有效可行的打字模型,通过收集用户真实输入的数据,统计得到用户的打字模型的参数;同时基于大量的中文文本,训练得到一个强大的中文语言模型,并与中文的打字模型相结合,采用类似语音识别的技术,修改用户输入中的各种错误,并得到最适合的汉字。同时,拼写纠正不仅可以进行用户自适应,而且还适用于各种语言。 相似文献
4.
曹建 《电脑技术——Hello-IT》1998,(6):40-43
Windows95中文版给用户提供了开放式的系统环境和开发条件,用户只要提供标准格式的输入法码表原文件,通过Wndows95内置的输入法生成器,即可生成完全具有Windows95特性和功能的中文输入法。Windows95的这一特性,极大地丰富了中文用户的输入手段。例如,五笔字型输入法在中文输入法中占有重要地位,但中文Windows95却没有提供该输入法,这对用惯了五笔字型进行汉字快速录入的用户来说,确是一件憾事。下面我们就以创建五笔字型输入法为例,介绍输入法生成器的基本操作及生成中文输入法的方法。生成输入法的条件输入法生成器可以生成满足… 相似文献
5.
方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节。目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗时耗力。 随着信息技术的发展,人们的交流广泛通过网络进行,而输入法数据包含海量的语料资源以及地域信息,可以帮助进行方言词汇语料的自动发现。然而,目前尚没有文献研究如何利用拼音输入法数据对方言词汇进行系统化分析,因此在本文中,我们探讨借助中文输入法的用户行为来自动发现各地域方言词汇的方法。特别的,我们归纳得到输入法数据中表征方言词汇的两类特征,并基于对特征的不同组合识别方言词汇。最后我们通过实验评价了两类特征的不同组合方法对方言词汇识别效果的影响。 相似文献
6.
与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。 相似文献
7.
基于规则库的汉字输入法自动评测系统的设计 总被引:3,自引:2,他引:3
汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价,从而帮助软件开发人员和输入法用户进行自我改进或评估,有其十分积极的意义。本文在实际应用基础上,提出了通过汉字输入系统输入规则库的建立,在选定的输入法状态下,通过计算机自动模拟汉字输入得到输入法码本,并以码本为基础根据信息技术国家标准完成输入法性能自动评价的思路。 相似文献
8.
针对现有嵌入式中文输入系统输入设备种类支持单一、中文输入引擎效率低、用户体验差等问题,提出一种基于MicroWindows的智能中文输入系统。系统首先在前端的设备输入实现层模块式完成了不同类型的设备消息封装投递,然后在消息处理中心对各种输入设备的投递信息进行集中处理,通过统一分发处理的方式编码为输入法处理的消息类型,最后结合改进N元文法模型与用户模型实现中文输入引擎。MIPS等硬件平台的实际应用结果表明,该系统运行状态良好,汉字输入流畅快捷,比以往的中文输入方式提高了35%的输入效率。 相似文献
9.
继中文Windows和中文Word相继推出以来,Windows已成为文字处理方面的大师。中文Windows提供的全拼和双拼两种汉字输入法也以其优越的性能需切换输入状态,十分不便。笔者编写的DOS应用程序WPYEX.EXE更改了Win-dows全拼输入法中的底层代码,使得用户在全拼字词状态下直接便可输入扩充词汇。 WPYEX.EXE采用汇编语言编写,在MASM5.0下编译通过,驻留内存约占1200字节。该程序通过INT CDH中断与Windows中拼音代码取得联系并将扩充词汇传入Win-dows。扩充词汇采用标准双拼双音码。 用户可根据需要加入更多的词汇,只是程序驻留长度也需相应加大。这里假设中文Windows位于C盘\WINDOWS目录下,下面列出了制作该程序的具体步骤: 相似文献
10.
曾经,苹果iOS输入法对中文输入的优化不太友好,因此很多用户会在越狱之后安装第三方输入法替换。不过,越狱会影响系统安全,而升级iOS7系统后,中文输入已经有了明显的改观。 相似文献
11.
汉语动词-动词搭配规则与分布特征 总被引:4,自引:0,他引:4
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。论文面向中文信息处理,通过对真实文本的统计分析归纳了用于自动获取搭配的规则,研究了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征,在此基础上提出了抽取动宾、动补、连谓和并列四种关系的动词-动词搭配的适宜观察窗口。 相似文献
12.
汉字双向有穷自动机的研究 总被引:3,自引:1,他引:3
汉字的计算机输入是中文信息处理的关键问题之一,而汉字计算机输入的数学模型对汉字的计算机输入的研究有重要的意义。本文从自动机理论的角度对汉字输入的数学模型进行了研究,把控制操作引入了输入模型,并给出确定汉字双向有穷自动机和不确定汉字双向有穷自动机的模型。新的模型较之以前的数学模型,能刻画出汉字输入的控制操作,表达能力进一步增强,是对以前汉字键盘输入数学模型的推广。 相似文献
13.
14.
15.
16.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。 相似文献
17.
具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。 相似文献
18.
19.
20.
进一步的“正易全”——三级汉字编码输入法 总被引:1,自引:0,他引:1
本文报告“正易全”汉字输入法的新进展。从整体上来讲,正易全已发展成为全字笔顺、全字笔组和2 21 笔组三级输入法系列。前两级简单灵活,键选率极低,方便大字集查检;第三级在常用字和通用字中表现极佳,适合日常快速打字。在编码技术上,多笔笔组码元的选用、单结构的定义和多结构字的二部划分等方面都作了进一步的简化、系统化和规律化。此外,码表在GB1300011 字符集的基础上增加了1164 个港澳台地区用字或字形。 相似文献