首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
该文通过对现有智能手机上的输入方式进行分析,把输入法分解为中文、英文和数字三种不同的输入状态,再结合GOF一书中的状态设计模式,给出了一个基于有限状态机的智能手机输入模型,这种输入模型可以用于Windows mobile系统, Symbian的S60系统等多种智能手机系统上的输入法开发。这样不但能简化智能手机上输入法的开发工作,而且也为多种智能平台上的输入法维护和升级提供了方便。  相似文献   

2.
开发智能化的输入法是维吾尔文输入技术的一个发展方向,也是维吾尔文自然语言信息处理的基础性研究课题。该文根据维吾尔文自身特点,对用户输入过程中所犯各种错误进行分析,设计并实现了词语搭配知识库,提出了基于二元语法模型的一种新型维吾尔文输入算法,并给出了实现其关键模块功能的程序流程图。它具有自动预测、自动联想输入和自动校对等功能。  相似文献   

3.
拼写纠正在拼音输入法中的应用   总被引:7,自引:1,他引:6  
陈正  李开复 《计算机学报》2001,24(7):758-763
中文输入法一直是中文语言研究的一个难题,文中以拼音整句输入法为基础,提出了在中文输入过程中的拼写自动修改,通过对用户输入过程中所犯各种错误的分析,建立了一种有效可行的打字模型,通过收集用户真实输入的数据,统计得到用户的打字模型的参数;同时基于大量的中文文本,训练得到一个强大的中文语言模型,并与中文的打字模型相结合,采用类似语音识别的技术,修改用户输入中的各种错误,并得到最适合的汉字。同时,拼写纠正不仅可以进行用户自适应,而且还适用于各种语言。  相似文献   

4.
Windows95中文版给用户提供了开放式的系统环境和开发条件,用户只要提供标准格式的输入法码表原文件,通过Wndows95内置的输入法生成器,即可生成完全具有Windows95特性和功能的中文输入法。Windows95的这一特性,极大地丰富了中文用户的输入手段。例如,五笔字型输入法在中文输入法中占有重要地位,但中文Windows95却没有提供该输入法,这对用惯了五笔字型进行汉字快速录入的用户来说,确是一件憾事。下面我们就以创建五笔字型输入法为例,介绍输入法生成器的基本操作及生成中文输入法的方法。生成输入法的条件输入法生成器可以生成满足…  相似文献   

5.
方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节。目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗时耗力。 随着信息技术的发展,人们的交流广泛通过网络进行,而输入法数据包含海量的语料资源以及地域信息,可以帮助进行方言词汇语料的自动发现。然而,目前尚没有文献研究如何利用拼音输入法数据对方言词汇进行系统化分析,因此在本文中,我们探讨借助中文输入法的用户行为来自动发现各地域方言词汇的方法。特别的,我们归纳得到输入法数据中表征方言词汇的两类特征,并基于对特征的不同组合识别方言词汇。最后我们通过实验评价了两类特征的不同组合方法对方言词汇识别效果的影响。  相似文献   

6.
与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。  相似文献   

7.
基于规则库的汉字输入法自动评测系统的设计   总被引:3,自引:2,他引:3  
汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价,从而帮助软件开发人员和输入法用户进行自我改进或评估,有其十分积极的意义。本文在实际应用基础上,提出了通过汉字输入系统输入规则库的建立,在选定的输入法状态下,通过计算机自动模拟汉字输入得到输入法码本,并以码本为基础根据信息技术国家标准完成输入法性能自动评价的思路。  相似文献   

8.
周慧娟  向荣 《计算机应用》2013,33(7):2067-2070
针对现有嵌入式中文输入系统输入设备种类支持单一、中文输入引擎效率低、用户体验差等问题,提出一种基于MicroWindows的智能中文输入系统。系统首先在前端的设备输入实现层模块式完成了不同类型的设备消息封装投递,然后在消息处理中心对各种输入设备的投递信息进行集中处理,通过统一分发处理的方式编码为输入法处理的消息类型,最后结合改进N元文法模型与用户模型实现中文输入引擎。MIPS等硬件平台的实际应用结果表明,该系统运行状态良好,汉字输入流畅快捷,比以往的中文输入方式提高了35%的输入效率。  相似文献   

9.
继中文Windows和中文Word相继推出以来,Windows已成为文字处理方面的大师。中文Windows提供的全拼和双拼两种汉字输入法也以其优越的性能需切换输入状态,十分不便。笔者编写的DOS应用程序WPYEX.EXE更改了Win-dows全拼输入法中的底层代码,使得用户在全拼字词状态下直接便可输入扩充词汇。 WPYEX.EXE采用汇编语言编写,在MASM5.0下编译通过,驻留内存约占1200字节。该程序通过INT CDH中断与Windows中拼音代码取得联系并将扩充词汇传入Win-dows。扩充词汇采用标准双拼双音码。 用户可根据需要加入更多的词汇,只是程序驻留长度也需相应加大。这里假设中文Windows位于C盘\WINDOWS目录下,下面列出了制作该程序的具体步骤:  相似文献   

10.
曾经,苹果iOS输入法对中文输入的优化不太友好,因此很多用户会在越狱之后安装第三方输入法替换。不过,越狱会影响系统安全,而升级iOS7系统后,中文输入已经有了明显的改观。  相似文献   

11.
汉语动词-动词搭配规则与分布特征   总被引:4,自引:0,他引:4  
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。论文面向中文信息处理,通过对真实文本的统计分析归纳了用于自动获取搭配的规则,研究了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征,在此基础上提出了抽取动宾、动补、连谓和并列四种关系的动词-动词搭配的适宜观察窗口。  相似文献   

12.
汉字双向有穷自动机的研究   总被引:3,自引:1,他引:3  
汉字的计算机输入是中文信息处理的关键问题之一,而汉字计算机输入的数学模型对汉字的计算机输入的研究有重要的意义。本文从自动机理论的角度对汉字输入的数学模型进行了研究,把控制操作引入了输入模型,并给出确定汉字双向有穷自动机和不确定汉字双向有穷自动机的模型。新的模型较之以前的数学模型,能刻画出汉字输入的控制操作,表达能力进一步增强,是对以前汉字键盘输入数学模型的推广。  相似文献   

13.
随着以PDA和智能手机为代表的手持设备快速发展,汉字输入法选择余地小的缺点已经成为影响其普及的障碍之一。究其原因是手持设备中的操作系统和物理设备类型多,而开发的汉字输入法在不同手持设备中不通用,造成开发效率低。本文介绍了一个适用于手持设备的多层的通用汉字输入法模型,详细描述了模型中每一层的功能和特点,讲解了如何基于该模型实现一个输入法,并概要论述了本模型的优点。  相似文献   

14.
基于机器理解的汉语隐喻分类研究初步   总被引:6,自引:1,他引:6  
本文将汉语隐喻分类计算模型的研究引入汉语的机器理解当中,通过对大规模汉语隐喻语料的研究分析,结合汉语隐喻的认知特征,笔者构建了一套基于理解的汉语隐喻分类体系。分类主要以汉语隐喻句中本体和喻体的内在相似性作为切入点,从隐喻理解的方式、理解的难易程度以及理解所涉及的相关知识结构等方面进行综合分析,同时,辅以真实语料的统计分析,对分类的合理性作出了验证和修订,最终给出了基于理解的汉语隐喻分类体系,并对该体系作出了语言学上的比较和解释。  相似文献   

15.
不基于OS的汉字文稿处理系统CCPS的设计   总被引:1,自引:1,他引:0  
  相似文献   

16.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。  相似文献   

17.
具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。  相似文献   

18.
中文信息检索系统的模糊匹配算法研究和实现   总被引:3,自引:0,他引:3  
在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到“子线性”的效率。  相似文献   

19.
基于框架的词语搭配自动抽取方法   总被引:4,自引:1,他引:4  
曲维光  陈小荷  吉根林 《计算机工程》2004,30(23):22-24,195
提出了一种基于框架的词语搭配抽取方法,可以同时获取词语搭配以及搭配结构信息。引入相对词序比(RRWR)的方法对候选搭配词语进行筛选,应用语言学中词语搭配组合规律对候选搭配的词性进行限定,利用互信息等统计学模型在大规模语料中进行词语搭配的自动抽取,抽取的搭配平均准确率为84.73%,较Xtract系统高4.7%,较国内同类工作结果高50.79%。并且在获得搭配的同时得到了词语搭配的结构信息。  相似文献   

20.
进一步的“正易全”——三级汉字编码输入法   总被引:1,自引:0,他引:1  
本文报告“正易全”汉字输入法的新进展。从整体上来讲,正易全已发展成为全字笔顺、全字笔组和2 21 笔组三级输入法系列。前两级简单灵活,键选率极低,方便大字集查检;第三级在常用字和通用字中表现极佳,适合日常快速打字。在编码技术上,多笔笔组码元的选用、单结构的定义和多结构字的二部划分等方面都作了进一步的简化、系统化和规律化。此外,码表在GB1300011 字符集的基础上增加了1164 个港澳台地区用字或字形。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号