首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 375 毫秒
1.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

2.
主动学习已被证明是提升基于内容图像检索性能的一种重要技术。而相关反馈技术可以有效地减少用户标注。提出一种主动学习算法,带权Co-ASVM,用于改进相关反馈中样本选择的性能。颜色和纹理可以认为是一张图片的两个充分不相关的视图,分别计算颜色和纹理两种特征空间的权值,并在两种特征空间上分别进行SVM学习,对未标注样本进行分类;为了减少反馈样本的冗余,提出一种K-means聚类的主动反馈策略,将未标注样本返回给用户标注。实验表明,该图像检索方法有较高的准确性,并且有不错的检索效果。  相似文献   

3.
ART2神经网络在手写体汉字识别中的应用   总被引:4,自引:0,他引:4  
该文提出了一种基于神经网络的手写体汉字识别方法,该算法充分利用神经网络的自适应学习能力。ART2网络通过竞争学习和自稳机制原理实现分类,可以在非平稳的、有干扰的环境中进行无教师无监督的自学习。其学习过程是自组织的实时学习,能够迅速识别已学习过的样本,并能迅速适应未学习过的新对象。考虑到Gabor滤波器具有优良的方向性,该算法采用Gabor特征作为字符特征。Gabor特征反映字符的空间分布特征,而且可以组合成高维矢量,特别适用于汉字识别这大型模式识别场合。实验结果显示,该算法对测试样本识别正确率达到94%,比其他方法更准确、更可靠。  相似文献   

4.
手写体汉字在特征空间的可视化分析   总被引:1,自引:1,他引:0  
手写体汉字特征一般在几百维以上,在这样的高维空间中,汉字样本是如何分布的?本文从可视化的角度对这一问题进行了探讨。论文首先给出了所选用的汉字特征的定义,然后对一些具有代表性的汉字实例,从K-L变换法、线性投影法和非线性投影法三个方面,对汉字在特征空间的分布问题进行了可视化分析,结果表明,可视化分析可以帮助人们了解汉字在特征空间的分布情况,对改进识别器的性能具有指导意义。  相似文献   

5.
近年来,在微机上使用C语言编写应用程序的用户日渐增多,不少用户都喜欢在程序开头显示一个彩色画面,并配上醒目放大的汉字标题。遗憾的是C语言函数库虽有丰富的绘图功能,却没有汉字放大功能,这使用户感到很不方便。  相似文献   

6.
一种基于融合重构的子空间学习的零样本图像分类方法   总被引:1,自引:0,他引:1  
图像分类是计算机视觉中一个重要的研究子领域.传统的图像分类只能对训练集中出现过的类别样本进行分类.然而现实应用中,新的类别不断涌现,因而需要收集大量新类别带标记的数据,并重新训练分类器.与传统的图像分类方法不同,零样本图像分类能够对训练过程中没有见过的类别的样本进行识别,近年来受到了广泛的关注.零样本图像分类通过语义空间建立起已见类别和未见类别之间的关系,实现知识的迁移,进而完成对训练过程中没有见过的类别样本进行分类.现有的零样本图像分类方法主要是根据已见类别的视觉特征和语义特征,学习从视觉空间到语义空间的映射函数,然后利用学习好的映射函数,将未见类别的视觉特征映射到语义空间,最后在语义空间中用最近邻的方法实现对未见类别的分类.但是由于已见类和未见类的类别差异,以及图像的分布不同,从而容易导致域偏移问题.同时直接学习图像视觉空间到语义空间的映射会导致信息损失问题.为解决零样本图像分类知识迁移过程中的信息损失以及域偏移的问题,本文提出了一种图像分类中基于子空间学习和重构的零样本分类方法.该方法在零样本训练学习阶段,充分利用未见类别已知的信息,来减少域偏移,首先将语义空间中的已见类别和未见类别之间的关系迁移到视觉空间中,学习获得未见类别视觉特征原型.然后根据包含已见类别和未见类别在内的所有类别的视觉特征原型所在的视觉空间和语义特征原型所在的语义空间,学习获得一个潜在类别原型特征空间,并在该潜在子空间中对齐视觉特征和语义特征,使得所有类别在潜在子空间中的表示既包含视觉空间下的可分辨性信息,又包含语义空间下的类别关系信息,同时在子空间的学习过程中利用重构约束,减少信息损失,同时也缓解了域偏移问题.最后零样本分类识别阶段,在不同的空间下根据最近邻算法对未见类别样本图像进行分类.本文的主要贡献在于:一是通过对语义空间中类别间关系的迁移,学习获得视觉空间中未见类别的类别原型,使得在训练过程中充分利用未见类别的信息,一定程度上缓解域偏移问题.二是通过学习一个共享的潜在子空间,该子空间既包含了图像视觉空间中丰富的判别性信息,也包含了语义空间中的类别间关系信息,同时在子空间学习过程中,通过重构,缓解知识迁移过程中信息损失的问题.本文在四个公开的零样本分类数据集上进行对比实验,实验结果表明本文提出的零样本分类方法取得了较高的分类平均准确率,证明了本文方法的有效性.  相似文献   

7.
针对深度学习中使用少量样本完成模型训练的小样本学习问题,构建一种双路的特征聚合网络,并提出一种新的综合损失函数对网络模型的参数更新过程加以控制。通过综合损失函数,特征聚合网络可将样本映射到更具代表性的特征空间中,从而获得更优的特征分布。实验结果表明,与MN、PN等方法相比,该特征聚合网络能有效降低特征空间的复杂性,提升整体模型的分类效果。  相似文献   

8.
图像标题生成是指通过计算机将图像翻译成描述该图像的标题语句。针对现有图像标题生成任务中,未充分利用图像的局部和全局特征以及时间复杂度较高的问题,本文提出一种基于卷积神经网络(Convolution Neural Networks,CNN)和Transformer的混合结构图像标题生成模型。考虑卷积网络所具有的空间和通道特性,首先将轻量化高精度的注意力ECA与卷积网络CNN进行融合构成注意力残差块,用于从输入图像中提取视觉特征;然后将特征输入到序列模型Transformer中,在编码器端借助自注意学习来获得所参与的视觉表示,在语言解码器中捕获标题中的细粒度信息以及学习标题序列间的相互作用,进而结合视觉特征逐步得到图像所对应的标题描述。将模型在MSCOCO数据集上进行实验,BLEU-1、BLEU-3、BLEU-4、Meteor和CIDEr指标分别提高了0.3、0.5、0.7、0.4、1.6个百分点。  相似文献   

9.
基于特征脸和BP神经网络的人脸识别*   总被引:5,自引:0,他引:5  
利用类间的散布矩阵,寻找特征脸子空间,让每一类在子空间中散布得更开;然后结合BP神经网络学习能力强、分类能力强的优点,利用它实现分类器。具体是将所有的样本投影到特征脸子空间中,并将每一个样本得到的特征系数作为BP神经网络的输入。实验证明,这种方法是有效的。  相似文献   

10.
研究了邮件过滤的主要方法,提出了将Agent技术、粗糙集和最小风险的Bayes分类方法结合的邮件过滤及个性化分类模型.该模型首先利用粗糙集方法对邮件样本向量空间进行约简,然后利用已知样本对最小风险的Bayes分类器进行训练,得到具有智能分类功能的邮件分类器,利用该分类器过滤掉用户不感兴趣的邮件,并利用Agent学习用户的个性化知识,最后利用学习的知识将用户感兴趣邮件进行再分类.  相似文献   

11.
针对现有移动教育游戏无法满足快速增长的移动教育需求这个问题,利用领域工程的方法和最终用户编程(EUP)的技术,研究和设计了一种最终用户编程语言Kids。首先通过对移动平台儿童教育领域进行分析识别出儿童教育游戏的游戏元素,在此基础上对该领域进行特征的提取,得到该领域的特征模型。Kids语言以特征模型为基础进行设计,能够允许老师和家长为学龄前的儿童编写移动教育游戏。同时,开发了一个Kids的编程工具,包括可视化编辑器和代码生成引擎。该工具能够支持用户更加有效地使用Kids进行可视化编程,并自动生成Android代码。实验结果表明,Kids相比其他通用语言更加简洁,大部分最终用户能够很好地利用Kids开发工具开发出简单的儿童教育游戏。  相似文献   

12.
针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型。该模型是一种完全端到端且不涉及任何特征工程的模型,其将汉字的五笔表示进行编码以进行信息增强,同时利用迭代学习的策略不断对模型整体预测结果进行改进。由于现有的命名实体识别研究在金融领域缺乏高质量的有标注的语料库资源,所以该文构建了一个大规模的金融领域命名实体语料库HITSZ-Finance,共计31 210个文本句,包含4类实体。该文在语料库HITSZ-Finance上进行了一系列实验,实验结果均表明模型的有效性。  相似文献   

13.
王建平  陈军  徐晓冰  王熹徽 《微机发展》2006,16(10):104-107
提出了一种模糊统计方法的脱机手写体汉字特征提取方法,结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

14.
Abbreviation Completion is a novel technique to improve the efficiency of code-writing by supporting code completion of multiple keywords based on non-predefined abbreviated input??a different approach from conventional code completion that finds one keyword at a time based on an exact character match. Abbreviated input consisting of abbreviated keywords and non-alphanumeric characters between each abbreviated keyword (e.g. pb st nm) is expanded into a full expression (e.g. public String name) by a Hidden Markov Model learned from a corpus of existing code and abbreviation examples. The technique does not require the user to memorize abbreviations and provides incremental feedback of the most likely completions. In addition to code completion by disabbreviation of multiple keywords, abbreviation completion supports prediction of the next keywords and non-alphanumeric characters of a code completion candidate, a technique called code completion by extrapolation. The system finds the most likely next keywords and non-alphanumeric characters using an n-gram model of programming language. This enables a code completion scenario in which a user first types a short abbreviated expression to complete the beginning part of a desired full expression and then uses the extrapolation feature to complete the remaining part without further typing. This paper presents the algorithm for abbreviation completion, integrated with a new user interface for multiple-keyword code completion. We tested the system by sampling 4919 code lines from open source projects and found that more than 99% of the code lines could be resolved from acronym-like abbreviations. The system could also extrapolate code completion candidates to complete the next one or two keywords with the accuracy of 96% and 82%, respectively. A user study of code completion by disabbreviation found 30% reduction in time usage and 41% reduction of keystrokes over conventional code completion.  相似文献   

15.
中文显示功能可以为汉语用户提供更加友好的用户体验,针对嵌入式Linux系统,介绍了中文点阵图像和纹理数据的获取,UTF-8编码转换技术,以及OpenGL-ES纹理映射技术,并通过这些技术设计实现了图形用户界面的彩色中文点阵字符显示功能,取得了较好的界面显示效果。  相似文献   

16.
针对当前汉字输入法普遍存在的不足,提出了一种新音形编码汉字输入法,即利用汉字的首拼音、韵母及组成汉字的基本笔画和少数高频部件来对汉字编码,是对以前笔画和音形编码汉字输入法的改进。它既有笔画输入法低重码率、输入高效的特点,又切合广大拼音输入法用户的输入习惯,能够很好地满足多种用户群的需求。阐述了这种编码输入法对汉字的编码规则,对各编码的按键分布及重码率进行详实的统计,深入分析论证了其重码率低的优点,简要介绍了这种输入法在Android平台下的实现。  相似文献   

17.
李玉凤  吴塞 《微计算机信息》2007,23(33):226-227,214
本研究以手写汉字的基本笔画为对象,确定反映书写特征的相对幅度和相对斜率为时域特征,并对时域特征进行Fourier变换,抽取变换实系数形成特征空间,实现笔迹鉴定。本研究采用10位书写者,各书写70个汉字,提取5种基本笔画,进行笔迹鉴定的实验,实验取得了满意的结果。  相似文献   

18.
文中介绍了一种无笑序手写汉字在线识别方法,提出了基于汉字笔画数的编码方法。整个识别过程为两大部分,首先进行笔画分类,然后根据笔画序列码和汉字的结构完成入手 写何不在于识别。由于本系统要求可以无笔序地进行汉字输入,给汉分类带的来很大的困难,为此,在汉字结构匹配时,提出了一种结构特征搜索及排索算法,很好地解决了要求无笔序输入所带来的问题,实践证明,这种方法用于无笔序手汉字的在线识别是非常有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号