首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 781 毫秒
1.
利用汉字数学表达式的思想,将汉字数学表达式库嵌入到开放式软件中,用来弥补汉字内码中包含信息量不足的缺点,使计算机能以比汉字更细粒度的汉字部件为基本单元来处理汉字,为中文信息处理提供了一种新思路。本文介绍了在开放式软件中,实现中文信息按汉字部件查找的设计方法。  相似文献   

2.
中文科技文档中的数学表达式定位   总被引:1,自引:0,他引:1  
数学表达式定位是印刷体数学表达式识别的前提。针对中文科技文档,分别对独立表达式和内嵌表达式的定位问题提出了新的方法。采用自适应神经模糊推理系统(ANFIS) 对行特征进行分类,提取出独立表达式;采用模糊聚类和动态规划方法,从文档中依次提取出汉字、中文标点和英文字符,利用启发式规则合并剩余的数学符号而提取出内嵌表达式。实验表明,提出的表达式定位方法有很高的正确率。  相似文献   

3.
汉字数学表达式开发平台的设计与实现   总被引:1,自引:0,他引:1  
汉字数学表达式理论弥补了汉字内码中包含信息量不足的缺点,使计算机以比汉字更细粒度的汉字部件为基本单元来处理汉字成为可能;基于汉字数学表达式原理,设计并实现了汉字数学表达式开发平台;该平台可以应用在很多领域,作为一个应用实例,开发了一个基于汉字数学表达式平台的文本数字水印系统。  相似文献   

4.
汉字的数学表达式研究   总被引:14,自引:1,他引:14  
通过深入分析汉字的有关结构知识,提出了一种全新的汉字表达方法,该方法将汉字表示成由505个部件作为操作数、部件间的6种位置关系作为运算符号的数学表达式,这种表达方法接近自然、结构简单,而且可像普通的数学表达式一样按一定的运算规则处理,它可广泛应用于排版印刷、广告、包装设计、网络传输及中文移动通信等领域,已成功地在汉字字形自动生成,互联网上跨平台传输汉字信息、挖掘有关汉字结构知识等方面。  相似文献   

5.
数学表达式识别方法综述   总被引:10,自引:1,他引:10  
数学表达式的识别是将科学和工程文献中的数学公式转变成电子文档的一种形式。数学表达式的识别由符号识别和结构分析组成,符号识别又分两大阶段,即符号的分割和识别。本文介绍了目前数学表达式识别的研究现状,给出了数学表达式识别的过程和已提出的符号识别方法和结构分析方法。  相似文献   

6.
数学表达式是现代计算机科学中必不可少的组成部分,数学教学软件中如果缺少数学表达式有效性的判定,将会严重影响软件的运行效率和用户体验。针对此问题提出了一种采用递归方法来判别数学表达式有效性的方法。首先对表达式进行规格化处理,然后遍历数学表达式,进行括号匹配、运算符优先级处理和数学基本初等函数识别,最后进行常量的识别。对其中遇到的问题进行了讨论,并提供了解决方案。该方法已经应用于数学软件、远程教育等应用领域的函数作图中,当用户输入表达式错误时,它能够及时提醒用户输入的错误位置,达到了很好的效果。实验表明:数学表达式的有效性判别可以显著提高教学软件、函数作图的效率,改善用户体验。  相似文献   

7.
提出基于胶囊神经网络(CapsNet)的汉字字形表征模型,通过表征汉字字形中的部件实现汉字字形的表征.首先,对任一汉字字形生成所有部件类别的表征向量.然后,根据部件存在概率,利用基于欧氏距离的离群点检测,选取相应的部件表征向量.最后,由选出的部件表征向量组成该汉字的字形表征.实验表明,文中模型在仅经过部件字形训练的情况下,即可有效识别汉字部件,同时自动生成汉字字形的有效表征.  相似文献   

8.
计算机自动推理和几何定理机器证明已经取得令人瞩目的成果,自动推理的软件也出现了很多。完善解决表达式的推理是数学定理机械化证明必须达到的目的,但是关于表达式的推理还缺乏研究,因为表达式的推理不同于一般信息的推理,它没有固定的格式,信息表述复杂。本文在之前研究工作的基础上,通过对表达式在推理时的特征分析,提出一种表达式推理的方法,是向这个方向的一个尝试。在该方法中,通过适当的替换,将表达式化为空,从而实现了表达式的简单处理,并在文中列举几个实例进行分析。实践证明,利用这种方法,可对大多数的结论为表达式的几何命题给出可读证明过程。  相似文献   

9.
基于用户功能需求的知识网的自动生成研究   总被引:6,自引:1,他引:5  
薛朝改  严洪森 《控制与决策》2005,20(9):996-1001
研究了基于用户功能需求的知识网自动生成方法.首先,定义了知识网对用户需求的满意度关系及其运算,建立了知识网多重集运算表达式优化的模型;然后,基于改进的混合遗传算法,对知识网多重集表达式进行优化,给出了知识网自动生成的步骤;最后,通过算例对知识网自动生成方法进行说明和验证,表明了该方法的有效性和可行性.  相似文献   

10.
周南  田学东 《计算机应用》2016,36(3):833-836
针对数学表达式复杂二维结构特性所导致的普通文本检索技术难以对其进行检索的问题,提出了一种面向数学检索的LaTeX数学表达式解析与索引方法。在充分考虑公式特点的基础上,通过对LaTeX构成特点的分析和归纳,设计了LaTeX数学表达式的解析和检索特征提取算法;以此为基础,构建了一种适应数学表达式特性的双层索引结构,利用所提取数学表达式各层次运算数和运算符信息,分别以Treap数据结构和倒排索引结构构成数学表达式索引,为实现进一步的数学表达式检索匹配打下基础。在浏览器/服务器模式下采用6234条数学教材中的公式作为数据集进行实验,在解析获得的124960个基线层数最高为11层的表达式节点上,建立索引平均耗时为33.8317 s。实验结果表明所提出的LaTeX表达式解析算法和索引结构能够适应数学表达式的特点,有助于实现具有较高效率和准确性的数学表达式检索。  相似文献   

11.
字体表情自汉字诞生之初业已存在,其发展变化的助推力来源于人类从不间断的文明进程。印刷术的推广加快了字体审美表情的演变速度。当下汉字字体的结构韵律及审美表情千姿百态,与汉民族性格存在一定的映射效应。汉字字体借鉴诸多西方字体的结构特征,形态日渐丰富多样。为期达到最佳审美及实用功效,应根据字体的审美表情差异对汉字字体进行分类优选。  相似文献   

12.
一种新颖的汉字字形相似度计算方法   总被引:1,自引:0,他引:1  
为了利用字形描述技术识别相似汉字, 提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组, 以部件为运算对象, 字型结构为运算符, 将汉字描述为前缀表达式。通过建立汉字字形相似度计算递归模型, 使计算过程被逐层分解为原子部件间的相似性比较, 从而更好地降低了计算的复杂性。然后将其用于计算汉字的最佳相似字。实验结果表明, 该方法与人的认知结果吻合度很好, 算法是有效可行的。  相似文献   

13.
Mathematical documents are analyzed from several viewpoints for the development of practical OCR for mathematical and other scientific documents. Specifically, four viewpoints are quantified using a large-scale database of mathematical documents, containing 690,000 manually ground-truthed characters: (i) the number of character categories, (ii) abnormal characters (e.g., touching characters), (iii) character size variation, and (iv) the complexity of the mathematical expressions. The result of these analyses clarifies the difficulties of recognizing mathematical documents and then suggests several promising directions to overcome them. Received: 3 March 2004, Accepted: 5 January 2005, Published online: 29 June 2005 Correspondence to: S. Uchida  相似文献   

14.
由于汉字拥有大量的字符,大多数对汉字的研究主要集中在汉字的识别和分类问题上,对于生成汉字的研究较少,尤其是在没有大量配对的汉字数据集的情况下.该模型使用内容和风格样式都不匹配的汉字数据集,将生成个性化手写汉字的过程公式化为一个从现有的标准印刷字体到个性化手写汉字样式映射的问题.在基于无监督学习的图像翻译模型的基础上,利...  相似文献   

15.
汉字的表义性是其区别于表音文字的一大特点。部件作为构字单位,同汉字的意义之间有着很大的联系。然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题。针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型。该模型在向量内部评测任务上性能获得了一定提升,在汉字理据性测量任务上也与人工打分结果显著相关。基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,并结合部件的构字能力建立了现代汉字部件的等级体系。测量结果显示,现代汉字部件具有一定表义能力,但整体而言表义能力偏低。最后,将测量结果应用于对外汉语教学中,确立了适用于部件教学法的部件范围,并提出了对应的汉字教学顺序方案。  相似文献   

16.
通过分析汉字的常见结构,鉴于汉字与汉字之间的距离和构成汉字的部件之间的距离的显著差异性,提出一种基于候选特征笔画和多类阈值的手写汉字切分方法.首先从构成手写汉字的笔画集合中提取候选特征笔画,根据候选特征笔画将手写汉字预切分,然后利用基于间距阈值的部件组合规则对过切分的汉字部件进行组合,最后采用基于单字宽度阈值的粘连汉字判断规则搜索粘连汉字,对粘连汉字进行递归切分.实验表明,该方法对连续手写汉字的切分准确率较高,具有一定的实用性.  相似文献   

17.
《信息处理用GB13000.1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而,在实际运用上却存在着部件数量太大,部件定义难以操作,部件拆分组合不易掌握等难处。造成困难的原因主要有: (1) 基础部件主要靠列表来确定, (2) 部件强调按理切分和成字组合, (3) 过多依赖“组字能力”的判别, (4) 过分注重部件数量的限制。要走出“难”的困境,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明,这种方法是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号