共查询到20条相似文献,搜索用时 46 毫秒
2.
专有名词识别是中文信息处理领域的一个难题。句子相似度计算方法在中文信息处理领域有着广泛的应用。本文探索性地使用句子相似度计算方法来解决专有名词识别问题,并针对专有名词识别的研究背景对小句相似度计算方法做了一些改进,改进的计算方法不仅考虑了公共字符,而且还加入了语义信息和结构信息。实验证明该方法是可行的。 相似文献
3.
4.
5.
基于框架语义分析的汉语句子相似度计算 总被引:4,自引:0,他引:4
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 相似文献
6.
《数字社区&智能家居》2008,(36)
智能搜索需维护一个动态的问题与答案的数据库。一方面涉及到关键词的提取、逻辑组合等知识。另一方面,由于用户的用词和系统中存储的关键词在表达方式上可能不完全一样,精确的关键词匹配法必将导致很多问题找不到答案,或者找不准答案。智能搜索的关键性技术之一是句子相似度计算,该文从词型、词序、词长和不同特征加不同权值两方面对句子相似度进行优化改进,对于智能搜索性能的提高有着显著的作用。 相似文献
7.
本体中概念相似度的计算 总被引:10,自引:0,他引:10
本体是概念、属性和关系的集合。本体异构是本体间互操作的主要障碍,解决本体异构最好的方法是本体映射。本体映射的关键是概念相似度的计算,但计算时一般不考虑关系和属性对相似度的影响,计算结果存在误差。论文从两个方面对概念的相似度进行计算。首先计算概念的语义相似度,然后计算概念描述相似度。实验表明该计算方式可以提高计算结果的精确度。 相似文献
8.
本文提出了一种基于Cohort相似度度量的识别方式,训练集外选择出同这个目标说话人比较近似的M个说话人计算M+1维混合高斯.即Cohort模型,,来描述说话人模型,可以很大程度上消除现有系统的不匹配.通过实验,本文提出的基于Cohort的方法,可以将性能提高15%左右,从而证明了该方.法的可行性和应用性. 相似文献
9.
10.
提出一种基于向量相似度计算的半监督的NER方法,主要思想是:首先利用bootstrapping方法获取NER所需的各种特征;然后将待测实例表示为实例特征向量,每一类名实体表示为类特征向量;最后根据每个类特征向量与实例特征向量的相似度进行分类.在人民日报语料上选取疾病名、武器名、交通工具名进行相关测试,F测度分别为:77.4%,66.1%和73.1%,结果令人满意. 相似文献
11.
印章鉴定系统的图像处理研究 总被引:8,自引:1,他引:8
在银行的印章鉴定系统中,正确识别票据印章的前提条件是得到高质量的预处理图像。预处理的主要过程是将印章图像三值化,去噪声并进行分割,然后将分割图像送入后续识别模块进行识别。由于票据模式的多样性,背景的复杂性和图像采集的任意性,使得图像的预处理面临较大的困难。文章主要研究了预处理过程中阈值的确定方法,以及去除印章区域复杂噪声的算法。实践证明,在去噪声算法中,通过多种滤波器的有效组合,能得到较高质量的处理图像,从而满足了识别算法的需要。 相似文献
12.
13.
基于小波多尺度分解的印鉴图像配准 总被引:1,自引:0,他引:1
论文提出了一种基于小波多尺度分解的印鉴配准方法。用一维环投影向量的循环移位来代替二维图像的旋转。利用小波分解结果,采用大尺度特征向量来进行相关性分析,实现图像配准。其主要优点是算法具有很强的抗干扰性并且具有广泛的适用性。 相似文献
14.
用于支票印鉴鉴别的图像预处理及配准算法 总被引:2,自引:0,他引:2
为了消除支票印鉴自动鉴别系统中由于不同的盖印条件引起的印鉴质量变化,该文提出了一种印鉴图像预处理及配准算法,即首先利用彩色信息将印鉴灰度图从支票背景中分割出来,然后利用基于梯度值的动态阈值实现印鉴图像的二值化。为了消除印鉴中存在的笔划连接和笔划残缺,该文提出了一种笔划填充和骨架校正算法。实验证明该算法具有较强的适应性、可靠性和实用性。 相似文献
15.
针对现有的汽车密封条长度测量设备中使用模板匹配算法检测特征点位置时,密封条自身旋转导致匹配效果差的问题,提出一种基于Hough变换的自适应模板更新算法。该算法在传统模板匹配方法的基础上,通过设定阈值对模板匹配效果进行判断;对于匹配效果不好的图像进行Hough变换,结合特征点的几何特征进行识别;通过特征点的位置与尺寸信息,将其转化为新的模板用于下一次的模板匹配,实现模板的自适应更新。试验结果表明,该算法弥补了传统模板匹配法对图像旋转异常敏感的问题,提高了识别的稳定性,同时保证了检测效率满足现场的要求。 相似文献
16.
印鉴自动识别算法研究 总被引:1,自引:0,他引:1
印鉴在许多东方国家被广泛使用了多年.印鉴自动识别是模式识别中的一项非常困难的课题.文中对计算机印鉴自动识别的各个阶段进行了仔细研究,并给出一系列相关算法.为了把"伪造印鉴多出的笔划部分"与"由于印泥渗出而多出的部分"区别开来以及将"伪造印鉴少出的笔划部分"与"由于印泥少而盖印不清晰的部分"区别开来,文中提出了全差图、内差图、多差图、少差图等一系列差图的概念,并对这些差图进行了处理.在此基础上,完成了一套完整的计算机印鉴自动识别方法.实验结果表明,该方法可能在实际应用中是可行的. 相似文献
17.
提出了一种基于序贯相似性算法的快速车牌识别方法。采用改进的倾斜较正和字符分割方法对定位好的车牌进行处理,并采用基于序贯相似性检测的模板匹配算法进行车牌识别。实验结果表明,该算法具有良好的鲁棒性和实时性。 相似文献
18.
19.
印鉴真伪鉴别的难点在于由于人工加盖印鉴时,用力的不同,媒介的不同会导致真印鉴的差异与伪造印鉴的差异很难提出一个标准进行自动区别。要求识别系统同时具备同类印鉴的鲁棒性及异类印鉴的敏感性。针对这一难点,该文提出了一种基于多特征的多分类器融合决策算法,根据多类特征以及多种分类器的不同特性,获得对真伪印鉴的鉴别。采用Gabor滤波器获得频率特征,采用差图像获得结构特征,采用原图像和极坐标图像的奇异值获得不变量特征。采用支持向量机(SupportVectorMachine,SVM)和Fisher分类器进行融合决策对印鉴进行真伪鉴别。实验表明,该文方法具有很高的真伪鉴别能力。 相似文献
20.
印鉴分割是正确识别真假印鉴的关键问题,本文给出了一种新的印鉴图像分割算法。该算法基于样本章(印鉴)和待验章(印鉴)在具有相同的笔划宽度时,分割效果最佳,最利于真假印鉴的识别。选定一定范围的灰度值作为可能的阈值,从中选 出使待验章和样本章的笔划宽度相差最小的阈值作为最佳阈值。对位于待验章和样本章的交集中的边缘点分别在待验章和样本章中求水平和垂直方向上的笔划宽度,并且仅取宽度差最小的一个方向上的宽度差,很好地避免了印泥的浓淡、盖印时用力的深浅、印泥污染、笔划断裂和分裂带来的干扰。实验和实践证明,该方法分割效果好,并具有很好的稳定性,在识别真假印鉴的实践中得到了很好的应用。 相似文献