首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
命名实体识别在自然语言处理实践中具有高度重要的作用,而且也是信息提取等各种自然语言方式的基础工具.本文采用条件随机场模型(Conditional Random Fields,CRF)对维吾尔语音乐实体识别进行初步的探讨.首先维吾尔语网站上收集数据,进行一系列预处理后得到纯文本,然后制定语料标注规则对实体进行人工标注,再利用上下文、关键字、词典等一系列特征进行训练,制定一个适合的模板来进行音乐实体的识别.实验结果证明,此方法在维吾尔语音乐领域不仅可行、而且有效.  相似文献   

2.
动词细分类属于词性标注的一部分,是自然语言处理的重要内容之一。基于条件随机场在分词和词性标注的基础上对动词进行了更细致的分类。根据动词的语言环境构建条件随机场模型,实验结果表明该方法取得了较高的准确率,最高取得了98.11的F值。  相似文献   

3.
受传统观念的影响,中国人名最后一个或两个字的用法对性别判定通常具有一定的指示作用,由此提出利用条件随机场模型来实现中文人名性别的自动识别.该机器学习方法根据人名的结构和用字信息,构建人名标注集,选择6组不同的特征模板集,利用条件随机场模型,在231 337个人名数据库中经过封闭测试,正确率可以达到89.30%,比采用朴素贝叶斯依赖人名用字进行性别识别的方法好将近7个百分点.实验证明:在人名库中识别性别,名字尾字的作用要高于姓氏用字,且女性人名性别识别的准确度要略高于男性,一般是高2至3个百分点,从机器学习的角度来说性别差异可以体现在人名用字中.通过分析实验数据总结了适合人名识别的CRF特征模板设计的一般规律,这为后续的研究工作提供了基础.  相似文献   

4.
隐马尔可夫模型(HMM)基于n-元语法的标注效果虽然不错,但由于预测信息的不足,对汉语的词性标注,特别是未登录词的词性标注精度影响很大。而最大熵模型使用特征的形式,有效的利用了上下文信息,在一定的约束条件下可以得到与训练数据一致的概率分布,即使是未登录词,由于其丰富的上下文信息,对它的词性标注也起到了很好的预测作用。实验结果证明最大熵方法取得了较好的标注效果。  相似文献   

5.
柯逍  邹嘉伟  杜明智  周铭柯 《电子学报》2017,45(12):2925-2935
针对传统图像标注模型存在着训练时间长、对低频词汇敏感等问题,该文提出了基于蒙特卡罗数据集均衡和鲁棒性增量极限学习机的图像自动标注模型.该模型首先对公共图像库的训练集数据进行图像自动分割,选择分割后相应的种子标注词,并通过提出的基于综合距离的图像特征匹配算法进行自动匹配以形成不同类别的训练集.针对公共数据库中不同标注词的数据规模相差较大,提出了蒙特卡罗数据集均衡算法使得各个标注词间的数据规模大体一致.然后针对单一特征描述存在的不足,提出了多尺度特征融合算法对不同标注词图像进行有效的特征提取.最后针对传统极限学习机存在的隐层节点随机性和输入向量权重一致性的问题,提出了鲁棒性增量极限学习,提高了判别模型的准确性.通过在公共数据集上的实验结果表明:该模型可以在很短时间内实现图像的自动标注,对低频词汇具有较强的鲁棒性,并且在平均召回率、平均准确率、综合值等多项指标上均高于现流行的大多数图像自动标注模型.  相似文献   

6.
提出一种基于N元语法的汉语自动分词系统,将分词与标注结合起来,用词性标注来参与评价分词结果.首先基于词典和一元语法统计模型生成N个最优结果作为候选集;然后对候选集进行基于二元语法统计模型的词性标注,最后利用对文本的上下文"理解"信息来确定最佳切分结果.实验结果表明:此方法通过词性标注的反馈有效提高了分词正确率,词性标注对分词有反馈作用.  相似文献   

7.
首先分析了古汉语词义义项的分布情况与特点,考察了词义消歧的难点.然后在现有的词义消歧理论和方法的基础上,基于机器自动学习的统计模型条件随机场,选择上下文的词及其词性的复合特征,并加入其他适当语言学特征,设计6个不同的模板,对"將"、"如"、"我"、"信"、"聞"、"之"等古汉语高频词进行了词义消歧实验.实验最高平均F值达到了83.04%,高于最大熵、朴素贝叶斯模型,结果表明,选择合适的特征,条件随机场模型在古汉语词义消歧方面有效可行.  相似文献   

8.
采用基于统计的方法实现日本人名的识别和翻译系统。将人名的识别转换成序列标注问题,采用条件随机场方法训练识别模型。训练语料在标注时使用S/E(Start/End)标注风格;利用人名在上下文中的关系、人名称呼后缀词和人名字典来设计特征模板。人名翻译时将日本人名分为假名人名和汉字人名,汉字人名的翻译通过建立日本人名常用汉字翻译字典实现;假名人名的翻译通过Moses系统训练翻译模型实现。该系统在人名的识别和翻译测试中都取得了不错统计结果。  相似文献   

9.
基于层叠条件随机场模型的中文机构名自动识别   总被引:39,自引:1,他引:38  
中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.  相似文献   

10.
基于最大熵模型的汉语句子分析   总被引:10,自引:4,他引:10       下载免费PDF全文
徐延勇  周献中  井祥鹤  郭忠伟 《电子学报》2003,31(11):1608-1612
文中运用浅层句法分析理论,把汉语句子分析划分为标注、组块、构造和检查三个过程.并针对已有概率评价模型的特征类型少,不能充分利用上下文中对分析有用的信息等问题,提出了基于最大熵的概率评价模型来评估分析过程中每个行为的概率.在该模型中,对分析有用的任何信息都可以成为模型中的一个特征;定义了静态模板结构的特征集和训练集,给出了相应的特征选择策略和基于GIS的参数估计算法;采取BFS算法高效搜索概率值最高的候选句法树作为最终的句法分析结果.实验结果表明:该模型具有较高的分析效率和准确性.  相似文献   

11.
针对传统的模板匹配法对汉字的识别率较低,文中提出一种基于SVM的多特征手写体汉字识别技术。在提取网格特征的基础上增加对汉字质心特征、笔划特征、特征点的提取,并采用SVM算法构造分类器,实现对手写体汉字的识别。实验结果表明,该方法的平均识别率为95.9%,高于传统的模板匹配法。  相似文献   

12.
《电子学报:英文版》2017,(6):1111-1117
The accurate classification of subjective and objective sentences is important in the preparation for micro-blog sentiment analysis. Since a single feature type cannot provide enough subjective information for classification, we propose a Support vector machine (SVM)-based classification model for Chinese micro-blogs using multiple features. We extracted the subjective features from the Part of speech (POS) and the dependency relationship between words, and constructed a 3-POS subjective pattern set and a dependency template set. We fused these two types of features and used an SVM-based model to classify Chinese micro-blog text. The experimental results showed that the performance of the classification model improved remarkably when using multiple features.  相似文献   

13.
在中文分词领域,基于字标注的方法得到广泛应用,通过字标注分词问题可转换为序列标注问题,现在分词效果最好的是基于条件随机场(CRFs)的标注模型。作战命令的分词是进行作战指令自动生成的基础,在将CRFs模型应用到作战命令分词时,时间和空间复杂度非常高。为提高效率,对模型进行分析,根据特征选择算法选取特征子集,有效降低分词的时间与空间开销。利用CRFs置信度对分词结果进行后处理,进一步提高分词精确度。实验结果表明,特征选择算法及分词后处理方法可提高中文分词识别性能。  相似文献   

14.
基于稳定特征的虹膜分类算法   总被引:3,自引:1,他引:2       下载免费PDF全文
虹膜分类中,由于虹膜的相似度计算会受到特征模板中不可靠和不固定特征的影响,使得虹膜分类的错误率(错误识别率+错误拒绝率)增加.为了解决这个问题,本文提出了一种稳定特征提取的方法,从同一虹膜的多个图像中提取虹膜的稳定特征,并利用这些稳定特征建立该虹膜的特征模板,然后用于虹膜的分类.采用CASIA虹膜数据库进行测试,仿真结果表明,基于稳定特征的虹膜分类算法能提高虹膜分类精度和改善虹膜识别系统性能.  相似文献   

15.
徐晴  梁金金  张玉山  李云飞  刘伟 《红外》2024,45(4):7-12
为了满足天基系统对红外探测目标的高精度识别需求,提出了一种基于多波段特征融合模板匹配的目标识别方法。首先阐述分析了目标多维特征要素以及分类手段。结合目标运动特征、多波段下目标光谱特征以及红外辐射变化等特征实现了特征融合处理,并基于区域特征变化,采用动态规整模板匹配算法完成了目标识别。最后结合合作目标的红外辐射强度序列数据对参数进行了训练调整。分析结果表明,本文建立的识别方法能够较好地实现目标型号识别,性能优于传统的动态规整匹配算法。  相似文献   

16.
利用均值漂移进行目标跟踪的算法,在被跟踪目标出现旋转、尺度变化、噪声干扰等情况下,无法得到准确的跟踪结果。文中提出了基于当前流行目标跟踪算法和局部特征相结合的算法,基于局部特征-形状上下文(Shape Context)特征的Mean Shift目标跟踪算法。该算法首先提取目标的轮廓信息和特征,根据采样点之间位置和距离关系建立Shape Context直方图,最后所有点的Shape Context直方图构成了图像的Shape Context特征,最后根据Mean Shift算法进行跟踪。实验结果表明,该算法在跟踪目标出现尺度变化、旋转、噪声干扰和遮挡等情况下能够准确地跟踪物体,鲁棒性好。  相似文献   

17.
李洵  游林  梁家豪  颜春辉 《电信科学》2018,34(10):72-84
针对基于生物特征的模糊金库易受相关攻击导致密钥和生物特征模板丢失以及基于单生物特征的模糊金库的认证性能不可靠的问题,提出了一种新的基于指纹与人脸特征级融合的模糊金库方案。该方案对指纹特征与人脸特征分别进行不可逆变换,并基于Diffie-Hellman算法在特征级变换后将指纹与人脸特征融合为一个模板。最后,将所得的融合模板用来构建模糊金库,通过更新随机矩阵使金库具备可撤销特性,有效抵御相关攻击,实现可靠的身份认证。实验结果表明,本文方案提高了系统的可靠性和多生物特征模板的安全性。  相似文献   

18.
基于色度分析的唇动特征提取与识别   总被引:6,自引:0,他引:6       下载免费PDF全文
姚鸿勋  吕雅娟  高文 《电子学报》2002,30(2):168-172
本文提出了一种基于色度滤波的唇动特征提取与识别方法 ,它通过唇的色度滤波 ,得到增强的唇动图像 ,再利用可变模板 ,描述口型轮廓并提取特征参数 ,并用HMM模型进行唇运动序列图像识别 .该方法鲁棒性强 ,对光照没有苛刻的要求 ,且针对非特定人 ,适用于自然条件下的实用环境 ,解决了可变模板对目标边缘有较高分辨率的要求 ,使方法更实用化 .本文的实验是基于单纯的视觉信息 (没有声音信道的信息 )的唇动识别 ,不加语音信息 ,实验集合只限于单韵母 ,识别率可达 95 8% .  相似文献   

19.
脱机手写签名鉴别的主要困难在于有效特征的提取,因此本文主要围绕提取能反映签名本质的特征进行了相关研究。在具体解决签名鉴别时,一方面要考虑签名的静态特征,另一方面寻找动态特征。重点研究了静态特征。提取静态特征时,利用伪Zernike矩的尺度及位移不变性,计算签名图像的0~10阶伪Zernike矩来组成特征向量。在此基础上,对基于上述两种不同特征的加权欧氏距离分类器进行性能比较,并找到了一个有效的数据融合方案。  相似文献   

20.
基于差异性和重要性的问句特征组合   总被引:1,自引:0,他引:1       下载免费PDF全文
在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合 (Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合特征与当前特征组合的错分差异度和正分差异度,以及待组合特征本身的重要度,从候选特征集中动态获取优化的特征组合.在哈工大中文问句集上对词袋绑定特征进行组合的实验结果表明,与其他特征组合方法相比,DIFC方法灵活高效,准确率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号