首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于条件随机场的中文科研论文信息抽取   总被引:1,自引:1,他引:1  
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型参数估计和特征选择.实验中采用L-BFGS算法学习模型参数,并选择局部、版面、词典和状态转移4类特征作为模型特征集.在信息抽取时先利用分隔符、特定标识符等格式信息对文本进行分块,在分块基础上用条件随机场进行指定域的抽取.实验表明,该方法抽取性能明显优于基于隐马尔可夫模型的方法,且加入不同的特征集对抽取性能提升作用不同.  相似文献   

2.
针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题,提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法. 新算法利用文本排版格式、分隔符等信息,对文本进行分块,在此基础上,通过对训练数据分成多个形式模板训练隐马尔可夫初始概率及转移概率参数,最后,结合统一训练的释放概率参数,对文本信息进行抽取. 实验结果表明,新算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能.  相似文献   

3.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

4.
典型隐马尔可夫模型对初始参数非常敏感,采用随机参数训练隐马尔可夫模型时常陷入局部最优,应用于W eb信息抽取时效果不佳.文中提出基于模拟退火算法与隐马尔可夫模型的W eb信息抽取算法.通过实验比较选择最佳的模拟退火算法参数,结合Baum-W elch算法优化隐马尔可夫模型并应用于W eb信息抽取.实验结果表明新算法在信息抽取的精确率和召回率都有明显的提高.  相似文献   

5.
基于隐马尔可夫模型与并行模型组合的特征补偿算法   总被引:1,自引:0,他引:1  
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协方差矩阵,使之与识别环境相匹配.最后,根据基于状态转移矩阵压缩的前向后向算法计算隐马尔可夫模型的后验概率,并通过最小均方误差准则估计纯净语音特征向量.实验结果表明,该算法能够更加准确地估计纯净语音特征向量,其性能明显优于基于高斯混合模型的特征补偿算法;状态转移矩阵压缩算法可以在不影响补偿精度的前提下,显著减少前向后向算法的计算量.  相似文献   

6.
提出一种基于隐马尔可夫模型的转录因子文本挖掘算法(HMM-TFM), 该方法通过建立转录因子名称的词库, 利用谓语筛选策略判断句子是否描述转
录因子, 使用隐马尔可夫模型预测单词词性, 并根据前后文单词词性识别转录因子的名称. 实验结果表明, HMM-TFM在英文文献中抽取转录因子名称的查全率和查准率分别可达74.2%和77.9%.  相似文献   

7.
基于混合条件模型的Web信息抽取   总被引:2,自引:0,他引:2  
针对传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数,提出了一种最大熵和最大熵马尔可夫模型相结合的条件模型.该方法对输入的Web页面进行解析并构建HTML树,通过计算HTML子树结点的熵定位数据域,允许观察值表示任意重叠特征(像词、大写、HTML标记、语义)和定义状态序列给予观察序列的条件概率实现了Web信息抽取.实验结果表明,新的方法在精确度和召回率指标上比传统隐马尔可夫模型和最大熵马尔可夫模型具有更好的性能.  相似文献   

8.
隐马尔可夫模型及在人脸识别算法中的应用   总被引:1,自引:0,他引:1  
介绍了隐马尔可夫模型(HMM)及其三大算法,并将其引入人脸识别的研究中,描述了一种基于隐马尔可夫模型的人脸识别方法.一幅正面人脸图像的重要特征具有一定的顺序,它可以通过一维的HMM来建模,每个特征区域被指定为一个状态,通过K-L变换将降维以后的特征矢量作为观察矢量.和其他人脸识别的方法比较,隐马尔可夫模型更能为人脸检测和识别提供灵活的框架.  相似文献   

9.
基于广义隐马尔可夫模型的网页信息抽取方法   总被引:2,自引:0,他引:2  
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广义隐马尔可夫模型。最后通过实验说明改进的GHMM对于网页信息抽取有很高的精确率。  相似文献   

10.
提出了一种基于隐马尔可夫模型的用于双手的钢琴指法标注方法.在隐马尔可夫模型中,指法的形式是隐藏状态,乐谱的音符是输出状态.方法主要包含两个步骤:确定隐马尔可夫模型的转移概率矩阵和输出概率矩阵,以及使用维特比算法寻找对应于音符序列的概率最大的指法序列.所提方法中的隐马尔可夫模型可以同时处理单音以及和弦.同时方法的有效性也通过真实的钢琴乐谱得到了验证.  相似文献   

11.
状态输出概率密度为对角协方差矩阵高斯分布的隐马尔可夫模型(HMM-DG)在帧内特征相关建模方面存在缺陷.本文将因子分析方法与HMM-DG的混合高斯建模相结合,提出了一种具有弹性的帧内特征相关隐马尔可夫模型框架一基于因子分析的隐马尔可夫模型(HMM-FA).并导出了HMM-FA的训练算法.理论分析和仿真实验都表明:在训练数据相同的条件下,HMM-FA的性能优于HMM-DG。  相似文献   

12.
为提高基于隐马尔可夫模型(HMM:Hidden Markov Model)的网页预取精度,对经典隐马尔可夫模型的两个前提假设进行了扩展,推导出新模型中计算观测序列概率的公式.由此构建出可用于网页预取的高阶隐马尔可夫模型,同时为降低高阶隐马尔可夫模型的空间复杂度,给出了构建树状状态空间存储访问序列的算法.介绍了将改进的隐马尔可夫模型应用于网页预取的具体方法,通过对比实验证实该方法的预取准确度提高了7%.  相似文献   

13.
针对传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际应用中模型参数极易陷入局部最优的问题,提出了一种基于改进的粒子群优化算法的隐马尔可夫模型参数优化模型,用于Web信息抽取.以似然概率值作为适应度函数,使用改进的粒子群优化算法结合Baum-Welch算法对HMM模型参数进行全局优化,实现了Web页面信息的抽取.实验结果表明,该算法在精确率和时间等指标上与现有算法相比具有更好的性能.  相似文献   

14.
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。  相似文献   

15.
参数估计是马尔可夫模型中的常见问题.基于初始状态的重要性,本文对初始状态未知的马尔可夫链模型的初始状态进行估计,并根据状态可见与否将模型分成一般马尔可夫模型和隐马尔可夫模型.考虑观测状态或观测符号的数量,基于极大似然原理分别建立了线性规划和非线性规划模型,并证明各阶段状态的概率满足规范性.对于线性规划模型,指出其可以用单纯形法求解,并给出了解的表达.对于非线性模型,指出其最优解的存在性,并利用库恩-塔克条件(K-T条件)将模型转化成方程组的形式.算例分析中,在基于库恩-塔克条件的方程组不易求解的情形下,运用lingo得到了满足模型的解.  相似文献   

16.
提出一种基于嵌入式隐马尔可夫模型(embedded hidden Markov model, 简称EHMM)的人脸图像识别方法,主要包括: ①由于奇异值向量具有稳定性、转置不变性等特点,故对归一化的人脸图像,可采用奇异值分解抽取人脸图像特征作为观察序列;②在人脸识别中应用嵌入式隐马尔可夫模型,采用多高斯概率密度函数训练、建立EHMM, 再利用建好的EHMM进行识别.实验结果显示,所提方法减少了数据计算量,运行速度快,并提高了识别率,完全满足人脸识别系统的实时性要求.  相似文献   

17.
自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取.实验表明,该方法具有较高的准确率和召回率.  相似文献   

18.
隐马尔可夫模型(HMM)是建立在马尔可夫链的基础上的统计模型.虽然隐马尔可夫模型是一种计算高效的机器学习模型,但是当处理的数据集规模过于庞大时,分析的时间太长.因此,我们有必要研究隐马尔可夫模型的并行化设计,以提高模型的运算速度.近年来,开放计算语言(OpenCL)的出现,使得设计通用的并行程序成为可能.该文,我们分析了隐马尔可夫模型三类算法的并行特性,并设计基于OpenCL的并行实现.实验结果表明,隐马尔可夫模型在GPU上的并行化实现最高获得了640倍的加速比.  相似文献   

19.
提出了一种基于动态贝叶斯网络的隐马尔可夫协同过滤推荐的新方法。基于隐马尔可夫模型的协同过滤方法模拟用户在浏览网页时的行为,根据用户浏览网页时的行为建立最近邻集合。在基于隐马尔可夫协同过滤推荐技术的基础上,构造基于DBN的推荐模型。当有新类型的数据加入时,用此模型来更新推荐模型。实验表明,此方法具有较高的推荐质量。  相似文献   

20.
基于MHMM的脱机手写体字符识别   总被引:1,自引:0,他引:1  
对隐马尔可夫模型(HMM)的训练方法及模型参数的选取进行了探讨,并将HMM理论用于脱机手写体识别中,建立了一种基于字符投影变换图像的边界链码特征的多重隐马尔可夫模型(MHMM).实验结果表明,该方法是可行的,且具有良好的兼容性和灵活性,可应用于手写体字符的自动识别中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号