首页 | 官方网站   微博 | 高级检索  
     

基于改进HMM的文本信息抽取模型
引用本文:梁吉光,田俊华,姜杰. 基于改进HMM的文本信息抽取模型[J]. 计算机工程, 2011, 37(20): 178-179. DOI: 10.3969/j.issn.1000-3428.2011.20.061
作者姓名:梁吉光  田俊华  姜杰
作者单位:南京师范大学教育科学学院,南京,210000
基金项目:江苏省高校自然科学基础研究基金资助项目(08KJD120004);全国教育科学规划德育专项基金资助项目(GEA090005)
摘    要:提出一种基于改进隐马尔可夫模型(HMM)的文本信息抽取模型。给出一个新假设,使用绝对平滑算法对模型参数进行平滑,利用Viterbi算法对观察值序列进行正序和逆序解码,基于N-Gram模型对2次解码结果进行对比消歧,得到较准确的状态序列。实验结果表 明,该信息抽取模型能提高信息抽取的准确率。

关 键 词:隐马尔可夫模型  绝对平滑  观察值  信息抽取  引文信息
收稿时间:2011-04-13

Text Information Extraction Model Based on Improved HMM
LIANG Ji-guang,TIAN Jun-hua,JIANG Jie. Text Information Extraction Model Based on Improved HMM[J]. Computer Engineering, 2011, 37(20): 178-179. DOI: 10.3969/j.issn.1000-3428.2011.20.061
Authors:LIANG Ji-guang  TIAN Jun-hua  JIANG Jie
Affiliation:(Educational Science College,Nanjing Normal University,Nanjing 210000,China)
Abstract:This paper proposes a text information extraction model based on improved Hidden Markov Model(HMM).It gives a new assumption of observation emission.And the absolute smoothing algorithm is used to smooth the parameters of the model.The model recovers the most-likely state sequence of the observation sequence and the reverse observation sequence with the Viterbi algorithm.It compares the results with each other based on N-Gram model,and outputs a more accurate result for the state sequence.Experimental results indicate that this model has effectively improved precision.
Keywords:Hidden Markov Model(HMM)  absolute smoothing  observation  information extraction  citation information
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号