首页 | 官方网站   微博 | 高级检索  
     

基于主题语言模型的句子检索算法
引用本文:吴友政,赵军,徐波.基于主题语言模型的句子检索算法[J].计算机研究与发展,2007,44(2):288-295.
作者姓名:吴友政  赵军  徐波
作者单位:中国科学院自动化研究所模式识别国家重点实验室,北京,100080
基金项目:国家自然科学基金 , 北京市自然科学基金
摘    要:提出了基于主题语言模型的汉语问答系统句子检索算法,该算法利用问答系统中特有的提问分类信息(即提问的答案语义信息)对句子初检结果进行主题聚类,通过Aspect Model将句子所属的主题信息引入到语言模型中,从而获得对句子语言模型更精确的描述 .对于初检结果的聚类,提出了"一个句子多个主题"和"一个句子一个主题"两种算法 .相对于PLSI算法的主题空间维度,提出的主题空间具有更加明确的物理意义;由于不需要迭代运算,运行速度更具优势 .对比实验的结果表明,与标准语言模型方法相比,基于主题语言模型的方法可以明显地提高汉语问答系统句子检索模块的性能 .

关 键 词:汉语问答系统  语言模型  句子检索  主题语言模型  检索算法  Language  Model  Retrieval  性能  模块  句子检索  方法  标准  对比实验  优势  运行速度  迭代运算  物理意义  主题空间  空间维度  主题聚类  描述  息引  Aspect
修稿时间:11 9 2005 12:00AM

Sentence Retrieval with a Topic-Based Language Model
Wu Youzheng,Zhao Jun,Xu Bo.Sentence Retrieval with a Topic-Based Language Model[J].Journal of Computer Research and Development,2007,44(2):288-295.
Authors:Wu Youzheng  Zhao Jun  Xu Bo
Affiliation:National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences, Beijing 100080
Abstract:A novel topic-based language model for sentence retrieval in Chinese question answering is presented in this paper. The main idea is to make use of the peculiar characteristics in question answering scenario, that is, the semantic category of the expected answer, to conduct topic segmentation, and then incorporate the topic information of the sentence into the standard language model. For the topic segmentation, two approaches are presented, that is, one-sentence-one-topic and one-sentence-multi-topics. The experimental results show that the performance of sentence retrieval based on the proposed topic-based language model is improved significantly.
Keywords:Chinese question answering  language model  sentence retrieval
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号