首页 | 官方网站   微博 | 高级检索  
     

基于改进潜在语义分析的跨语言检索
引用本文:宁健,林鸿飞.基于改进潜在语义分析的跨语言检索[J].中文信息学报,2010,24(3):105-112.
作者姓名:宁健  林鸿飞
作者单位:大连理工大学 计算机科学与技术学院,辽宁 大连 116024
基金项目:国家自然科学基金资助项目(60673039,60973068);;国家863高科技计划资助项目(2006AA01Z151);;教育部留学人员归国科研启动基金;;教育部博士点基金资助(20090041110002)
摘    要:该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索,取得了较好的实验效果。

关 键 词:计算机应用  中文信息处理  改进潜在语义分析  语义空间  跨语言检索  SVD  NMF  

Cross-Language Information Retrieval Based on Improved Latent Semantic Indexing
NING Jian,LIN Hongfei.Cross-Language Information Retrieval Based on Improved Latent Semantic Indexing[J].Journal of Chinese Information Processing,2010,24(3):105-112.
Authors:NING Jian  LIN Hongfei
Affiliation:School of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116024, China
Abstract:Focused on the cross language information retrieval, this paper applies the improved Latent Semantic Indexing (LSI)by combining SVD and NMF to construct the semantic space for the abstracts of biomedical literatures. It maps the Chinese document and English document into the same semantic space without external dictionary and knowledge base and for the bilingual information retrieval. The proposed method also utilizes the anchor information included the abstracts of biomedical literatures and builds a series models corresponding to different K-dimensions,all contributing to the similarity between query and documents with different credibility. As a result, the similarities of term to term, document to document and term to document are calculated forthe bilingual information retrieval of biomedical abstract. The experiment gets a better result.
Keywords:computer application  Chinese information processing  improved latent semantic indexing  semantic space  cross language IR  SVD  NMF  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号