首页 | 官方网站   微博 | 高级检索  
     

基于潜在语义分析的文档检索设计方法
引用本文:张世博,刘博爱,柳朝阳,张宝全.基于潜在语义分析的文档检索设计方法[J].北京石油化工学院学报,2015,23(2):37-42.
作者姓名:张世博  刘博爱  柳朝阳  张宝全
作者单位:北京石油化工学院计算机系,北京,102600;北京石油化工学院计算机系,北京,102600;北京石油化工学院计算机系,北京,102600;北京石油化工学院计算机系,北京,102600
基金项目:北京石油化工学院国家级大学生创新训练计划资助
摘    要:文档检索系统围绕如何基于语义层面进行检索来展开研究.基于关键词匹配的检索系统不能处理多词一义的情况,针对此问题设计了基于潜在语义分析的文档检索系统.首先改进了文档一词矩阵单元值的计算过程,调整了传统高频词与低频词在权重上的线性关系,利用Sigmiod函数对权重做平滑处理,使其更符合文档中词的权重;其次利用潜在语义分析结合多维尺度分析算法,优化计算文档在语义间的距离.实验结果显示,能有效在语义上聚类文档,完成查询语句与文档集之间的相似度检索计算.

关 键 词:潜在语义分析  奇异值分解  信息检索  相似度

Design of Document Retrieval System with Latent Semantic Analysis
ZHANG Shi-bo,LIU Bo-ai,LIU Chao-yang,ZHANG Bao-quan.Design of Document Retrieval System with Latent Semantic Analysis[J].Journal of Beijing Institute of Petro-Chemical Technology,2015,23(2):37-42.
Authors:ZHANG Shi-bo  LIU Bo-ai  LIU Chao-yang  ZHANG Bao-quan
Affiliation:ZHANG Shi-bo;LIU Bo-ai;LIU Chao-yang;ZHANG Bao-quan;Dept.of Computer Science,Beijing Institute of Petro-chemical Technology;
Abstract:
Keywords:latent semantic analysis  singular value decomposition  information retrieval  similarity
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号