首页 | 官方网站   微博 | 高级检索  
     

一种基于聚类的语义检索算法
引用本文:向河林,张明西,李珀瀚,何震瀛,汪卫.一种基于聚类的语义检索算法[J].计算机工程,2012,38(2):36-38.
作者姓名:向河林  张明西  李珀瀚  何震瀛  汪卫
作者单位:复旦大学计算机科学技术学院,上海,201203
基金项目:国家自然科学基金资助项目(60703093)
摘    要:潜在语义分析在进行大规模语义检索时计算效率较低、存储开销较大。针对该问题,提出一种基于聚类的潜在语义检索算法。通过文档之间的结构关系对文档进行聚类,利用簇代替文档分析潜在语义,以此减少处理文档的个数。实验结果表明,该算法能减少查询时间,且检索精确度较高。

关 键 词:潜在语义分析  信息检索  向量空间模型  图聚类算法
收稿时间:2011-07-22

Clustering-based Semantic Retrieval Algorithm
XIANG He-lin , ZHANG Ming-xi , LI Po-han , HE Zhen-ying , WANG Wei.Clustering-based Semantic Retrieval Algorithm[J].Computer Engineering,2012,38(2):36-38.
Authors:XIANG He-lin  ZHANG Ming-xi  LI Po-han  HE Zhen-ying  WANG Wei
Affiliation:(School of Computer Science,Fudan University,Shanghai 201203,China)
Abstract:Latent Semantic Analysis(LSA) lacks computation efficiency and has storage deficiencies when it is used in the large scale semantic retrieval.To solve this problem,this paper proposes a clustering-based semantic retrieval algorithm.This algorithm clusters the documents using their structural information,and applies the LSA process on those clusters to efficiently reduce the number of documents.Experimental results show that the algorithm can exponentially decrease the time of inquiring and get good retrieval accuracy.
Keywords:Latent Semantic Analysis(LSA)  information retrieval  vector space model  graph clustering algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号