首页 | 官方网站   微博 | 高级检索  
     

基于潜在语义索引和自组织映射网的检索结果聚类方法
引用本文:陈毅恒,秦兵,刘挺,王平,李生.基于潜在语义索引和自组织映射网的检索结果聚类方法[J].计算机研究与发展,2009,46(7).
作者姓名:陈毅恒  秦兵  刘挺  王平  李生
作者单位:哈尔滨工业大学计算机学院信息检索研究室,哈尔滨,150001
基金项目:国家自然科学基金项目,国家"八六三"高技术研究发展计划基金项目 
摘    要:随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论.提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型.在词条的权重中引入了语义关系.对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法.并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.

关 键 词:检索结果聚类  潜在语义索引  自组织映射网  标签  边界划分

Search Result Clustering Method Based on SOM and LSI
Chen Yiheng,Qin Bing,Liu Ting,Wang Ping,Li Sheng.Search Result Clustering Method Based on SOM and LSI[J].Journal of Computer Research and Development,2009,46(7).
Authors:Chen Yiheng  Qin Bing  Liu Ting  Wang Ping  Li Sheng
Affiliation:Laboratory of Information Retrieval;School of Computer Science and Technology;Harbin Institute of Technology;Harbin 150001
Abstract:
Keywords:search result clustering  LSI  SOM  label  boundary detection  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号