首页 | 官方网站   微博 | 高级检索  
     

Deep Web数据源聚类与分类
引用本文:王兵,王轲.Deep Web数据源聚类与分类[J].计算机与现代化,2007(8):36-40.
作者姓名:王兵  王轲
作者单位:1. 上海理工大学现代化教学中心,上海,200093
2. 北京第二外国语学院,北京,100024
摘    要:随着Internet信息的迅速增长,许多Web信息已经被各种各样的可搜索在线数据库所深化,并被隐藏在Web查询接口下面.传统的搜索引擎由于技术原因不能索引这些信息--Deep Web信息.本文分析了Deep Web查询接口的各种类型,研究了基于查询接口特征的数据源聚类方法和基于聚类结果的数据源分类方法,讨论了从基于规则与线性文档分类器中抽取查询探测集的规则抽取算法和Web文档数据库分类的查询探测算法.

关 键 词:Deep  Web  查询接口  数据源聚类  分类  Deep  数据源  聚类方法  文档分类器  Clustering  探测算法  文档数据库  规则抽取算法  线性  基于规则  分类方法  结果  接口特征  查询接口  研究  类型  分析  搜索引擎  技术原因  在线数据库
文章编号:1006-2475(2007)08-0036-05
收稿时间:2007-05-21
修稿时间:2007年5月21日

DataSource Clustering and Classifying on Deep Web
WANG Bing,WANG Ke.DataSource Clustering and Classifying on Deep Web[J].Computer and Modernization,2007(8):36-40.
Authors:WANG Bing  WANG Ke
Affiliation:1. Modernized Education Technology Center, University of Shanghai for Science and Technology, Shanghai 200093, China; 2. Beijing International Studies University, Beijing 100024, China
Abstract:As the amount of information on the Web increases rapidly,much Web information has been rapidly deepened by myriad searchable databases online,where data are hidden behind query interfaces.Traditional crawler does not index these information-Deep web.This paper analyzes the types of Deep Web query interface,and researches the method of data source clustering on the basis of the character of the query interface and the classification approach for data source according to clustering results.It also discusses the extracting arithmetic which is based on rules and linear document classification device and the querying probe arithmetic which is grounded on Web file database categorization.
Keywords:Deep Web  query interface  datasource clustering  classifying
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号