首页 | 官方网站   微博 | 高级检索  
     

基于网站结构挖掘的Web文档自动分类
引用本文:谢振亮,何丕廉,陈霞,孟昭鹏.基于网站结构挖掘的Web文档自动分类[J].计算机应用,2003,23(7):37-39.
作者姓名:谢振亮  何丕廉  陈霞  孟昭鹏
作者单位:天津大学,计算机科学与技术系,天津,300072
基金项目:天津市科技发展计划项目(023100511)
摘    要:对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。

关 键 词:结构挖掘  Web文档自动分类  分类模式  扩展网页
文章编号:1001-9081(2003)07-0037-03
修稿时间:2003年2月18日

Automatic Web Page Categorization Based on Structure Mining of Sites
Abstract:
Keywords:structure mining  automatic web page categorization  classification pattern  extended page
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号