首页 | 官方网站   微博 | 高级检索  
     

一种中文网页自动分类方法的实现及应用
引用本文:冯是聪,张志刚,李晓明.一种中文网页自动分类方法的实现及应用[J].计算机工程,2004,30(5):19-20,108.
作者姓名:冯是聪  张志刚  李晓明
作者单位:北京大学计算机科学技术系,北京100871
基金项目:国家“973”计划重大基础研究项目(G1999032706)
摘    要:为了有效地组织和分析海量的Web信息,文章应用有指导的机器学习方法实现了一个中文网页分类器,并应用该分类器在“天网”搜索引擎上实现了大规模中文网页的目录导航服务。实验结果表明该分类器有较高的分类质量,满足了中文网页自动分类的要求。

关 键 词:机器学习  中文网页分类  特征选取  目录导航
文章编号:1000-3428(2004)05-0019-02

Implementation and Applications of A Chinese Web Page Automatic Categorization Approach
FENG Shicong,ZHANG Zhigang,LI Xiaoming.Implementation and Applications of A Chinese Web Page Automatic Categorization Approach[J].Computer Engineering,2004,30(5):19-20,108.
Authors:FENG Shicong  ZHANG Zhigang  LI Xiaoming
Abstract:To effectively organize and analyze massive Web information, this paper makes use of supervised machine learning theory to implement a Chinese web page classifier, and the classifier is used to implement massive Chinese Web page category navigation in Tianwang search engine. The experimental results demonstrate that the classifier is effective and can satisfy Chinese Web page automatic categorization.
Keywords:Machine learning  Chinese Web page categorization  Feature selection  Category navigation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号