HTML结构特征及概念学习聚焦网页采集系统设计 |
| |
作者姓名: | 吉莉莉 陈悦 |
| |
作者单位: | [1]北京信息科技大学,北京100192 [2]北京信息职业技术学院,北京100018 |
| |
摘 要: | 网页采集技术是近年来Web相关领域研究的热点,大到通用搜索引擎(谷歌、百度等),小到特定主题的专用网页采集系统(如企业竞争情报系统),都离不开网页采集。本文介绍了HTML结构特征及与概念学习的聚焦网页采集系统的结构和主要算法。
|
关 键 词: | 聚焦网页采集 HTML结构特征 概念学习 |
本文献已被 维普 等数据库收录! |
|