首页 | 官方网站   微博 | 高级检索  
     

HTML结构特征及概念学习聚焦网页采集系统设计
作者姓名:吉莉莉  陈悦
作者单位:[1]北京信息科技大学,北京100192 [2]北京信息职业技术学院,北京100018
摘    要:网页采集技术是近年来Web相关领域研究的热点,大到通用搜索引擎(谷歌、百度等),小到特定主题的专用网页采集系统(如企业竞争情报系统),都离不开网页采集。本文介绍了HTML结构特征及与概念学习的聚焦网页采集系统的结构和主要算法。

关 键 词:聚焦网页采集  HTML结构特征  概念学习
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号