首页 | 官方网站   微博 | 高级检索  
     

基于内容的网页信息处理方法
引用本文:王少宇,杜娟,秦前清.基于内容的网页信息处理方法[J].计算机应用,2005,25(4):977-978.
作者姓名:王少宇  杜娟  秦前清
作者单位:1. 武汉大学,电子信息学院,湖北,武汉,430079
2. 武汉大学,遥感信息工程学院,湖北,武汉,430079
3. 武汉大学,测绘遥感信息工程国家重点实验室,湖北,武汉,430079
摘    要:提出了一种基于内容的网页信息处理方法:利用顺序滤波直接对网页页面内容进行过滤处理,再根据设置的阈值将过滤后的网页页面变为黑白页面,从而提取出网页中的图像信息。对多个包含图像信息的网页进行处理的结果表明此方法能较有效的提取出网页中的图像信息。基于此方法和网页文本信息提取方法的不同原理,还尝试构建了一种基于内容的网页信息处理系统。

关 键 词:Internet  信息提取  顺序滤波  图像信息
文章编号:1001-9081(2005)04-0977-02

Content-based information processing method of Web page
WANG Shao-yu,DU Juan,QIN Qian-qing.Content-based information processing method of Web page[J].journal of Computer Applications,2005,25(4):977-978.
Authors:WANG Shao-yu  DU Juan  QIN Qian-qing
Affiliation:WANG Shao-yu 1,DU Juan 2,QIN Qian-qing 3
Abstract:A content-based method that performs information filtering and extracting on the Internet was put forward. The method directly filtered the content of Web pages using generalized order statistics filter, then converted the filtered Web pages into black and white ones according to the setting threshold, finally image information of Web pages was extracted. The results of several Web pages processed by this method indicate that it can effectively extract image information from Web pages. An attempted system combining the characteristics of the image and text extraction methods was constructed.
Keywords:Internet  information extraction  order statistics filter  image information
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号