首页 | 官方网站   微博 | 高级检索  
     

网页文本信息提取及结果评价
引用本文:张恒,屈景辉,张亮.网页文本信息提取及结果评价[J].微计算机应用,2007,28(9):921-924.
作者姓名:张恒  屈景辉  张亮
作者单位:第四军医大学生物医学工程系计算机教研室,西安,710032
摘    要:由于HTML本身在自描述上的缺陷,网页信息中不可避免地存在大量的噪音信息。文章在分析了网页的HTML文档结构和噪音类型的基础上,给出了网页文本信息提取、对噪声抑制的方法,以及实现的过程。并尝试性地使用信噪比的概念作为评判文本信息提取去噪结果优劣的依据,实验结果显示,抽取去噪效果明显;同时实验表明,信噪比可以作为网页信息去噪结果优劣的评判标准。

关 键 词:信噪比  信息提取  网页去噪
修稿时间:2006-11-03

Web Page Text Information Extraction and Result Estimation
ZHANG Heng,QU Jinghui,ZHANG Liang.Web Page Text Information Extraction and Result Estimation[J].Microcomputer Applications,2007,28(9):921-924.
Authors:ZHANG Heng  QU Jinghui  ZHANG Liang
Abstract:
Keywords:Signal - to - noise Ratio  Information Extraction  Web de - noising
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号