首页
|
官方网站
微博
|
高级检索
全部学科
医药、卫生
生物科学
工业技术
交通运输
航空、航天
环境科学、安全科学
自然科学总论
数理科学和化学
天文学、地球科学
农业科学
哲学、宗教
社会科学总论
政治、法律
军事
经济
历史、地理
语言、文字
文学
艺术
文化、科学、教育、体育
马列毛邓
全部专业
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目中文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
基于网站结构挖掘的Web文档自动分类
引用本文:
谢振亮,何丕廉,陈霞,孟昭鹏.基于网站结构挖掘的Web文档自动分类[J].计算机应用,2003,23(7):37-39.
作者姓名:
谢振亮
何丕廉
陈霞
孟昭鹏
作者单位:
天津大学,计算机科学与技术系,天津,300072
基金项目:
天津市科技发展计划项目(023100511)
摘 要:
对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。
关 键 词:
结构挖掘
Web文档自动分类
分类模式
扩展网页
文章编号:
1001-9081(2003)07-0037-03
修稿时间:
2003年2月18日
Automatic Web Page Categorization Based on Structure Mining of Sites
Abstract:
Keywords:
structure mining
automatic web page categorization
classification pattern
extended page
本文献已被
CNKI
维普
万方数据
等数据库收录!
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号-23
京公网安备 11010802026262号