共查询到20条相似文献,搜索用时 78 毫秒
1.
该文介绍中文网页自动分类的研究状况;分析常用的特征提取方法并比较其在中文网页分类应用中的优劣,总结经典分类方法;简述分类评价指标;讨论目前分类系统。 相似文献
2.
3.
中文网页分类研究与系统实现 总被引:3,自引:1,他引:3
近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页分类性能由81.5%提高至94.9%。 相似文献
4.
5.
为了网页信息的有效组织和检索,针对网页中的超文本结构特征,在研究网页间的超链接、超文本标记对信息提取的作用的基础上,阐述了一种基于“超文本标记加权”和“超链接森林”的因特网信息提取方法,并与传统方法进行了对比。实验结果表明,该方法用于网页的自动分类具有较好的效果。 相似文献
6.
7.
李新福 《计算机工程与应用》2007,43(24):169-171
基于向量空间模型的文本分类中特征向量是极度稀疏的高维向量,只有降低向量空间维数才能提高分类效率。在利用统计方法选择文本分类特征降低特征空间维数的基础上,采用隐含语义分析技术,挖掘文档特征间的语义信息,利用矩阵奇异值分解理论进一步降低了特征空间维数。实验结果表明分类结果宏平均F1约提高了5%,验证了该方法的有效性。 相似文献
8.
本文以实践经验为基础,对网页的源程序公共结构进行了分析,并充分考虑到中文网页的文字特点,给出了一种中文网页的分类方法与实现手段,结果表明该方法行之有效。 相似文献
9.
本文从网页分类方面对万维网上的数据处理技术进行了分析,对中文网页/文本分类技术进行了介绍,阐述了基于支持向量机的网页自动分类算法。 相似文献
10.
AIP(All day Information Pursue)平台,即全天候信息跟踪平台,作为关注多方面消息的企业或团体查看Internet上新信息的一种解决方案,弥补了搜索引擎一些方面的不足。它能够从Internet上获取每日的新信息,利用网页自动分类去除不相关文章。通过此平台.用户可以按时间、按类别来查看信息,也可以对文章加以标注推荐给别人阅读。 相似文献
11.
本文主要研究了树匹配算法在网页分类中的应用。在详细地介绍树匹配算法后。通过实验证明了该方法的有效性。 相似文献
12.
几种典型特征选取方法在中文网页分类上的效果比较 总被引:31,自引:2,他引:31
针对中文网页,比较研究了CHI、IG、DF以及MI特征选取方法。主要的实验结果有:(1)CHI、IG和DF的性能明显优于MI;(2)CHI、IG和DF的性能大体相当,都能够过滤掉85%以上的特征项;(3)DF具有算法简单、质量高的优点,可以用来代替CHI和IG;(4)使用普通英文文本和中文网页评测特征选取方法的结果是一致的。 相似文献
13.
本文以多年的教学实践为基础,阐述了将现代教学理念融入《网页制作》课程的具体过程,总结了《网页制作》课程教学中的一些教学方法和心得体会,强调教师主导作用与学生主体作用的统一,注重培养学生的独立学习和创新精神。 相似文献
14.
有很多不同的分块算法都可以对web网页进行分块.研究分块的1/1的是为了相关领域进一步研究的需要。例如通过页面块内容的重要程度研究基于块的搜索、定位网页的重要主题或内容,研究网页主要内容或主题的抽取,以及基于Web页面分块的Web存档等。首先给出Web页面分块问题定义和分类,并对几种典型的分块算法进行原理剖析,为进一步研究web页面分块问题提供一些有益的参考。 相似文献
15.
李旻松 《数字社区&智能家居》2006,(9):51-51,151
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容:本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。 相似文献
16.
文章从WEB文档的特点出发,指出有必要对 WEB文档进行模糊特征向量抽取,并给出了对向量进行模糊化的隶属函数。以此为基础实现了将BIRCH聚类算法应用到文本分类,取得了很好效果。 相似文献
17.
浅析网页设计中的页面布局 总被引:1,自引:0,他引:1
网页是网站构成的基本元素,决定网页是否吸引浏览者的重要因素之一是网页的合理布局。本文阐述了在整体上把握好页面布局的重要性,介绍了网页布局的常见类型,对网页布局的技术和方法做了详细地分析。 相似文献
18.
李旻松 《数字社区&智能家居》2006,(26)
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容。本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。 相似文献
19.
以一个足球网站解决静态网页的制作为例,通过描述业务流程、组件设计思想、接口设计以及程序设计,解释了组件实现静态网页制作的整个过程。 相似文献
20.
基于网页结构特征的网页主要文本信息抽取策略 总被引:1,自引:0,他引:1
根据网页文本信息的存储特点,提出一种网页文本信息抽取策略,有效地实现了对文本丰富型网页中主要文本信息的抽取工作.该抽取方法具有较强的空阃适应性和时间适应性. 相似文献