首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
该文介绍中文网页自动分类的研究状况;分析常用的特征提取方法并比较其在中文网页分类应用中的优劣,总结经典分类方法;简述分类评价指标;讨论目前分类系统。  相似文献   

2.
中文网页自动分类现状的研究   总被引:1,自引:0,他引:1  
本文重点阐述中文网页自动分类关键技术的现状,介绍分析了两个中文网页自动分类系统。并在文章最后对未来研究提出建议。  相似文献   

3.
中文网页分类研究与系统实现   总被引:3,自引:1,他引:3  
近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页分类性能由81.5%提高至94.9%。  相似文献   

4.
本文应用有指导机器学习方法实现了一个分类器.运用改进型的MI进行特征提取,并对传统的TFIDF加权公式进行了改进.实验结果表明该分类器有较高的分类质量,满足了中文网页自动分类的要求.  相似文献   

5.
为了网页信息的有效组织和检索,针对网页中的超文本结构特征,在研究网页间的超链接、超文本标记对信息提取的作用的基础上,阐述了一种基于“超文本标记加权”和“超链接森林”的因特网信息提取方法,并与传统方法进行了对比。实验结果表明,该方法用于网页的自动分类具有较好的效果。  相似文献   

6.
郑津  景彦昊 《福建电脑》2014,(4):153-154
本文主要分析了中文网页自动分类所要用到的功能和技术,给出了一个可行的中文网页自动分类系统的基本构架。  相似文献   

7.
基于向量空间模型的文本分类中特征向量是极度稀疏的高维向量,只有降低向量空间维数才能提高分类效率。在利用统计方法选择文本分类特征降低特征空间维数的基础上,采用隐含语义分析技术,挖掘文档特征间的语义信息,利用矩阵奇异值分解理论进一步降低了特征空间维数。实验结果表明分类结果宏平均F1约提高了5%,验证了该方法的有效性。  相似文献   

8.
中文网页自动分类研究   总被引:2,自引:0,他引:2       下载免费PDF全文
本文以实践经验为基础,对网页的源程序公共结构进行了分析,并充分考虑到中文网页的文字特点,给出了一种中文网页的分类方法与实现手段,结果表明该方法行之有效。  相似文献   

9.
本文从网页分类方面对万维网上的数据处理技术进行了分析,对中文网页/文本分类技术进行了介绍,阐述了基于支持向量机的网页自动分类算法。  相似文献   

10.
王冠  裘正定 《微机发展》2005,15(3):136-138,141
AIP(All day Information Pursue)平台,即全天候信息跟踪平台,作为关注多方面消息的企业或团体查看Internet上新信息的一种解决方案,弥补了搜索引擎一些方面的不足。它能够从Internet上获取每日的新信息,利用网页自动分类去除不相关文章。通过此平台.用户可以按时间、按类别来查看信息,也可以对文章加以标注推荐给别人阅读。  相似文献   

11.
本文主要研究了树匹配算法在网页分类中的应用。在详细地介绍树匹配算法后。通过实验证明了该方法的有效性。  相似文献   

12.
几种典型特征选取方法在中文网页分类上的效果比较   总被引:31,自引:2,他引:31  
针对中文网页,比较研究了CHI、IG、DF以及MI特征选取方法。主要的实验结果有:(1)CHI、IG和DF的性能明显优于MI;(2)CHI、IG和DF的性能大体相当,都能够过滤掉85%以上的特征项;(3)DF具有算法简单、质量高的优点,可以用来代替CHI和IG;(4)使用普通英文文本和中文网页评测特征选取方法的结果是一致的。  相似文献   

13.
本文以多年的教学实践为基础,阐述了将现代教学理念融入《网页制作》课程的具体过程,总结了《网页制作》课程教学中的一些教学方法和心得体会,强调教师主导作用与学生主体作用的统一,注重培养学生的独立学习和创新精神。  相似文献   

14.
有很多不同的分块算法都可以对web网页进行分块.研究分块的1/1的是为了相关领域进一步研究的需要。例如通过页面块内容的重要程度研究基于块的搜索、定位网页的重要主题或内容,研究网页主要内容或主题的抽取,以及基于Web页面分块的Web存档等。首先给出Web页面分块问题定义和分类,并对几种典型的分块算法进行原理剖析,为进一步研究web页面分块问题提供一些有益的参考。  相似文献   

15.
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容:本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。  相似文献   

16.
文章从WEB文档的特点出发,指出有必要对 WEB文档进行模糊特征向量抽取,并给出了对向量进行模糊化的隶属函数。以此为基础实现了将BIRCH聚类算法应用到文本分类,取得了很好效果。  相似文献   

17.
浅析网页设计中的页面布局   总被引:1,自引:0,他引:1  
网页是网站构成的基本元素,决定网页是否吸引浏览者的重要因素之一是网页的合理布局。本文阐述了在整体上把握好页面布局的重要性,介绍了网页布局的常见类型,对网页布局的技术和方法做了详细地分析。  相似文献   

18.
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容。本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。  相似文献   

19.
张俊 《电脑学习》2002,(2):17-18
以一个足球网站解决静态网页的制作为例,通过描述业务流程、组件设计思想、接口设计以及程序设计,解释了组件实现静态网页制作的整个过程。  相似文献   

20.
基于网页结构特征的网页主要文本信息抽取策略   总被引:1,自引:0,他引:1  
根据网页文本信息的存储特点,提出一种网页文本信息抽取策略,有效地实现了对文本丰富型网页中主要文本信息的抽取工作.该抽取方法具有较强的空阃适应性和时间适应性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号