首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 500 毫秒
1.
阮冰 《现代电子技术》2010,33(4):145-147,151
随着信息技术的迅速发展,网络已经逐步成为人们生活当中不可或缺的信息传播工具。由于网络资源的大量使用和信息的大量传输,导致信息过载及安全等问题日益突出。为了解决信息过滤的过滤精度和效率瓶颈等问题,这里详细地对文本信息过滤的主要过程、文本表示方法、特征向量获取、相似度计算等技术进行研究,提出一个基于特征向量的文本信息过滤算法。该过滤算法有效地平衡了计算负载,具有较高的信息过滤性能。  相似文献   

2.
基于CHI与遗传算法的特征选择   总被引:1,自引:0,他引:1  
在基于Web文本信息过滤系统中通过特征选择找到的最优特征子集直接影响到分类的速度及精度。针对此问题,提出了综合CHI及遗传算法的特征选择方法。首先针对原始特征集,采用CHI统计法进行初始筛选,去除冗余特征及噪声后,对得到的特征子集再采用遗传算法进行第二次特征选择,从而得出代表问题空间的最优特征子集,实现降维并提高了分类精度。  相似文献   

3.
信息过滤技术是当前信息技术研究的一个热点。本文对BP神经网络和遗传算法在信息过滤技术中的应用,包括BP神经网络、遗传算法、文本特征提取、学习方法等,进行了研究和探讨。提出了一种基于BP神经网络和GA算法的信息过滤模型,实验结果表明,此模型运行可靠,过滤效率有明显提高。  相似文献   

4.
基于知网的概念特征抽取方法   总被引:14,自引:0,他引:14  
文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法。该方法比单纯的词汇信息更能体现文本的概念特征,提高过滤系统的性能;同时还能降低文本向量的维数,减少计算量,提高过滤效率。我们在引入了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性。  相似文献   

5.
针对基于内容的网络信息过滤中存在的特征维数过高影响分类过滤效果问题,运用遗传算法进行特征选择,通过遗传操作搜索最优解.并且引入个体寿命概念用于实施种群更新,同时根据种群进化情况动态调整遗传操作算子,从而解决遗传算法训练过程中种群以及操作算子的单一性带来局部最优问题.实践证明,该方法能够实现特征子集空间规模的压缩,有效提高过滤效果.  相似文献   

6.
牛洪波  丁华福 《信息技术》2007,31(12):100-102
针对目前网络上不良信息变换不同方式逃脱过滤以及中文分词器分词后存在的问题,提出了基于文本分类技术的信息过滤方法,通过在原有的文本自动分类系统中添加三个过滤模块,以过滤掉无用信息、单个独立字、敏感信息等不良内容,从而保障分类安全高效。  相似文献   

7.
粗糙集文本过滤系统研究及硬件实现   总被引:1,自引:0,他引:1  
互联网的广泛使用使得用户可以获取丰富的网络资源,但诸如反动、色情等不良信息也得以广泛的传播,极大地危害了人们的正常生活。文章围绕不良文本过滤这个主题,分析了现有文本过滤系统的优缺点,并通过研究粗糙集条件属性约简理论,设计了一个网络不良文本过滤系统,同时在硬件上予以实现。  相似文献   

8.
互联网的迅速普及,给社会生活带来巨大进步,也带来了一系列的安全问题,诸如反动、色情等不良信息得以广泛传播,极大地危害了人们正常的学习和生活。论文围绕不良文本过滤这个主题,分析了现有的文本过滤系统的优点和不足,并通过研究VSM,设计了一个网络不良文本过滤系统,同时在硬件上予以实现。  相似文献   

9.
面对海量的网络数据,传统方法在检索信息时需要庞大的精力和时间,因此,提出基于加权遗传算法的交互网络特征反馈标记方法。分析交互网络数据处理流程,根据分析结果,利用加权遗传算法对特征加权计算,找出近似全局最优解;使用户对文本特征或者图像实例完成标记,基于用户的标记与未标记情况构建双重监督图,建立实数值推测函数并计算,获取双重监督图中未标记的结点。仿真实验验证了方法误差较小、检索精度较高,可在大量的数据中快速找到目标内容。  相似文献   

10.
李慧  施荣华 《信息技术》2007,31(12):73-76
网页过滤系统旨在帮助用户屏蔽不健康的网页。提出了基于混合模式的网页过滤模型,将传统的基于网址过滤和敏感词过滤的方法与基于文本分类的过滤方法结合起来。重点讨论了特征量选取、网页结构化信息利用等方面的改进措施。实验表明这种模型在保持易于实现的特点的同时,在速度和准确度方面都有不同程度的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号