共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
沈麒宁 《计算机与数字工程》2022,50(5):1089-1092
敏感信息检测是数据防泄漏领域的重要问题,而文本文档是承载敏感信息的主流载体。针对实际语境上下文变化导致文本敏感程度不同和训练样本较少的问题,论文提出了一种基于神经网络的敏感文档检测模型,在引入预训练动态词向量的基础上使用卷积神经网络对敏感文档以二分类的方式进行检测。由于敏感文档没有公开的数据集,使用维基解密的中文文本构造数据集进行实验,验证了论文提出改进的elmo-CNN模型的有效性和实用性,对于敏感检测产品落地具有一定参考价值。 相似文献
3.
本文依据隐马尔柯夫模型修正特征词属性向量,利用BP神经网络的学习能力,采用遗传算法优化,构造了一种遗传神经网络的中文文本分类器。实验表明,此文本分类器分类有较高的准确性。 相似文献
4.
一种神经网络文本分类器的设计与实现 总被引:1,自引:0,他引:1
论文着重介绍了一种基于神经网络的文本分类器,分类器使用神经网络作为分类工具,特征词的词频组成原始特征向量,和神经网络输入层的神经元一一对应。并引入了信息检索中的常用技术——潜在语义索引,训练过程中结合遗传算法,优化神经网络的初始权值。最后对分类器进行了开放性测试,实验表明分类器对文本分类具有较高的平均查全率和平均精度。 相似文献
5.
以解决公安部门犯罪信息文本数据自动分类问题为应用目的,通过对已有多层文本自动分类技术的研究,给出多层文本分类器的过程模型,并对模型中的特征提取方法进行深入研究,提出改进后的特征提取权重计算公式。实验证明,该分类器能够有效解决犯罪信息文本的自动分类问题。 相似文献
6.
廖一星 《计算机应用与软件》2009,26(9):234-236,239
为了提高文本分类精度,根据训练集的样本密度的不同,提出了一种基于k最近邻密度估计的样本加权算法,从而使得样本密度较大的样本权重得到加强,处于样本密度平均水平的样本权重保持不变,而样本密度较小的样本权重得到减弱.并将这种方法所构成的神经网络分类器用于文本分类.实验结果表明,这种方法可以在一定程度上提高文本分类精度,优于原始的未加权的分类方法. 相似文献
7.
一、引言计算机指纹识别技术是一门综合性的技术,21世纪的今天,它已成为可靠的个人身份鉴定的方法之一。在所有生物识别技术中,指纹识别技术是应用最广泛最普及的,例如它可以应用于金融、保险、证券行业的身份认证,安防业,人力资源管理等等。但随着应用广泛性的增强,人工对比指纹往往会出现效率低、速度慢的现象,所以近年来人们对指纹识别技术的可靠性、实时性的要求变得越来越高了。针对这样的要求,本文提出了一种基于BP神经网络的、对已建好的指纹模板库进行快速分类的算法。 相似文献
8.
根据优化理论中的Hooke-Jeeves模式搜索(pattern search)法提出了多层前馈式神经网络快速训练算法HJPS.该算法由“探测搜索”和“模式移动”两个步骤交替进行.其基本思想是探测搜索依次沿各个坐标轴进行,用以确定新的基点和有利于网络误差函数值下降的方向.模式移动沿相邻两个基点的连线方向前进,从而进一步减小误差函数值,达到更快收敛.实验结果表明,同BP算法以及其他几种快速算法相比,HJPS算法在收敛速度和运算时间上都有非常显著的提高.同时HJPS算法的泛化能力很强. 相似文献
9.
张鸿宾 《计算机应用与软件》1994,11(5):15-19,53
使用BP算法训练多层网络的速度很慢而且事先难于确定隐节点和隐层的适当数目。本文提出一个有效的算法,先构造决策树,然后将构造的决策树转换为神经网。文中使用一个全局准则函数控制决策树的增长,它较好地匹配了树的复杂性和训练样本量及错分率界。实验结果,本文的算法比用BP算法训练多层网络要快,而其分类精度不低于用BP算法训练的多层神经网。 相似文献
10.
提出了一种新型的基于竞争型神经网络的学习算法,该算法综合了竞争型神经网络和层次聚类的特点,通过竞争型神经两络对对象进行初步分类,并在隐含层采用Hcbb学习规则对子类进行关联学习,学习速度快,分类质量好,可以对任意形状、任意大小的簇进行聚类,同时不受噪音的影响,是一种快速高效的分类算法。 相似文献
11.
12.
文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。 相似文献
13.
14.
随着信息时代的到来,网络评论数量急剧增加,对于这些网络评论的倾向性分析是网络舆情研究中的重要课题。为了对网络评论的倾向性进行分析,提出了基于神经网络的网络舆情文本倾向性分析算法,使用神经网络训练的方法构建了较好的情感词倾向值词典,对网络评论的倾向性预测达到了较高的准确率。对算法进行了细致的描述,同时提出了基于神经网络的网络舆情文本倾向性分析系统框架。最后通过实验进行测试,证明了该系统能够达到较好的准确率。 相似文献
15.
16.
基于RBF神经网络和决策树的文本分类方法 总被引:3,自引:0,他引:3
该文根据CH I值原理、基于R BF神经网络和决策树原理,提出了一种文本分类的新方法。决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间,对于维数达成千上万维的文本分类问题很难应用。该文分析了CH I值原理,提出了一种改进的CH I值;并用改进的CH I值选择了对每个文本类别分类贡献大的若干词条,并采用基于RBF神经网络方法对选择的特征进行进一步提取,因此得到维数较小的文本向量空间。最后再使用决策树进行分类,从而既保证了分类精度又可很容易地抽取出分类规则。 相似文献
17.
为了高速度、高质量地浏览网络上的大量中文文本,提出了一种文本凹凸树结构的可视化浏览机制,并给出其彤式描述.通过以关键字和概念词典标注的最小概念集标识结点建立文本分类的层次树结构,为用户快速洲览文本提供有效路径.通过统计方法进行文本摘要抽取,按大纲、逻辑主题词段落和摘要洲览文本内容,提高了搜索查询速度与阅读效率,满足了用户快速、主动浏览文本的需求. 相似文献
18.