首页 | 官方网站   微博 | 高级检索  
     

基于文本内容的敏感数据识别方法研究与实现
引用本文:李伟伟,张涛,林为民,邓松,时坚,汪晨.基于文本内容的敏感数据识别方法研究与实现[J].计算机工程与设计,2013,34(4).
作者姓名:李伟伟  张涛  林为民  邓松  时坚  汪晨
作者单位:中国电力科学研究院南京分院,江苏南京,211100
基金项目:国家863高技术研究发展计划基金项目,国家电网公司科技攻关团队基金项目
摘    要:为了防止敏感数据的泄露,为数据的访问控制提供依据,提出并实现了一种基于中文文本内容的敏感数据识别方法.通过对敏感数据库和已知分类文档库的学习,完成对文本中敏感数据识别的阙值的确定和未知文档是否敏感数据的判断过程.描述了预处理、文本识别、阙值确定的详细设计和实现过程.通过对搜狗语料库中教育相关部分文本的识别,验证该方法的敏感数据识别过程简单实用并且具有较高的正确率.

关 键 词:敏感数据  文本识别  内容识别  数据防泄漏  分类算法

Research and implementation of sensitive data identification method based on text content
LI Wei-wei , ZHANG Tao , LIN Wei-min , DENG Song , SHI Jian , WANG Chen.Research and implementation of sensitive data identification method based on text content[J].Computer Engineering and Design,2013,34(4).
Authors:LI Wei-wei  ZHANG Tao  LIN Wei-min  DENG Song  SHI Jian  WANG Chen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号