首页 | 官方网站   微博 | 高级检索  
     

基于语义匹配的抄袭检测方法
引用本文:邹杜,陈育青,张凌.基于语义匹配的抄袭检测方法[J].华南理工大学学报(自然科学版),2013,41(7).
作者姓名:邹杜  陈育青  张凌
作者单位:1. 华南理工大学信息网络工程研究中心,广东广州,510640
2. 华南理工大学计算机科学与工程学院,广东广州,510006
基金项目:the National Natural Science Foundation of China,国家自然科学基金资助项目
摘    要:现有的抄袭检测方法大多根据相似度来判定文档间是否存在抄袭.与常见的复制检测不同,在抄袭检测中,占文档很小比例且未加引用的复制文本也将被认定为抄袭.受文档尺寸、复制篇幅和干扰信息的影响,现有方法的检测效果均不理想.针对这种局限性,文中分析了文本语义与指纹排列顺序的关系,提出了语义匹配方法,将指纹向量投影到一个二进制向量,在降低维数的同时保留了指纹的位置信息.在PAN公用语料集上将该方法与Jaccard和Hamming距离法进行了对比测试,发现文中方法的召回率和准确度均更优.

关 键 词:语义匹配  抄袭检测  指纹  文本语义

A Plagiarism Detection Method Based on Semantic Matching
Zou Du , Chen Yu-qing , Zhang Ling.A Plagiarism Detection Method Based on Semantic Matching[J].Journal of South China University of Technology(Natural Science Edition),2013,41(7).
Authors:Zou Du  Chen Yu-qing  Zhang Ling
Abstract:
Keywords:semantic matching  plagiarism detection  fingerprint  text semantics
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号