区块链下社交网络用户抄袭识别方案 |
| |
引用本文: | 李莉,杨春艳,朱江文,胡荣磊.区块链下社交网络用户抄袭识别方案[J].计算机应用,2024(1):242-251. |
| |
作者姓名: | 李莉 杨春艳 朱江文 胡荣磊 |
| |
作者单位: | 1. 北京电子科技学院电子与通信工程系;2. 西安电子科技大学计算机科学与技术学院 |
| |
基金项目: | 中央高校基本科研业务费专项资金资助项目(3282023017)~~; |
| |
摘 要: | 针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为文本相似度检测提供依据。在Merkle树和布隆过滤器结构的基础上,设计了新的索引结构BHMerkle,减少了区块构建和查询时的计算开销,实现了对交易的快速定位。同时提出多特征权重Simhash算法,提高了词权计算的准确性并提高签名值匹配阶段的效率,从而对具有抄袭行为的恶意用户进行识别,并通过奖惩机制遏制恶意行为的发生。抄袭识别方案在不同主题的新闻数据集上的平均准确率为94.8%,平均召回率为88.3%,相较于多维度Simhash算法和基于信息熵加权的Simhash(E-Simhash)算法,平均准确率分别提升了6.19、4.01个百分点,平均召回率分别提升了3.12、2.92个百分点。实验结果表明,所提方案在抄袭文本的查询及检测效率方面均有所提升,且在抄袭识别方面具有较高的准确性。
|
关 键 词: | 区块链 抄袭识别 Simhash算法 相似度检测 社交网络 |
|