基于宋词生成的大容量构造式信息隐藏算法 |
| |
引用本文: | 秦川,李蓉受,钱振兴,张新鹏.基于宋词生成的大容量构造式信息隐藏算法[J].计算机学报,2023(1):17-30. |
| |
作者姓名: | 秦川 李蓉受 钱振兴 张新鹏 |
| |
作者单位: | 1. 上海理工大学光电信息与计算机工程学院;2. 复旦大学计算机科学技术学院 |
| |
摘 要: | 在基于文本生成的信息隐藏算法研究中,如何在保证生成文本质量的同时提高隐藏容量是主要存在的挑战.为此本文提出一种基于宋词生成的构造式信息隐藏算法.首先对宋词文本数据进行预训练,然后基于自回归语言模型搭建宋词生成模型;其次根据宋词词牌固有的格式信息设计格律模块,在宋词生成阶段,需要向生成模型输入该格律模块,并通过符号集设计、编码等综合作用,生成宋词诗句.在利用宋词生成模型进行秘密信息隐藏的过程中,对格律模块进行重构,通过平仄韵词牌、词牌格式模板、关键字、韵律及押韵字符的不同选择,有效实现秘密信息的隐藏.信息提取是隐藏的逆过程,且提取过程不需要利用宋词生成模型,仅需根据模板和词典库来进行索引即可,提高了信息提取的效率.实验结果表明,本文提出的算法能够生成格式严格、韵律清晰、句子完整性高的宋词,且生成的宋词文本的信息隐藏容量均值可达21比特/句、安全性高,整体性能优于已报道的主流算法.
|
关 键 词: | 文本生成 构造式信息隐藏 宋词 格律控制 隐藏容量 |
|
|