面向防伪认证的PDF417=维码水印技术的实现

作者：放心测系统发表时间：2022-03-27 02:57:38 浏览次数：248

1 引言(Introduction)二维条码本质上是一种特殊的二值图像，像素点集中只有0和1，即黑和白。结构简单，易于生成和读取，在商品识别、票证识别等方面有广泛运用。向二维条码中添加水印可以达到证件防伪和信息隐藏的目的。最常见的二维条码有QR(Quick Response)码和PDF417，本文重点研究的是PDF417(Portable Data File 417)码。

文献[1]提出了基于QR码的盲数字图像水印技术，使用密钥和抗攻击嵌入域提高的鲁棒性和视觉不可见性。文献[2]使用密钥技术对水印信息进行加密处理，提升了水印信息的安全性。文献[3]提出了基于DWT和SVD的防伪QR码水印算法，防伪性能和水印质量高。文献[4]提出了一种先用freeman链码和B样条曲线误差预处理后再将水印信息内容的散列值嵌入到图像中的方法，容量有所提高，但其算法实现复杂，信息受限。文献[5]使用小波变换在QR码中实现了水印嵌入。文献[6]利用变形技术，适当的改变原有图像的宽度已达到嵌入水印的目的，但水印容量较低。文献[7]在DCT(Discrete Cosine Transform)的基础上实现了一种利用了PDF417编码方法的水印嵌入算法，其水印信息的容量和稳健性有较大提高。文献[8]提出了一种了基于PDF417条码自身结构特点的水印信息隐藏方法，将条空结构进行适量的微调，在保证条码信息不丢失不畸变的前提下，将信息隐藏到条码中，但其抗水平畸变性能差。文献[9]在文献[8]的基础上修改了识别方法，牺牲容量换取了较好的鲁棒性。本文提出了一种基于文献[8]的竖直方向微调条空结构的水印明隐藏方法。

2 相关工作(Related work)

2.1 PDF417二维条码的基本原理

PDF417二维条码是由王寅君博士发明的，其识别的原子单位是模组，数字图像中每个模组可有若干个像素构成，每个PDF417的码字包含了长度不等的4个黑条与4个白条，单条宽度不超过6个模组宽，总数为17个模组宽度，故得名417。如图1所示，完整的PDF417条码由起始区、左层指示器、数据区、右层指示区、结束区组成。起始区和结束区标记了条码的开始和结束位置，左右层指示区表明了解码所需的，数据区存放条码所携带的信息。

图1 PDF417条码结构

Fig.1 The structure of PDF417 bar code

2.2 相关文献方法

面向防伪认证的PDF417水印技术主要包含嵌入和提取两个步骤。嵌入阶段需要计算容量和水印长度并进行一定的预处理，如添加校验信息、加密和编码压缩，将水印信息按一定的算法嵌入条码中。而提取阶段则要提取水印信息并进行相对应的解压、解密和校验。

文献[8]提出了一种基于条空的PDF417码的水印方法，其本质是在PDF417码允许误差范围内调整每个模块的宽度，其与标准值的差表明是否为1，连起来即为比特流形式的水印信息。其原理图如所示。这种方法可以顺利嵌入水印，并且暗隐藏模式下在视觉上不易被发现。但是由于利用了PDF417码允许误差的特点，导致实际图像发生误差允许内变形后水印信息误读，数据读取异常，鲁棒性较差。

图2 基于条空的水印方法

Fig.2 The watermark method based on bar blanks

文献[9]在文献[8]的基础下提出了一种新的基于码字条空误差的水印判断方法，根据一个码字中嵌入水印导致误差的正负来判断1和0，其原理图如图3所示。这种方法大大提升了水印信息的鲁棒性,但是容量也大打折扣。

图3 基于码字条空误差的判断方法

Fig.3 The judgment method based on error of the bar

blanks of code words

3 本文提出的算法(The algorithm proposed in this

paper)

本文提出了一种基于文献[8]的改进算法，在竖直方向上微调条空结构，几乎不影响水平方向的条空结构。使用本方法可以增加鲁棒性又不会缺失大量的容量。

3.1 预处理

3.1.1 图像二值化

图像在传播的过程中经常会被统一转换成彩色图像，如在安卓系统中图片在显示时会统一转换成bitmap位图，其色彩方案是ARGB。为了降低程序运行的难度和处理的数据量，需要先将其二值化处理。

首先分别读取R、G、B的数值，然后根据式(1)将图像转换成灰度图像，再根据式(2)的阈值将其二值化，其中A参数不影响结果，因此忽略。

(1)

(2)

另外一种获得二值化图像的方法是将像素与0x00808080按位与(80H=1000000B=128D)，获得的值与0进行比较从而快速判断像素的黑白值。由于二维码图像的直方图会有明显且较宽的分界，此方法不会有太大的误差，处理速度更快。

表1 两种颜色二值化后的结果

Tab.1 The results of binaryzation for two colors

ARGB A R G B ARGB A R G B

原始值(灰色) FF 6F 6F 6F 原始值(乳白色) FF C9 DF 8A

按位与后 00 00 00 00 按位与后 00 80 80 80

判断结果黑色判断结果白色

3.1.2 角度矫正

二维码在扫描后的图片会产生不同程度空间的倾斜，因此在处理前需要先将其矫正。利用Hough变换求出其边界再将其旋转到水平位置[4]。

3.1.3 水印预处理

若对水印本身有加密需要，可以再进行一定的加密算法。为了防止水印被篡改，还可以添加校验位，校验失败即认为水印是伪造的。如使用BASE64进行预编码。

3.1.4 图像定位和码字检测

图像经过预处理后可认为是理想情况，可以进行水印操作。首先确定二维码的四个顶点位置和模块大小。从头和尾进行定位两个对角点即可得到二维码有效区域。PDF417码拥有固定的起始区和结束区，因此可以快速得到模块宽度。对于未加工过的模块，其模块高度和条码高度必然满足式(3)的关系：

(3)

因此可以遍历数据区每个模块的高度，排除不满足式(3)后选取最小的值即为模块高度。由于PDF417码中的每个码字都有4个黑条和4个白条，数据区的每一行都不会出现全白或全黑的情况，此法具有较高的可靠性。

3.1.5 色块识别

以一个16*4的模块为例，读取其中一个色块即可获得模块的颜色信息，但是如果在这个色块出现严重噪声将会导致识别错误，因此可以读取3—5个点以排除误差。16*4模块如果进行边缘取反处理，那么其高度应为2即其水印部分只有2*4，选择3—5个点即可可靠获得模块颜色信息。

3.1.6 可用空间判断

本文提出的算法对嵌入空间有一定要求，上下同色的边界处改变色块会造成视觉显著变化，不适合隐藏，因此需要找出所有上下模组颜色不同的区域作为水印空间。这些水印空间有两种情况，即上黑下白和上白下黑。嵌入水印信息1时在边界白色区域添加一定高度黑条。

改变色块的高度影响分辨能力，越高越容易被发现，甚至影响PDF417码本身的识别，越低越容易导致程序本身无法识别。因此，本文中改变色块区域的高度均采用式(4)，其中为码字高，[]表示取整数部分。

(4)

3.2 本文提出的水印嵌入算法

具体嵌入步骤如下：

(1)生成原始二维码和水印信息的比特流。

(2)对原始二维码进行定位。

(3)遍历可用空间。

(4)读取一位水印信息，为0不修改，为1添加黑条。

(5)判断可用空间是否用完，或水印是否全嵌入完毕。若空间有剩余，水印未嵌入完毕，重复步骤(3)。

(6)输出嵌入水印后的二维码图像。

程序流程图如图4所示。

图4 本文提出的水印嵌入算法流程图

Fig.4 The flow chart of the algorithm for watermark

embedding proposed in this paper

3.3 水印的提取

水印的提取算法与嵌入类似，具体步骤如下：

(1)图像预处理。

(2)对二维码图像进行定位。

(3)遍历可用空间。

(4)判断是否嵌入水印，嵌入水印比特流添加1，否则添加0。

(5)可用空间仍有空间则重复步骤(3)。

(6)输出比特流。

算法流程图如图5所示。

图5 本文提出的水印读取算法流程图

Fig.5 The flow chart of the algorithm for watermark

extraction proposed in this paper

4 实验结果及性能分析(Experimental results and

performance analysis)

4.1 鲁棒性分析

JPEG是一种对图像的有损压缩，量化质量因子Q为1—100，Q越高，信息损失越少。本文对一个嵌入水印的PDF417码进行了Q=10、Q=40、Q=70的压缩攻击，均顺利得到正确的条码信息和水印信息。

表2 不同Q下二维码读取结果

Tab.2 The results of reading two-dimensional code

in different values of Q

质量因子 (a)原始 (b)Q=70 (c)Q=40 (d)Q=10

PDF417码图像

条码信息华东理工大学华东理工大学华东理工大学华东理工大学

水印信息信息学院信息学院信息学院信息学院

通过放大表2中d的PDF417码图像，可以发现图像已经有很大程度的失真。

图6 Q=10的局部放大图

Fig.6 The partial enlarged drawing when Q is

equals to 10

打印扫描会使图像损失信息、图形失真，在打印精度低的打印机和扫描机上尤为显著。

(a)打印扫描后图像整体图

(a)The global image after printing and scanning

(b)打印扫描后图像局部放大图

(b)The partial enlarged drawing after printing and scanning

(c)预处理后局部放大图

(c)The partial enlarged drawing after pretreatment

图7 打印扫描攻击结果分析

Fig.7 The analysis on results of printing and

scanning attacks

从图7(a)可以看出打印扫描后图像有明显噪点，从图7(b)可以看出有些区域的噪点明显泛白，尤其是边缘的噪点会导致识别错误。但是图像本身的信息还很好的保留着。通过预处理可以将其转换成适合提取信息的理想图形。

从图7(c)可以看到预处理后图形锐利了许多，但仍然有少量毛刺存在。毛刺所占比例很小，通过3.1.5中介绍的色块识别规则可以避免此毛刺影响。通过图8可以发现水印信息成功无损提取。

图8 水印信息的提取

Fig.8 The extraction of watermark information

4.2 水印容量

水印容量是根据图像本身的可利用空间计算的，其只能在二维码生成之后再计算空间并嵌入，不同的二维码可利用空间不同，可能有较大差异，但是可用通过一系列观测值推测其容量期望和水印内容大小的关系。例如6个汉字的“华东理工大学”生成的二维码水印容量为296bit，6个汉字的“信息科学技术”生成的二维码水印容量为315bit。

在常用汉字表中抽取880组含有6个汉字的组合进行生成容量的测算，其容量平均值为313.0057bit，方差273.1329，最大值379bit，最小值238bit，极差141bit，散点图如图9所示。相同情况下文献[8]的平均容量为192bit，文献[9]的容量为48bit。

图9 不同的6个汉字组合下水印容量散点图

Fig.9 The scatter plot of watermark capacity in different

combinations of 6 Chinese characters

4.3 基于PDF417二维码水印的APP实现

在安卓环境下，使用开源项目zxing的二维码框架用于生成普通的PDF417条码，开发了一款能够读取、生成PDF417码，根据本文算法添加读取水印的安卓APP程序。如图10所示，该程序基本完成了展示成果的功能。

(a)PDF417码生成器

(a)The generator for PDF417 code

(b)条码生成结果

(b)The result of barcode generation

(c)(b)中条码的扫描结果

(c)The result of scanning the bar code of (b)

图10 APP主要演示界面

Fig.10 The main presentation interface of APP

5 结论(Conclusion)

本文提出了以一种竖直方向上的微调条空的水印方法。该水印方法实现了预期性能指标，由于其为明隐藏，放大后可能会引起视觉上的明显异常。要消除此异常，可以使用暗隐藏，即将水印空间集中去除左右两排码字与本身相同的子集，但是会减少水印容量。此方法对设备分辨率和图像矫正结果要求较高，否则会导致结果出错。

参考文献(References)

[1] Thulasidharan P P,Nair M S.QR code based blind digital image watermarking with attack detection code[J].AEU-International Journal of Electronics and Communications,

2015,69(7):1074-1084.

[2] Lin P Y,Chen Y H.High payload secret hiding technology for QR codes[J].Eurasip Journal on Image & Video Processing,2017(1):14.

[3] Qin J H,et al.Anti-fake Digital Watermarking Algorithm Based on QR Codes and DWT[J].International Journal of Network Security,2016,18(6):1102-1108.

[4] 吴桐树.基于二维条码的数字水印技术研究[D].浙江理工大学,2015.

[5] 李智伟.基于小波变换域的双重数字水印算法研究[D].安徽理工大学,2016.

[6] 牛夏牧,等.基于二维条码的信息隐藏技术[J].中山大学学报(自然科学版),2004,43(s2):21-25.

[7] 张基宏,肖薇薇.基于二维条码PDF417的数字图像水印算法[J].深圳大学学报(理工版),2002,19(1):1-6.

[8] 赵博.二维条码研究[D].西安电子科技大学,2007.

[9] 何利军.基于信息隐藏技术的防伪系统研究与实现[D].华中科技大学,2008.

作者简介：

李永强(1995-)，男，本科生.研究领域：图像处理.

马雪娇(1995-)，女，本科生.研究领域：软件开发.

杨迈(1997-)，女，本科生.研究领域：软件开发.

王家峰(1995-)，男，本科生.研究领域：软件开发.

本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时删除处理。

上一篇: 一种异构设备接口数据集成采集方案的研究与实现下一篇: 基于USBKey应用的虚拟办公桌面技术应用研究

学术新闻相关资讯

学术不端查重入口

硕博初稿查重系统

检查语种：中文,英文,小语种预计时间：2小时-6小时

系统说明硕博初稿检测（一般习惯叫做硕博预审版），论文查重检测上千万篇中文文献，超百万篇各类独家文献，超百万港澳台地区学术文献过千万篇英文文献资源，数亿个中英文互联网资源是全国高校用来检测硕博论文的系统，检测范围广，数据来源真实，检测算法合理!本系统含有（学术库与源码库）。（限制字符数30万）

检查范围硕士、博士论文初稿【误差一般在3%左右，不支持真伪验证】

498.00元/篇

立即检测

维普论文检测系统

检查语种：中文,英文预计时间：60分钟

系统说明论文查重软件,维普论文检测系统：高校，杂志社指定系统，可检测期刊发表，大学生，硕博等论文。检测报告支持PDF、网页格式，性价比高！

检查范围毕业论文、期刊发表

4.00元/千字

立即检测

本科高校内部版系统

检查语种：中文,英文,小语种预计时间：2小时-6小时

系统说明比定稿版少大学生联合比对库，其他数据库一致。出结果快，价格相对低廉，不支持验证，适合在修改中期使用，定稿推荐PMLC。——不支持验证！！！

检查范围本/专科毕业论文,不支持验证

288.00元/篇

立即检测

本科定稿查重系统

检查语种：中文,英文,小语种预计时间：24小时-72小时

系统说明本科定稿查重版（一般习惯叫本科终评版），论文抄袭检测系统，专用于大学生专、本科等论文检测的系统，大多数专、本科院校使用此检测系统。（限制字符数6万）

检查范围本科论文检测【是提交学校前进行的一次摸底评估，基本一致】

388.00元/篇

立即检测

万方论文查重系统

检查语种：中文预计时间：60分钟

系统说明论文检测网站,万方数据平台推出的万方查重系统是目前较为热门的检测系统。究其原因，万方数据通过近年的发展，在高校中也确立了自己的相应地位，特别是部分高校直接将其视为毕业检测系统，其真实性和权威性无可厚非。其次，相对于知网而言，万方检测费用少，上手容易，是学生初次论文查重的推荐系统。

检查范围毕业论文、期刊发表

4.00元/千字

立即检测

PaperPass论文查重系统

检查语种：中文预计时间：60分钟

系统说明PaperPass检测系统是北京智齿数汇科技有限公司旗下产品，网站诞生于2007年，运营多年来，已经发展成为国内可信赖的中文原创性检查和预防剽窃的在线网站。系统采用自主研发的动态指纹越级扫描检测技术，该项技术检测速度快、精度高，市场反映良好。

检查范围学位论文和学术期刊

3.00元/千字

立即检测

职称评审论文查重系统

检查语种：中文,英文,小语种预计时间：3小时-72小时

系统说明职称评审论文检测系统针对编辑部来稿，已发表的文献，学校、事业单位职称论文的检测!大部分杂志社用的文献抄袭检测系统。可检测抄袭与剽窃、伪造、篡改、不当署名、一稿多投等学术不端文献，学术不端论文查重可供期刊编辑部检测来稿和已发表的文献,检测结果和杂志社一致,已发表过的文章检测时注意填写第一作者,才能排除已发表文献复制比。（限制字符数1万）

检查范围投稿/发表/职称评审

98.00元/篇

立即检测

格子达论文查重系统

检查语种：中文预计时间：60分钟

系统说明格子达依托学术期刊库收录了海量对比资源，其中包括中国论文库、中文学术期刊库、中国学位论文库等国内齐全的论文库以及数亿级网络资源，同时本地资源库以每月100万篇的速度增加，是目前中文文献资源涵盖全面的论文检测系统，可检测中文、英文两种语言的论文文本。

检查范围毕业论文、期刊发表

4.00元/千字

立即检测

PaperTime论文查重

检查语种：简体中文、英文预计时间：60分钟

系统说明PaperTime论文查重系统，拥有海量的对比数据库，总收录超过9000万的学术期刊和学位论文以及一个超过10亿数量的互联网网页数据库组成，保证了比对源的专业性和广泛性。采用多级指纹对比技术结合深度语义发掘识别比对，利用指纹索引快速而精准地在云检测服务部署的论文数据资源库中找到所有相似的片段，该项技术检测速度快、准确率高，市场反映良好。

检查范围毕业论文、期刊发表

2.00元/千字

立即检测

龙源期刊论文查重系统

检查语种：中文预计时间：80分钟

系统说明龙源期刊论文查重系统，自主研发高效稳定的计算服务，最快35S即可获得检测结果，大片段、长短句，不遗漏一处相似，区分论文中的正确引用参考文献。

检查范围期刊投稿、职称评审

4.00元/千字

立即检测