深度学习在图像取证领域中的进展

雷锋网(公众号:雷锋网)按:本文作者杨朋朋,就读于北京交通大学,信号与信息处理专业博士生二年级,导师倪蓉蓉教授。研究兴趣包括多媒体取证、隐写分析,深度学习。所在团队为教育部创新团队和科技部重点领域创新团队,负责人为赵耀教授。

图像取证

在当今飞速发展的信息时代,数字图像已经渗透到社会生活的每一个角落,数字图像的广泛使用也促进了数字图像编辑软件的开发与应用,例如:Adobe Photoshop、CorelDRAW、美图秀秀等等。利用这些编辑工具,用户可以随意对图像进行修改,从而达到更好的视觉效果。然而,在方便了用户的同时,也给一些不法分子以可乘之机。在未经授权的情况下,不法分子对图像内容进行非法操作,如违规编辑、合成虚假图像等,从而造成篡改图像在人们社会生活中泛滥成灾。图像取证技术就是在这样的背景下提出,旨在通过盲分析手段认证图像数据的原始性和真实性、鉴别和分析图像所经历的操作处理及估计图像的操作历史。

数字图像的完整周期包含三个部分:图像获取、图像编码、图像编辑,如图1所示。

深度学习在图像取证领域中的进展

图1. 数字图像的完整周期

图像获取过程中,真实场景中的光线通过相机镜头投射到相机传感器(如CCD或者CMOS传感器),产生数字图像信号。在投射到相机传感器之前,通常光首先经过CFA滤波处理,即每个像素点只会包含一种主要的颜色分量(红、绿、蓝)。在相机传感器之后会进行CFA差值(也称去马赛克处理),从而获取每个像素点的红绿蓝三通道分量。然后获取的数字图像信号会经历相机内部的软件处理,比如白平衡、对比度增强、图像锐化、伽马矫正等等。

图像编码部分,经过处理后的数字图像信号为了节省相机内存通常会经过有失真压缩处理,最常见的压缩方式为JPEG压缩。部分压缩后的数字图像为了获得更好的视觉效果会进行后处理操作,任何的图像编辑都可以应用在后处理操作,经常使用的编辑为:几何变换(旋转、缩放等)、模糊、锐化、对比度调整、图像拼接、复制-粘贴。经过编辑后的数字图像重新保存为JPEG格式形成最终的数字图像。

数字图像取证的出发点是通过提取数字图像周期中留下的固有痕迹进行分析和理解数字图像的操作历史。以上介绍的数字图像完整周期的三个部分,每一部分都会留下不同的操作痕迹(指纹特性),即获取指纹、编码指纹、编辑指纹。在图像获取指纹研究中,根据镜头特性、传感器特性、CFA模式等引入数字图像中的不同指纹特性对数字图像进行分析。在图像编码指纹研究中,JPEG压缩以及多重JPEG压缩检测是主要关注的问题。在图像编辑指纹特性研究中,基于信号处理和基于物理/几何的技术被提出。利用信号处理技术进行复制粘贴检测、重采样检测、对比度增强检测、线裁剪检测等,利用光线/阴影进行拼接检测以及利用几何关系的一致性检测拼接处理都是取证研究中的热点问题。

图像取证深度学习之风

不同于传统的图像取证算法,深度学习算法将特征提取和特征分类整合到一个网络结构中,实现了一种end-to-end的自动特征学习分类的有效算法。从当前的研究工作来看,深度学习应用于图像取证领域大致可分为三个层次。

第一个层次是简单的迁移,即直接将CV领域常用的CNN网络结构引入到图像取证领域。取证领域比较常用的网络结构为AlexNet,选择此网络结构的原因,是因为AlexNet网络结构相较于其他网络结构复杂度相对较低并且性能较好,对于解决数据集少的取证问题有更好的尝试性条件。典型案例为Luca Baroffio, Luca Bond等发表的文章“Camera Identification With Deep Convolutional Networks”, 文章提出用深度学习解决取证中的相机源辨别问题。

第二个层次是尝试对网络输入的修改,进行此种尝试的初衷是由取证问题和CV问题的本质区别所驱使。取证问题虽可归类于识别、分类、定位问题,但是对于分类问题的类间差别取证分类问题远小于CV分类问题。举个例子:ImageNet中的22000种类别之间的形态差异是较大的,比如猫和狗两个类别之间的差异人眼可辨别;然而对于取证问题,类别之间的形态差异是极其微小的,类间差别以微弱信号的形式存在;比如对于常见的双重JPEG压缩取证,需要解决的问题是区分一幅图像是经历过一次JPEG压缩之后的图像,还是经历过两次JPEG压缩之后的图像。在两次压缩使用的压缩因子(压缩因子小于等于90)一致的前提条件下,内容相同的两幅图像的DCT域统计类间差别小于0.4%(数据来源于Detecting Double JPEG Compression With the Same Quantization Matrix)。