УДК 004.[056.5+932.2]
DOI: 10.15587/1729-4061.2022.251350
Аналіз точності виявлення стеганограм, сформованих згідно адаптивних стеганографічних методів, при використанні штучних нейронних мереж
Д. О. Прогонов, М. Б. Яриш
Робота присвячена порівняльному аналізу точності виявлення стеганог- рам, сформованих згідно адаптивних стеганографічних методів, при викорис- танні стегодетекторів на основі поширених та спеціалізованих типів штуч- них нейронних мереж. За результатами огляду сучасних згорткових нейронних мереж, які використовуються в задачах стегоаналізу цифрових зображень, встановлено, що точність роботи стегодетекторів на основі даних мереж суттєво знижується при обробці пакетів зображень, що характеризуються значною варіативністю статистичних параметрів.
Досліджено точність роботи стегодетекторів на основі сучасної стати- стичної моделі зображень-контейнерів maxSRMd2, а також новітніх згортко- вих та «гібридних» штучних нейронних мереж, зокрема мереж GB-Ras та AS- SAF, для виявлення стеганограм, сформованих згідно адаптивним стеганогра- фічним методам HUGO та MiPOD. Встановлено, що застосування статис- тичної моделі maxSRMd2 дозволяє суттєво (до 30 %) підвищити точність ви- явлення стеганограм у випадку аналізу зображень, що характеризуються висо- ким рівнем власних шумів. Виявлено, що використання мережі ASSAF дозволяє суттєво (до 35 %) зменшити помилку виявлення стеганограм у порівнянні з су- часними стегодетекторами на основі мережі GB-Ras та статистичної моделі maxSRMd2. Встановлено, що висока точність роботи стегодетектору на ос- нові мережі ASSAF зберігається навіть у найбільш складному випадку обробки зображень з високим рівнем шумів та слабкого заповнення зображення- контейнеру стегоданими (менше 10 %).
Отримані результати становлять теоретичний інтерес щодо розробки високоточних стегодетекторів, здатних працювати в умовах високої варіати- вності параметрів зображень.
Ключові слова: стегоаналіз, цифрові зображення, згорткові нейронні ме- режі, автоенкодери.
1. Введення
Забезпеченню надійного захисту критичної інформаційної інфраструктури (КІІ) приділяється особлива увага як державними установами, так і приватними організаціями. Елементи КІІ широко використовуються для отримання, оброб- ки, зберігання та передачі інформації з обмеженим доступом (ІзОД) як в лока- льних, так і глобальних обчислювальних мережах [1].
Однією з загроз безпеці ІзОД, що циркулює в обчислювальних мережах КІІ, є несанкціонована передача конфіденційних даних, зокрема з використан- ням стеганографічних систем зв’язку (ССЗ) [1]. Особливістю ССЗ є приховання
Not
a reprint
(вбудовування) повідомлень (стегоданих) до файлів-контейнерів, що циркулю- ють в мережі, та подальшої передачі модифікованих файлів (стеганограм). Це дозволяє долати існуючі системи протидії витоку ІзОД, а також формувати приховані канали обміну повідомленнями між зловмисниками при проведенні атак на КІІ організацій та установ [1, 2].
Значна кількість сучасних ССЗ заснована на використанні мультимедійних даних, зокрема – цифрових зображень (ЦЗ) в якості файлів-контейнерів [2].
Особлива увага зловмисників приділяється розробці адаптивних стеганографіч- них методів (АСМ), спрямованих на мінімізацію спотворень статистичних та спектральних параметрів зображень-контейнерів (ЗК) при вбудовуванні стего- даних. Це суттєво ускладнює виявлення сформованих стеганограм та потребує використання обчислювально складних методів статистичного стегоаналізу.
Для підвищення точності виявлення стеганограм, сформованих згідно АСМ, було запропоновано використовувати штучні нейронні мережі (ШНМ) [3]. Це дозволило дещо знизити обчислювальну складність налашту- вання стегодетектору (СД) у порівнянні зі статистичними методами стегоаналі- зу при збереженні фіксованої точності виявлення стеганограм. Тим не менше, вагомий вплив на точність роботи СД на основі ШНМ має наявність апріорних даних щодо використаного стеганографічного методу (проблема zero day), а та- кож варіативність статистичних та спектральних параметрів оброблюваних зо- бражень (проблема domain mismatch) [4]. Тому важливою та актуальною зада- чею є розробка високоточних методів стегоаналізу ЦЗ, здатних забезпечити ви- соку точність виявлення стеганограм навіть в умовах обмеженості апріорних даних щодо використаного стеганографічного методу (СМ) та значної варіації параметрів досліджуваних зображень.
Вирішення даної задачі потребує комплексного дослідження ефективності сучасних методів виявлення стеганограм. Незважаючи на значну кількість дос- ліджень щодо точності роботи СД, заснованих на застосуванні згорткових ней- ронних мереж, аналізу ефективності використання спеціалізованих типів ШНМ в літературі наразі приділено недостатньо уваги. Тому становить інтерес дослі- дження точності виявлення стеганограм, сформованих згідно АСМ, при вико- ристанні СД на основі як поширених, так і спеціалізованих типів ШНМ.
2. Аналіз літературних даних та постановка проблеми
Сучасні методи стеганографії дозволяють суттєво знизити рівень спотво- рень (демаскуючих ознак) зображення-контейнеру при прихованні повідомлень у порівнянні з поширеними стеганографічними методами, зокрема nsF5, JSteg, OutGuess, YASS [5, 6]. Це досягається за рахунок використання спеціальних методів мінімізації спотворень зображення-контейнеру при вбудовуванні сте- годаних [7, 8], зокрема адаптивних стеганографічних методів. Дані методи за- сновані на виявлення пікселів ЗК, зміни яскравості котрих не призводять до суттєвих спотворень статистичних параметрів контейнеру, та їх подальше ви- користання для приховання окремих стегобітів. Тому становить інтерес огляд особливостей новітніх АСМ, що мають негативний вплив на точність роботи сучасних стегодетекторів.
For reading
only
Значна кількість сучасних СМ для ЦЗ засновані на мінімізації функції оці- нки спотворень D(X, Y) зображення-контейнеру X при формуванні стеганогра- ми Y [7]:
,
ii
,
min, const,D X Y X Y M (1)
де ρi(·) – функція оцінки змін статистичних параметрів ЗК при вбудовуванні і- того стегобіту; |M| – розмір стегоданих (в бітах). Представлення процесу фор- мування стеганограм як вирішення оптимізаційної задачі (1) дозволяє адаптив- ним чином приховувати окремі стегобіти з врахуванням особливостей статис- тичних та спектральних параметрів ЗК.
В роботі розглянуті сучасні адаптивні стеганографічні методи HUGO [7] та MiPOD [8]. Дані методи засновані на прихованні повідомлень в просторовій області ЗК шляхом зміни значень яскравості окремих пікселів контейнеру. Сте- ганографічний метод HUGO заснований на вирішенні наступної оптимізаційної задачі при вбудовуванні стегоданих до ЗК [7]:
Y
mini D
D ,H M ,Y Y Y (2)
yY
log
,H y y (3)
де Yϵϒ – стеганограма Y з множини всіх можливих стеганограм ϒ; π – імовір- нісний розподіл щодо вибору стеганограми Y з множини стеганограм ϒ;
Eπ[D] – оператор усереднення значень функції D(X, Y) щодо розподілу π; H(π) – функція визначення ентропії розподілу π.
В роботі [7] показано, що оптимальним видом розподілу π для вирішення оптимізаційної задачі (3) є розподіл Гіббса:
exp
, y D y Z (4)
де Z
y Y exp
D y
– нормалізуюча константа. Значення скалярного па- раметру λ (λ>0) визначаються шляхом вирішення рівняння (4) [7]. За умови адити- вності функції D(·) (незалежності окремих спотворень ЗК при вбудовуванні окре- мих стегобіт), вираз (4) може бути представлений у наступному вигляді [7]:
exp .
exp
i i
t i it ity y y
y (5)
В якості функції ρi(·) в роботі [9] запропоновано використовувати локальні потенціали VC(·). Значення функції VC(·) залежить від ступеня кореляції значень яскравості суміжних пікселів зображення в заданому околі (кліці) C поточного
Not
a reprint
пікселю. Дана кореляція може бути оцінена з використанням матриці суміжно- сті Ck l,
X :,
, , 1Ck l X
i jxi j k I xi j lI, (6) де xi,j – значення яскравості пікселю ЗК з координатами (i,j).Розглянемо приклад обчислення матриці суміжності Ck l,
X (6) у випадку обробки ЗК по рядкам та скануванню пікселів зліва-направо [7]:
, , , , 1
1 , , ,
2
k l i j i j i j k l I
A X N M D D X
(7)
, , 1 ,
, 1 , , 1 ,
, ,
, .
i j i j i j
i j i j i j i j
k l
k l
D D X D X
D X D X X X
(8) Якщо значення яскравості пікселю ЗК при вбудовуванні окремого стегобі- ту змінюються на
1 , нормалізована матриця суміжності ,
Ak l X співпадає з відповідною матрицею ,
Ak l Y для сформованої стеганограми [7]:
,
, , C ,
k lk l k l c c
A Y A X H Y (9)
, , , 1
, , 1
, ,
1 ,
2 , ,
k l i j i j
I c
i j i j
I
k l
N M k l
D D Y H Y
D D X
(10)
для всіх можливих горизонтальних клік поточного пікселю
: , , , 1 , , 2
.
C c c i j i j i j Аналогічним чином можливо визначити матриці суміжності для інших клік C , а саме Ak l,
Y , ,
Ak l Y та Ak l,
Y .Тоді процедуру вбудовування стегоданих до ЗК згідно методу HUGO мож- ливо представити як вирішення наступної оптимізаційної задачі [7]:
cC k l, k l, ck l,
,D Y w H Y (11)
де C C= CC C – множина всіх можливих клік з трьох елементів;
wk,l>0 – ваговий фактор.
Альтернативний підхід до вибору функції D(X, Y) (1) заснований на пред- ставленні процесу формування стеганограм як вирішення задачі багатокритері-
For reading
only
альної оптимізації, а саме мінімізації як ступені спотворення ЗК стегоданими, так і імовірності виявлення стеганограм при використанні поширених типів статистичних СД [10]. Прикладом стеганографічних методів, заснованого на використанні даного підходу, є новітній метод MiPOD [8].
Приховання повідомлень згідно методу MiPOD проводиться в декілька етапів [8]. На першому етапі, проводиться обробка ЗК з використанням знешу- млюючого фільтру Fdn для зниження впливу ЗК:
, Fdn
r X X (12)
де зображення-контейнер X представлене шляхом «розгортки» по стовпцям.
Після цього проводиться оцінка дисперсії l2 значень отриманих лишків r з використанням методу максимальної правдоподібності:
,
l l l
r Ga (13)
де rl – відповідає значенням отриманих лишків r в околі l-того пікселю розмі- ром p×p елементів; Gp2p – матриця змішування параметрів моделі; apx1 – век- тор параметрів моделі; p21 – вектор шумів.
На другому етапі проводиться оцінка значення дисперсії 2l з використан- ням наступного виразу [8]:
2 2 2
,
l P rG l p q (14)
де PG Il G G G
T
1GT – оператор ортогональної проекції лишків rl на (p2–q) простір, створений власними векторами матриці G; Il×l – одинична матриця ро- зміром l×l елементів.На третьому етапі обчислюється імовірність βl використання l-того піксе- лю ЗК при вбудовуванні повідомлень. Для поширених типів статистичних СД, значення імовірності βl обирається таким, що мінімізує коефіцієнт розбіжності ς2 між розподілами ЗК та сформованих стеганограм:
2 2 4
2 1 ,
M Nl l l (15)за умови фіксованого об’єму приховуваного повідомлення:
1
,
M Nl lR H (16)
де H
l 2 l
1 2 l
log 1 l
– функція визначення тернарної ентропії; R – ступінь заповнення ЗК стегоданими.Not
a reprint
Оптимальні значення βl, що мінімізують значення виразу (15), можуть бути визначені з використанням методу множників Лагранжа для вирішення наступ- них (l+1) рівнянь:
4 1 1 2
ln ,
2
l l l
l
1;
,
l M N (17)
1
.
M Nl lR H (18)
Підставляючи отримані значення βl до функції ρ(·), отримуємо:
ln 1 2 .
l l (19)
На останньому етапі проводиться обробка повідомлення M з використан- ням трелліс-кодів та подальше вбудовування даних шляхом зміни яскравості пікселів ЗК. Вибір пікселів для приховання окремих стегобіт проводиться з врахуванням вагових коефіцієнтів (19) шляхом мінімізації загального рівня спотворень зображення-контейнеру.
Використання нормального розподілу для моделювання параметрів шумо- вих компонентів ЗК в методі MiPOD дозволяє враховувати нестаціонарність розподілу власних шумів реальних зображень при формуванні стеганограм. Та- кож це дає можливість отримати аналітичний вираз для оцінки імовірності ви- явлення сформованих стеганограм на основі значення параметру ς2 (15) [8].
Варто зазначити, що розглянуті методи HUGO та MiPOD характеризуються надзвичайно малими спотвореннями ЗК в процесі приховання повідомлень у по- рівнянні з поширеними типами СМ [8]. Внаслідок цього суттєво знижується ефективність використання сучасних СД на основі статистичних моделей зобра- ження-контейнеру, тому становить інтерес застосування новітніх ЗНМ для під- вищення точності виявлення стеганограм, сформованих згідно даних методів.
Сучасним підходом до побудови СД є визначення демаскуючих ознак сте- ганограм (параметрів ЗК, що найбільше змінюються внаслідок прихованням повідомлень) та подальшого їх використання для налаштування двокласового (бінарного) класифікатору. В якості демаскуючих ознак наразі широко викори- стовуються спектральні, статистичні та структурні параметри ЦЗ [11]. Класифі- кація ЦЗ з використанням отриманих векторів проводиться із застосуванням поширених типів бінарних класифікаторів, зокрема методу опорних векторів, ансамблевих класифікаторів тощо [12].
Прикладом СД, заснованих на використанні даного підходу, є стегодетекто- ри на основі КСМ, запропоновані в роботі [13]. Для аналізу змін ступені кореля- ції значень яскравості суміжних пікселів досліджуваного зображення, обумовле- них прихованням повідомлень, в даних СД використовується математичний апа- рат марківських ланцюгів. Це дозволило суттєво підвищити точність виявлення
For reading
only
стеганограм у порівнянні із сигнатурними стегодетекторами та проводити стего- аналіз в умовах обмеженості апріорних даних щодо використаного СМ.
Незважаючи на високу точність роботи СД на основі КСМ, обмеженням їх практичного застосування є висока обчислювальна складність. Це пов’язано з необхідністю використання значної кількості параметрів ЦЗ для забезпечення високої точності виявлення стеганограм (наприклад, 34671 параметрів для мо- делі maxSRM [10]). Для подолання даного обмеження були запропоновані під- ходи, засновані на зниженні розмірності векторів, зокрема з використанням пе- ретворення Карунена-Лоева [14, 15]. Це дало можливість зменшити розмірність використовуваних векторів при контрольованій втраті точності роботи СД.
Подальшим етапом розвитку СД стало впровадження методів попередньої обробки досліджуваних ЦЗ з метою підсилення слабких спотворень, обумовле- них прихованням повідомлень [16]. Прикладом даних методів є метод [5], за- пропонований для зниження рівня спотворень ЦЗ, обумовлених повторним JPEG-стисненням з втратами. Даний метод полягає в декомпресії зображення, відкидання (кадрування) перших чотирьох рядків та стовпчиків відновленого зображення та подальшого JPEG-стиснення з використанням вихідної таблиці квантування. Це дозволило суттєво знизити спотворення ЦЗ, обумовлені JPEG- стисненням з втратами, проте його ефективність зниження спотворень інших типів при використанні даного методу є невисокою.
Для подолання даного обмеження були запропоновані методи зниження впливу (придушення контексту) ЗК. Яскравим прикладом даного підходу є гру- па статистичних моделей SRM [17], що заснована на використанні ансамблю фільтрів високих частот (ФВЧ). Даний підхід дозволив суттєво підвищити точ- ність виявлення стеганограм у порівнянні з розглянутими СД та послугував поштовхом до розробки новітніх статистичних СД, зокрема PSRM [18], GFR [19] тощо. Проте обмеженням практичного застосування даного підходу є не- обхідність попереднього підбору ФВЧ для мінімізації помилки виявлення сте- ганограм, що потребує використання апріорних даних щодо СМ. Це суттєво ускладнює переналаштування (адаптацію) СД для виявлення новітніх АСМ, для яких апріорні дані щодо особливостей приховання повідомлень є обмеженими.
З метою подолання даного обмеження в роботі [3] було запропоновано ви- користовувати ШНМ. Застосування ШНМ при обробці зображення СД дозво- ляє об’єднати етапи попередньої обробки досліджуваного зображення та пода- льшого обчислення статистичних параметрів оброблених ЦЗ в рамках однієї нейронної мережі. Це дає можливість об’єднати складові частини (шари) ШНМ та проводити їх адаптацію в процесі навчання для мінімізації помилки виявлен- ня стеганограм. Налаштування ШНМ проводиться з використанням методу зворотного розповсюдження помилок (відмінностей між отримуваним та зада- ним вихідними значеннями) для корекції параметрів ШНМ в процесі її налаш- тування [20, 21].
Однією з перших ШНМ для задач стегоаналізу ЦЗ є модель SCAE (Stacked Convolutional Autoencoder), запропонована в роботі [3]. Особливістю даної ме- режі є використання ансамблю автокодувальних мереж (АКМ) для виявлення відмінностей між статистичними параметрами ЗК та стеганограм. Використан-
Not
a reprint
ня АКМ в моделі SCAE дозволило знизити обчислювальну складність налаш- тування СД, оскільки налаштування окремих АКМ може проводитися без необ- хідності залучення попередньо позначених (розмічених) пар зображень- контейнерів та стеганограм.
Модель SCAE [3] поклала початок для широкого класу методів стегоаналі- зу на основі ШНМ. Одним із перших стегодетекторів на основі ЗНМ є модель Qian-Net [22], запропонована для виявлення стеганограм з даними, вбудовани- ми в просторовій області ЦЗ. Дана нейронна мережа дала можливість досягти точності виявлення стеганограм, співставної з використанням СД на основі КСМ, при зниженні обчислювальної складності процедури налаштування. Це призвело до стрімкого зростання інтересу до застосування новітніх типів ЗНМ, зокрема багатошарових (глибоких) ЗНМ, в галузі стегоаналізу ЦЗ, а саме: появи моделей Xu-Net [23], Ye-Net [24], Yedroudj-Net [25], SR-Net [26] та Zhu-Net [27].
Сучасні стегодетектори на основі ШНМ дозволяють досягти точності ви- явлення стеганограм, що є співставною з випадком використанням стегодетек- торів на основі КСМ. Це досягається за рахунок наступних особливостей стего- детекторів на основі ШНМ:
– використання ансамблю ФВЧ для зниження впливу ЗК та підсилення спотворень, обумовлених прихованням повідомлень;
– застосування послідовності згорткових шарів (ЗШ) мережі;
– використання операції повторної вибірки (субдискретизації, англ.
pooling) для зниження розмірності отриманих векторів-ознак;
– класифікація оброблених ознак з використанням повнозв’язного шару штучних нейронів.
Однією з перших ШНМ, розроблених для використання в задачах стего- аналізу ЦЗ, є згорткова нейронна мережа Xu-Net [23]. Особливістю даної мере- жі є впровадження додаткових етапів обробки статистичних параметрів ЦЗ, зо- крема, використання абсолютних значень даних характеристик у функціях ак- тивації проміжних шарів ШНМ.
Суттєве підвищення точності виявлення стеганограм, сформованих згідно поширених СМ, при використанні моделі Xu-Net у порівнянні з поширеними СД послугувало поштовхом до подальших досліджень використання згортко- вих нейронних мереж в задачах стегоаналізу ЦЗ. В якості прикладу можливо навести згорткову нейронну мережу Yedroudj-Net [25]. Дана мережа заснована на використанні 30 фільтрів високих частот зі статистичної моделі SRM при проведенні попередньої обробки ЦЗ, а також нормування обчислених статисти- чних параметрів оброблених зображень на виході згорткових шарів мережі.
Тим не менше, мережа Yedroudj-Net не використовує методів оцінки імовірнос- тей змін пікселів ЗК в процесі приховання повідомлень згідно поширених СМ, що знижує точність виявлення стеганограм, сформованих з використанням но- вітніх СМ, заснованих на синхронізації змін яскравості пікселів ЗК [28].
Однією з перших «універсальних» ЗНМ для виявлення стеганограм з да- ними, вбудованими як в просторовій, так і спектральній областях ЗК, є нейрон- на мережа SR-Net [26]. Особливістю даної мережі є зменшення використання евристичних методів налаштування ЗШ, що були властивими для розглянутих
For reading
only
ЗНМ. Це досягається за рахунок ініціалізації згорткових шарів мережі з вико- ристанням ФВЧ з моделі SRM [17] та подальшого оновлення параметрів ЗШ за результатами налаштування ЗНМ. Даний підхід дозволив суттєво підвищити точність виявлення стеганограм, сформованих згідно низки новітніх СМ, у по- рівнянні з розглянутими СД. Тим не менше, дане підвищення точності було до- сягнуто за рахунок суттєвого ускладнення структури мережі, що призвело до значного зростання обчислювальної складності її налаштування.
Для подолання наведених обмежень мережі SR-Net, в роботі [29] було за- пропоновано новітню нейронну мережу Zhu-Net, засновану на використанні спеціалізованих функцій згортки (англ. Depthwise Separable Convolution, DSC).
Особливістю DSC-згортки є обробка ЦЗ в два етапи: застосування оператору згортки з заданими ФВЧ для обробки окремих каналів кольору ЦЗ та подальше об’єднання результатів згортки для пікселів, що мають однакові просторові ко- ординати. Додаткове підвищення точності виявлення стеганограм в мережі Zhu-Net досягається за рахунок обробки результатів DSC-згортки на декількох масштабах з використанням методу пірамідальної субдискретизації (англ.
spatial pyramid pooling, SPP) [30]. Дані особливості мережі Zhu-Net дозволили побудувати одні з найбільш ефективних сучасних СД.
Однією з перспективних ЗНМ для задач стегоаналізу цифрових зображень є мережа GBRAS-Net, запропонована в роботі [31]. Дана мережа спрямована на подальше вдосконалення згорткової Zhu-Net [32], зокрема зниження обчислю- вальної складності налаштування СД при збереженні фіксованої точності вияв- лення стеганограм. Це досягається за рахунок попереднього відбору ФВЧ для обробки досліджуваних зображень, а також методів зниження розмірності век- торів статистичних параметрів ЦЗ, зокрема використання шарів агрегації (англ.
Average Pooling) та нормалізації (англ. Batch Normalization) отриманих значень.
Для зниження негативного впливу зменшення сигналу коригування параметрів ЗНМ на точність роботи мережі, при налаштуванні GB-RAS використовуються прямі зв’язки між окремими шарами штучних нейронів.
За результатами огляду сучасних стегодетекторів на основі згорткових нейронних мереж можемо зробити висновок, що висока точність виявлення стеганограм при використанні даних СД досягається за рахунок комплексного використання спеціалізованих методів попередньої обробки ЦЗ, зокрема DSC- згортки, а також методів проекції отриманих статистичних ознак зображень до простору меншої розмірності. Це дає можливість суттєво зменшити помилку виявлення стеганограм у порівнянні з поширеними видами СД, зокрема засно- ваних на використанні статистичних моделей ЦЗ, при збереженні відносно ни- зької обчислювальної складності налаштування стегодетектору. Тим не менше, стегодетектори на основі ЗНМ характеризуються значною залежністю точності виявлення стеганограм від статистичних та спектральних параметрів досліджу- ваних зображень, що знижує ефективність роботи даних СД при застосуванні в реальних системах протидії витоку ІзОД. Тому становить інтерес використання спеціалізованих типів штучних нейронних мереж, зокрема «гібридних» мереж, в задачах стегоаналізу ЦЗ для подолання даних обмежень СД на основі ЗНМ.
Not
a reprint
Одним з прикладів сучасних «гібридних» ШНМ є мережа ASSAF [32]. Да- на мережа складається зі знешумлюючого автоенкодера (ЗАЕ) та дуальної (сі- амської) нейронної мережі. Застосування ЗАЕ дозволяє забезпечити високу то- чність оцінки статистичних параметрів ЗК без необхідності використання знач- ної кількості ЗШ для попередньої обробки досліджуваних зображень, що є ха- рактерним для СД на основі ЗНМ. Даний автоенкодер складається з мережі- кодера, за допомогою якого проводиться відображення векторів статистичних параметрів ЦЗ до простору меншої розмірності, та відповідної мережі-декодера, що проводить оцінку вихідного виду ЗК на основі отриманих характеристик зображення. Відмінністю ЗАЕ від поширених типів автокодувальних мереж є зміни в процедурі налаштування мережі – використання в якості вхідних даних
«зашумлених» зображень (стеганограм) та ЗК в якості «очікуваних» вихідних даних мережі. Друга частина мережі ASSAF, а саме дуальна нейронна мережа, складається з послідовності ЗШ для обчислення та порівняння статистичних ознак досліджуваного зображення та отриманої оцінки вихідного виду ЗК (ре- зультатів роботи ЗАЕ).
Незважаючи на появу новітніх типів ЗНМ для задач стегоаналізу ЦЗ, точ- ність роботи стегодетекторів на їх основі суттєво залежить від наявності апріо- рних даних щодо використаного стеганографічного методу та статистичних па- раметрів досліджуваних зображень [26, 27, 33]. Це обумовлює актуальність за- дачі розробки високоточних методів стегоаналізу ЦЗ, здатних забезпечити ви- соку точність виявлення стеганограм в умовах обмеженості апріорних даних щодо використаного стеганографічного методу та значної варіації параметрів досліджуваних зображень при збереженні відносно низької обчислювальної складності налаштування.
Для вирішення даної задачі було запропоновано низку методів, спрямова- них на використання попередньо налаштованих ЗНМ [33], ансамблю з декіль- кох штучних нейронних мереж [3, 34], спеціальних типів шарів штучних ней- ронів [30] тощо. Дані методи спрямовані на подолання лише окремих обмежень існуючих ЗНМ для задач стегоаналізу ЦЗ, зокрема підвищення точності роботи на нових пакетах зображень, зниження обчислювальної складності методів на- лаштування СД тощо. Тому становить інтерес дослідження ефективності вико- ристання спеціалізованих типів ШНМ при побудові стегодетектору, зокрема використання автокодувальних мереж [29]. Проте літературі відсутні відомості щодо порівняльного аналізу точності роботи СД, налаштованого з використан- ням поширених та спеціальних типів ШНМ. Це обумовлює актуальність задачі оцінки точності виявлення стеганограм, сформованих згідно новітніх АСМ, при використанні СД на основі поширених та спеціальних типів штучних нейрон- них мереж.
3. Мета та задачі дослідження
Метою дослідження є оцінка точності роботи стегодетекторів, заснованих на використанні поширених та спеціалізованих типів штучних нейронних ме- реж, для виявлення стеганограм, сформованих згідно новітніх адаптивних сте- ганографічних методів. Результати дослідження дозволять сформувати рекоме-
For reading
only
ндації щодо вибору архітектури ШНМ для підвищення точності роботи сучас- них стегодетекторів.
Для досягнення поставленої мети були вирішені наступні задачі:
– дослідити зміни точності виявлення стеганограм при використанні су- часних стегодетекторів на основі статистичних моделей зображень-контейнерів при обробці пакетів зображень, що характеризуються значною варіативність статистичних параметрів.
– провести порівняльний аналіз точності роботи стегодетекторів на основі згорткової нейронної мережі GB-RAS та «гібридної» мережі ASSAF для вияв- лення стеганограм, сформованих з використанням сучасних адаптивних стега- нографічних методів.
4. Матеріали та методи дослідження
Об’єктом дослідження є процес виявлення стеганограм при обробці, збері- ганні та передачі цифрових зображень в інформаційно-комунікаційних сис- темах. Предметом дослідження є штучні нейронні мережі, що використовують- ся при побудові сучасних СД для виявлення стеганограм, сформованих з вико- ристання адаптивних стеганографічних методів.
В роботі досліджується гіпотеза щодо ефективності застосування спеціа- льних типів ШНМ, зокрема «гібридних» нейронних мереж, при розробці СД для подолання обмежень сучасних стегодетекторів, а саме значної залежності точності виявлення стеганограм від статистичних та спектральних параметрів досліджуваних зображень.
При проведенні досліджень використовувалися методи теорії оптимізації для вирішення однокритеріальних оптимізаційних задач щодо мінімізації змін статистичних параметрів зображень-контейнерів при вбудовуванні повідомлень згідно адаптивних стеганографічних методів. Для дослідження ефективності використання ШНМ в задачах стегоаналізу ЦЗ використовувалися елементи теорії штучних нейронних мереж, зокрема методи побудови згорткових та спе- ціальних типів нейронних мереж. Аналіз статистичних параметрів досліджува- них зображень, зокрема ступінь кореляції значень яскравості суміжних пікселів зображень-контейнерів та стеганограм, проводився з використанням математи- чного апарату марківських ланцюгів. Налаштування та дослідження точності роботи стегодетекторів проводилося із застосуванням методів теорії розпізна- вання образів.
Побудова графіків залежності оцінок точності роботи стегодетекторів, за- снованих на використанні поширених та спеціалізованих типів штучних ней- ронних мереж, для виявлення стеганограм, сформованих згідно новітніх адап- тивних стеганографічних методів, проводилася в програмному комплексі MATLAB (США).
Аналіз ефективності використання стегодетекторів на основі розглянутих мереж GB-Ras [31] та ASSAF [32] проводився з використанням стеганограм, сфо- рмованих згідно адаптивних стеганографічних методів HUGO [7] та MiPOD [8].
Ступінь заповнення ЗК стегоданими варіювалася в наступних межах – від 3 % до 5 % з кроком 2 %, від 5 % до 10 % з кроком 5 %, від 10 % до 50 % з кроком 10 %.
Not
a reprint
Дослідження проводилося з використанням наступних тестових пакетів цифрових зображень:
– пакет ALASKA [35] – широко використовується для оцінки ефективності сучасних СД. Даний пакет складається з 80,000 зображень, отриманих з вико- ристанням 40 поширених моделей камер, включаючи смартфони, планшети та цифрові фотокамери;
– пакет VISION [36] – запропонований в галузі експертизи ЦЗ, зокрема оцін- ки параметрів власних шумів та ідентифікації джерела зображень (моделі викори- станої фотокамери). Даний пакет складається з 34,427 зображень та 1,914 відеоро- ликів з соціальних мереж Facebook, YouTube та Instagram, отриманих з викорис- танням 35 моделей мобільних пристроїв (смартфонів) Apple (США), Samsung (Південна Корея), Huawei (Китай), LG (Південна Корея), Sony (Японія) тощо.
Під час проведення досліджень, для кожного з тестових пакетів були псев- довипадковим чином сформовані вибірки з 10,000 зображень. Зображення були кадровані для забезпечення однакового розміру 512×512 пікселів. Зміна систе- ми кольору тестових зображень для представлення в градаціях сірого кольору була проведена з використанням стандартної функції "rgb2gray" з системи комп’ютерної математики MATLAB (США).
Тестування стегодетекторів проводилося згідно процедури перехресної пе- ревірки (англ. cross validation) при розбитті пакету тестових зображень на нача- льну (70 %) та контрольну (30 %) вибірки. Налаштування СД на основі мереж GB-RAS та ASSAF проводилося на вибірках ЗК та стеганограм, сформованих згідно стеганографічних методів HUGO та MiPOD, при варіації ступеня запов- нення ЗК стегоданими [9].
Згідно рекомендаціям [32], налаштування нейронної мережі ASSAF прово- дилося в декілька етапів. На першому етапі, пакет тестових зображень був псе- вдовипадковим чином розділений на три частини – 4,000 зображень для налаш- тування ЗАЕ, 4,000 зображень для налаштування дуальної нейронної мережі та 2,000 зображень використовувалися для оцінки точності налаштованої мережі.
На другому етапі проводилося налаштування ЗАЕ з використанням пар зобра- ження-контейнер та відповідні їм стеганограм, сформованих згідно стеганогра- фічних методів HUGO та MiPOD. Ступені заповнення ЗК стегоданими для обох методів були рівними 20 % та 40 %. На вхід ЗАЕ подавались сформовані стега- нограми, а відповідні їм ЗК виступали в якості очікуваних вихідних даних. По- рівняння зображень-контейнерів та зображень, отриманих за результатами ро- боти ЗАЕ, проводилося з використанням перехресної ентропії (англ. binary cross-entropy) та середньоквадратичного відхилення. На третьому етапі відбу- валося налаштування дуальної нейронної мережі з використанням зображень, попередньо оброблених із застосуванням налаштованого ЗАЕ.
Для порівняння був розглянутий випадок налаштування СД з використанням сучасної статистичної моделі maxSRMd2 [10]. Дана модель відноситься до групи статистичних моделей SRM [17], що заснована на попередній обробці ЦЗ з вико- ристанням набору ФВЧ для зниження впливу ЗК. Для оцінки ступеня кореляції значень яскравості суміжних пікселів ЦЗ в моделі maxSRMd2 використовується математичний апарат ланцюгів Маркова першого та другого порядків [10].
For reading
only
Для оцінки точності виявлення сформованих стеганограм при застосуванні СД використовувалася загальна похибка класифікації зображень PE [12]:
min1 ,
2
FA
E P FA MD FA
P P P P (20)
де PFA та PMD відповідають імовірностям похибки першого (класифікації зобра- ження-контейнеру як стеганограми) та другого (класифікації стеганограми як зображення-контейнеру) роду. Для отримання усереднених значень точності роботи СД, розбиття пакету ЦЗ на навчальну та контрольну вибірки проводи- лося псевдовипадковим чином 10 разів.
5. Дослідження точності виявлення стеганограм при використанні стегодетекторів на основі штучних нейронних мереж
5. 1. Результати дослідження точності виявлення стеганограм при ви- користанні статистичних стегодетекторів
Аналіз точності роботи стегодетектору на основі статистичної моделі maxSRMd2 проводився з використанням стеганограм, сформованих згідно сте- ганографічним методам HUGO [7] та MiPOD [8] при варіації ступеня заповнен- ня ЗК стегоданими.
Значення помилки класифікації стеганограм PE, сформованих згідно стега- нографічних методів HUGO та MiPOD, при використанні СД на основі статис- тичної моделі maxSRMd2, наведені в табл. 1.
Таблиця 1
Значення PE для стеганограм, сформованих згідно методу HUGO, при викорис- танні стегодетектору на основі моделі maxSRMd2
Метод вбу- довування
Пакет зо- бражень
Ступінь заповнення зображення-контейнеру сте- годаними, %
3 5 10 20 30 40 50
HUGO ALASKA 48.64 47.33 44.44 38.90 35.04 31.71 28.59 VISION 26.54 17.99 9.19 4.48 2.88 2.13 1.64 MiPOD ALASKA 49.13 48.39 45.84 41.03 36.52 32.80 29.50
VISION 22.67 14.79 7.31 3.66 2.49 1.90 1.43 Використання розглянутого стегодетектору дозволяє забезпечити високу точність виявлення стеганограм, сформованих згідно досліджених АСМ, в об- ласті середнього (до 20 %) та сильного (до 50 %) ступеня заповнення ЗК стего- даними при обробці зображень з пакету VISION (табл. 1). Зображення з даного пакету характеризуються високим рівнем власних шумів, що підвищує ефекти- вність використання ансамблю ФВЧ в статистичній моделі maxSRMd2 для де- тектування слабких змін ЗК, обумовлених прихованням повідомлень. З іншого боку, обробка високоякісних зображень з пакету ALASKA з використанням да- ної моделі призводить до суттєвого зростання помилки класифікації стеганог-