УДК 004.81
DOI: 10.15587/1729-4061.2022.254122
Розробка методу підвищення оперативності оцінки стану об’єкту моніторингу в інформаційних системах спеціального призначення
О. Я. Сова, Г. Д. Радзівілов, А. В. Шишацький, П. С. Швець, В. А. Ткаченко, С. С. Невгад, О. В. Жук, С. І. Кравченко, Б. В. Молодецький, Г. Г. Мягких
Особливості сучасних воєнних конфліктів вимагають суттєво підвищу- ють вимоги з оперативності оцінки стану об’єкту. Саме тому, необхідно про- водити розробку алгоритмів (методів та методик) які здатні за обмежений час та з високим ступенем достовірності провести оцінку стану об’єкту мо- ніторингу від різнотипних джерел розвідувальних відомостей. Точний та об’єктивний аналіз об’єкту вимагає багатопараметричної оцінки зі значними обчислювальними витратами. Саме тому в дослідженні вирішені наступні за- вдання, а саме: проведено формалізацію оцінки обєктів моніторингу, розробле- но метод підвищення оперативності оцінювання стану обєктів моніторингу та проведено оцінку ефективності. Сутність запропонованого методу полягає в ієрархічній гібридизації бінарних класифікаторів та подальшому їх навчанні.
Метод має наступну послідовність дій: визначення ступеня невизначено- сті, побудова дерева класифікаторів, визначення належності до певного класу, визначення параметрів об’єкту, попередня обробка даних про об’єкт аналізу та ієрархічний обхід дерева.
Новизна методу полягає в врахуванні типу невизначеності та зашумлено- сті даних та врахуванні наявних обчислювальних ресурсів системи аналізу стану об’єкту. Новизна методу також полягає у використанні комбінованих процедур навчання (ліниве навчання та процедура навчання на для штучних нейронних мереж, що еволюціонують) та вибірковим задіянням ресурсів сис- теми за рахунок підключення тільки необхідних типів детекторів.
Метод дозволяє побудувати класифікатор верхнього рівня за допомогою різних низькорівневих схем їх комбінування та агрегуючих композицій. Викори- стання методу дозволяє досягти підвищення оперативності обробки даних на рівні 12–20 % за рахунок використання додаткових удосконалених процедур.
Ключові слова: інформаційні системи спеціального призначення, операти- вність обробки інформації, обчислювальні потужності.
1. Вступ
Зростання обсягів інформації, що циркулює в різноманітних системах збо- ру, обробки та передачі інформації призводить до значного використання обчи- слювальних ресурсів апаратних засобів. Збройні сили технічно розвинених кра- їн мають інтегровані архітектури прийняття рішень, що базується на:
− штучному інтелекті та нанотехнологіях;
− ефективній обробці великих масивів інформації;
Not
a reprint
− багатофункціональних процесорах зі здатністю підтримки прийняття рі- шень у реальному масштабі часу;
− технологіях стиснення даних для підвищення швидкості їх обробки.
При цьому використання інформаційних систем з елементами штучного інтелекту дозволить підвищити ефективність операцій (бойових дій), вплине на доктрину, організацію та способи застосування угруповань військ (сил).
Разом з тим підвищення динамічності операцій, зростання кількості різно- манітних сенсорів та необхідність інтеграції їх у єдиний інформаційний простір створює ряд проблем [1‒8]:
− реалізовані алгоритми встановлення кореляцій між подіями недостатньо повно враховують надійність джерел розвідувальних відомостей і достовірність інформації в динаміці бойових дій;
− форми представлення інформації ускладнюють її передачу по кана- лам зв’язку;
− обмежені обчислювальні потужності апаратних засобів;
− обмежена перепускна здатність каналів передачі даних;
− радіоелектронне подавлення каналів короткохвильового та ультракороко- роткохвильового зрадіозв’язку та кібернетичний вплив на інформаційні системи;
− збільшення кількості ознак, за якими відбувається оцінювання стану об’єктів моніторингу;
− різнотипність показників, за якими відбувається оцінювання стану об’єктів моніторингу;
− необхідність обробки великої кількості вхідних даних, за якими відбува- ється оцінювання стану об’єктів моніторингу;
− різнотипність джерел добування розвідувальних відомостей;
− перехід до принципу оцінки об’єктів моніторингу ―усе впливає на все й відразу‖, яке охоплює сукупні мережні та обчислювальні ресурси всіх видів збройних сил.
Саме тому, необхідно проводити розробку алгоритмів (методів та методик) які здатні за обмежений час та з високим ступенем достовірності провести оцінку стану об’єкту моніторингу від різнотипних джерел розвідувальних відомостей.
Враховуючи зазначене, актуальним науковим завданням є розробка ме- тоду оцінки стану об’єкту моніторингу в інформаційних системах спеціаль- ного призначення.
2. Аналіз літературних даних та постановка проблеми
В роботі [9] представлений алгоритм когнітивного моделювання. Визначено основні переваги когнітивних інструментів. До недоліків зазначеного підходу слід віднести відсутність врахування типу невизначеності про стан об’єкту аналізу.
В роботі [10] розкрито суть когнітивного моделювання та сценарного пла- нування. Запропонована система взаємодоповнюючих принципів побудови і реалізації сценаріїв, виділені різні підходи до побудови сценаріїв, описана про- цедура моделювання сценаріїв на основі нечітких когнітивних карт. Запропо- нований авторами підхід не дозволяє врахувати тип невизначеності про стан об’єкту аналізу та не враховує зашумленість початкових даних.
For
reading
only
В роботі [11] проведений аналіз основних підходів до когнітивного моде- лювання. Когнітивний аналіз і дозволяє: дослідити проблеми з нечіткими чин- никами і взаємозв’язками; враховувати зміни зовнішнього середовища та вико- ристовувати об’єктивно сформовані тенденції розвитку ситуації в своїх інте- ресах. Разом з тим, в зазначеній роботі не дослідженим залишається питання опису складних та динамічних процесів.
В роботі [12] представлено метод аналізу великих масивів даних. Зазначе- ний метод орієнтований на пошук скритої інформації в великих масивах даних.
Метод включає операції генерування аналітичних базових ліній, зменшення змінних, виявлення розріджених ознак та наведення правил. До недоліків за- значеного методу належить неможливість врахування різних стратегій оціню- вання рішень, відсутність врахування типу невизначеності вхідних даних.
В роботі [13] наведений механізм трансформації інформаційних моделей об’єктів будівництва до їх еквівалентних структурних моделей. Цей механізм при- значений для автоматизації необхідних операцій з перетворення, модифікації та доповнення під час такого обміну інформацією. До недоліків зазначеного підходу слід віднести неможливість оцінити адекватність та достовірність процесу транс- формації інформації, а також провести відповідну корекцію отриманих моделей.
В роботі [14] проведено розробку аналітичної web-платформи для дослі- дження географічного та часового розподілу інцидентів. Web-платформу, міс- тить декілька інформаційних панелей зі статистично значущими результатами за територіями. До недоліків зазначеної аналітичної платформи належить не- можливість оцінити адекватність та достовірність процесу трансформації інфо- рмації, а також висока обчислювальна складність. Також до недоліків зазначе- ного дослідження слід віднести не однонаправленість пошуку рішення.
В роботі [15] проведено розробку методу нечіткого ієрархічного оціню- вання якості обслуговування бібліотек. Зазначений метод дозволяє провести оцінювання якості бібліотек за множиною вхідних параметрів. До недоліків за- значеного методу слід віднести неможливість оцінити адекватність та достовір- ність оцінки та відповідно визначити похибку оцінювання.
В роботі [16] проведено аналіз 30 алгоритмів обробки великих масивів да- них. Показано їх переваги та недоліки. Встановлено, що аналіз великих масивів даних повинен проводитися пошарово, відбуватися в режимі реального часу та мати можливість до самонавчання. До недоліків зазначених методів слід відне- сти їх велику обчислювальну складність та неможливість провести перевірку адекватності отриманих оцінок.
В роботі [17] представлено підхід з оцінки вхідних даних для систем підт- римки та прийняття рішень. Сутність запропонованого підходу полягає в клас- теризації базового набору вхідних даних, їх аналізу, після чого на підставі ана- лізу відбувається навчання системи. Недоліками зазначеного підходу є посту- пове накопичення помилки оцінювання та навчання в зв’язку з відсутністю мо- жливості оцінки адекватності прийнятих рішень.
В роботі [18] представлено підхід щодо обробки даних з різних джерел ін- формації. Зазначений підхід дозволяє проводити обробку даних з різних дже-
Not
a reprint
рел. До недоліків зазначеного підходу слід віднести низьку точність отриманої оцінки та неможливість здійснити перевірку достовірності отриманої оцінки.
В роботі [19] проведений порівняльний аналіз існуючих технологій підт- римки прийняття рішень, а саме: метод аналізу ієрархій, нейронні мережі, тео- рія нечітких множин, генетичні алгоритми і нейро-нечітке моделювання. Вка- зані переваги і недоліки даних підходів. Визначено сфери їх застосування. По- казано, що метод аналізу ієрархій добре працює за умови повної початкової ін- формації, але в силу необхідності порівняння експертами альтернатив і вибору критеріїв оцінки має високу частку суб’єктивізму. Для задач прогнозування в умовах ризику і невизначеності обґрунтованим є використання теорії нечітких множин і нейронних мереж.
В роботі [20] розроблено метод структурно-цільового аналізу розвитку сла- боструктурованих систем. Підхід до дослідження конфліктних ситуацій, що ви- кликані протиріччями в інтересах суб'єктів, які впливають на розвиток досліджу- ваної системи і методи вирішення слабоструктурованих проблем на підставі фор- мування сценаріїв розвитку ситуації. При цьому проблема визначається як невід- повідність існуючого стану системи необхідному, яке задано суб'єктом управлін- ня. Разом з тим, до недоліків запропонованого методу слід віднести проблему ло- кального оптимуму та не можливість проведення паралельного пошуку.
В роботі [21] представлено когнітивний підхід до імітаційного моделюван- ня складних систем. Показано переваги зазначеного підходу, який дозволяє описати ієрархічні складі системи. До недоліків запропоновано підходу слід ві- днести відсутність врахування обчислювальних ресурсів системи.
Проведення аналізу праць [9–21] показав що спільними недоліками вище- зазначених досліджень є:
– не врахування впливу дестабілізуючих факторів, що впливають на ефек- тивність фунціонування інформаційних системах спеціального призначення;
– існуючи методи оцінки стану обєкту моніторингу призначені для інфор- маційних систем ціивільного призначення, що не дозволяє їх використовувати для систем спеціальльного призначення;
– різнотипність джерел добування інформації;
– відсутність можливості формування ієрархічної системи показників;
– відсутність врахування обчислювальних ресурсів системи;
– відсутність механізмів корегування системи показників в ході оцінювання;
– відсутність механізмів глибокого навчання баз знань;
– відсутність врахування обчислювальних ресурсів, доступних в системі.
З цією метою пропонується провести розробку методу підвищення опера- тивності оцінки в інформаційних системах спеціального призначення.
3. Мета і завдання дослідження
Метою дослідження є підвищення оперативності обробки даних в інфор- маційних системах спеціального призначення з заданою достовірністю.
Для досягнення мети були поставлені такі завдання:
– постановка завдання з оцінки стану об’єкту моніторингу в інформацій- них системах спеціального призначення;
For
reading
only
– розробка методу підвищення оперативності оцінки стану обєкту моніто- рингу в інофрмаційних системах спціального призначення;
– навести приклад застосування запропонованого методу при аналізі опе- ративної обстановки угрупованн5я військ (сил).
4. Матеріали та методи досліджень
В ході проведеного дослідження використовувалися загальні положення теорії штучного інтелекту – для вирішення задачі аналізу стану об’єктів в інте- лектуальних системах підтримки прийняття рішень. Тобто, теорія штучного ін- телекту є основою зазначеного дослідження. В дослідженні використано нечіт- кі когнітивні моделі, удосконалений генетичний алгоритм та штучні нейронні мережі, що еволюціонують. Моделювання проводилося з використанням про- грамного забезпечення MathCad 2014 (США) та ПЕОМ Intel Core i3 (США).
5. Результати дослідження з розробки методу оцінки стану об’єкту мо- ніторингу в інформаційних системах спеціального призначення
5. 1. Постановка завдання з оцінки стану обєкту моніторингу в інфор- маційних системах спеціального призначення
Нехай система управління процесом аналізу стану об’єктів представляєть- ся у вигляді знакового орієнтованого графа. Загалом завдання визначення стану об’єкту моніторингу зводиться до розрахунків відповідно до формули:
, 1
1 ,
N
i i j ij ij ij
j i j
A k f A k A k W
(1)де Ai(k+1) – новий стан вершини графа, Ai(k) – попередній стан графа, Wij – матриця ваги, f –порогова функція графу, i j – оператор, що враховує ступінь інформованості про стан об’єкту; ζij– оператор для врахування ступеню зашум- леності даних про стан об’єкту. Процес розрахунку є ітеративним – після за- вдання початкових станів вершин значення станів перераховуються до тих пір, поки різниця між поточними та попередніми станами не виявиться меншою за деяке задане значення.
Вираз (1) дозволяє сформувати опис стану обєкту моніторингу за допомо- гою його представлення його у вигляді графа. Граф будується для кожного окремого об’єкту. Зазначений опис є універсальним та дозволяє описати об’єкт аналізу з урахуванням ієрархічності та індивідуальної специфіки кожного об’єкту моніторингу. При записі виразу (1) в формі багатовимірного часового ряду, процес опису можна привести для динамічної системи. Вираз (1) при по- будові математичного опису стану об’єкту моніторингу враховує ступінь інфо- рмованості про стан об’єкту та зашумленість даних.
Not
a reprint
5. 2. Розробка методу підвищення оперативності оцінки в інтелектуа- льних системах підтримки прийняття рішень
Метод оцінки в інтелектуальних системах підтримки прийняття рішень складається з наступної послідовності дій (рис. 1).
Алгоритм реалізації запропонованого методу складається з наступної пос- лідовності дій.
1. Введення вихідних даних.
На даному етапі відбувається введення вихідних даних про стан об’єкту моніторингу. Визначається кількість джерел технічних засобів моніторингу, тип вихідних даних та їх обсяг.
2. Визначення ступеня невизначеності вихідних даних.
На даному етапі визначається ступінь невизначеності вихідних даних на підставі попередніх досліджень авторів. Ступінь невизначеності вихідних даних наступна: повна невизначеність; часткова невизначеність та повна обі- знаність [2, 23].
3. Побудова дерева класифікаторів.
Зазначений етап методу може бути охарактеризований як підготовчий, він містить у собі вибір:
– структури окремих бінарних класифікаторів (детекторів);
– розмірності та числа шарів,
– параметрів і алгоритмів навчання;
– типів функцій активації, функцій належності та ядерних функцій [24‒28].
Для кожного детектора складається набір навчальних правил. Задаючи різ- ну сукупність таких наборів правил, можна сформувати групу детекторів, кож- ний з яких побудовано на основі штучної нейронної мережі, що еволюціонує.
Детектори усередині кожної такої групи поєднуються в класифікатор на основі підходів один-до-усіх (one-vs-all), один-до-одного (one-vs-one) або їх різних по- хідних варіацій [28‒35].
У першому підході кожний детектор Fjk k : 0 ,1 k 1, ...,m навчаєть- ся на даних
1
, ,
M
l l
l
x c k
і функціонування групи детекторів Fj k k описується за допомогою принципу, що виключає:
1
0 , я к щ о 1, ..., 0 ,
1 , і н а к ш е .
i j k i
j m
i j k
k
k m F z
F z
k F z
(2)
У другому підході кожний з 2
1
1
m 2
m m
С
детекторів
0 1
k j k k
F навчається на множині об’єктів, що належать тільки двом класам з мітками k0 і
1 0 1
1 1
, , 0 ,1 ,
M M
l l l l
l l
k x c k x c k
0 k0 k1 m та функціонування групи детекторів Fj i задається за допомогою голосування max-wins:
For
reading
only
1
0 ,...,
1 0
a r g m a x 0 1 .
m c
i i i
j j c k j c k
c m
k c k
F F z F z
(3)
П О Ч А Т О К
В в е д е н н я п о - ч а т к о в и х д а н и х
( = {i} ) 1
К І Н Е Ц Ь О б р о б л е н н я н е в и з н а ч е н и х в и х ід н и х д а н и х 2
В и с н о в о к щ о д о с т а н у о б ’ є к т у 9
д о п? t t
6 К о р е г у в а н н я
п а р а м е т р ів к л а с и ф ік а т о р а 7
Н а в ч а н н я б а з з н а н ь 1 0
Т а к
Н і П о б у д о в а
д е р е в а к л а с и ф ік а т о р ів 3
В и з н а ч е н н я д о с т у п н и х
р е с у р с ів 4
В и з н а ч е н н я н а л е ж н о с т і
о б ’ є к т у 5
В и з н а ч е н н я п а р а м е т р ів
о б ’ є к т у 8
П о п е р е д н я о б р о б к а д а н и х 7
Рис. 1. Алгоритм реалізації методу аналізу стану об’єкту
Not
a reprint
4. Визначення доступних апаратних обчислювальних ресурсів.
На даному етапі визначаються доступні апаратні обчислювальні ресурси мережі. На підставі чого визначаються можливі варіанти класифікації: бінарне класифікаційне дерево, генетичний алгоритм, нечіткі когнітивні моделі та аци- клічний граф.
У табл. 1 наведені характеристики розглянутих схем об’єднання детекторів у багатокласову модель, призначену для співвіднесення вхідного об’єкта однієї або декільком з (m+1) міток класів.
Таблиця 1
Характеристики схем об’єднання детекторів Схема об’єднання Число дете-
кторів, що підлягає на-
вчанню
Мінімальне число детекторів, задіяних
при класифікації об’єктів
Максимальне число детекторів, задіяних
при класифікації об’єктів
один-до-усіх m m m
один-до-одного 1
2
m m 1
2
m m 1
2 m m
Класифікаційне бі- нарне дерево
m 1 m
Спрямований аци-
клічний граф 1
2
m m m m
Нечітка когнітивна модель
(m*x) *m (m*x) (m*x) *m
Генетичний алго- ритм
(m*x) m (m*x)
5. Визначення належності об’єкту моніторингу до певного класу
У якості однієї з похідних варіацій попередніх підходів для комбінування детекторів може бути згадане класифікаційне бінарне дерево [25]. Формально така структура задається рекурсивно в такий спосіб:
, , , я к щ о # 2 ,
, я к щ о # 1 .
i
jL R L R
F C B T C B T
C B T
(4)
де μ={0,…,m} − вихідний набір міток класів, L − довільно згенерована або визначене підмножина;
#L #
, Rμ=μ\Lμ − ліве класифікаційне піддерево,C B TR
− праве класифікаційне піддерево, Fj L R i
− вузловий детектор, навчений
на елементах множини
1 1
, 0 ,1 .
M M
l l l l
l l
x c L x c R
For
reading
only
Вихідний результат детектора настроюється таким чином, щоб він дорів- нював 0, якщо вхідний об’єкт xl належить класу з міткою cl L, і 1, якщо об’єкт xl належить класу з міткою cl L.
Тому функціонування групи детекторів Fj i , представлених у вигляді ву- злів такого дерева, описується за допомогою рекурсивної функції ji , що задає послідовну дихотомію множини μ:
i i , ,
j j
F z
, я к щ о # = 1 ,
, , я к щ о # 2 0 ,
, я к щ о # 2 1 .
i i i
j j jL R
i i
j jL R
z L z F z
R z F z
(5)
Застосування функції ji до вихідного набору міток класів і об’єкту мо- ніторингу дозволяє здійснювати однозначний пошук мітки класу цього об’єкту.
Це пояснюється тим, що оскільки під час спуску вниз по класифікаційному де- реву відбувається диз’юнктивне розбиття множини міток класів. Після досяг- нення та спрацьовування термінального детектора залишається тільки одна мо- жлива мітка для класифікації вхідного об’єкта z у якості вихідного результату
i .
Fj Тому для класифікаційного дерева неможливі конфліктні випадки при кла- сифікації об’єктів, які можуть мати місце для двох інших підходів комбінуван- ня.
Іншим підходом є спрямований ациклічний граф, який організує
2 1
1
m 2
m m
C
детекторів у зв’язну динамічну структуру, яка може бути за- дана наступною формулою:
0 1 \ 0 \ 1
0 1
, , ,
я к щ о # 2 , д е , ,
, я к щ о # 1 .
i
j k k k k
F D A G D A G
D A G k k
(6)
Тут, як і в підході один-до-одного, кожний вузловий детектор
0 1
i j k k
F навча- ється на елементах
0
1
0 11 1
, 0 ,1 .
M M
l l l l
l l
x c k x c k k k
Обхід розгляну-
того графа виконується за допомогою рекурсивної функції ji , що задає заеле- ментне „відщіплення― від множини μ:
Not
a reprint
i i , ,
j j
F z
0 1
0 1
1
0
, я к щ о # 1,
\ , ,
, я к щ о # 2 0 ,
\ , ,
я к щ о # 2 1 .
i j
i i
j j k k
i j
i j k k
k z
z F z
k z
F z
(7)
Якщо детектор
0 1
i j k k
F голосує за k0-ий клас для об’єкта z, тобто
0 1 0 ,
i j k k
F z то з множини μ видаляється мітка k1 як свідомо невірна, а якщо ні, то виключається мітка k0. Процес повторюється доти, поки множина μ не виро- джується в одноелементне.
З розглянутих шести схем тільки одна, а саме класифікаційне бінарне де- рево, має змінне число детекторів, які можуть використовуватися в процесі класифікації об’єктів.
Мінімальне значення досягається, коли активується детектор Fj L R i ,
роз- ташований у корені дерева та навчений для розпізнавання тільки одного класу об’єктів серед усіх інших, і FjL R i z 0
FjL R i z 1
тобто коли #Lμ=1(#R=1).Максимальне значення досягається, коли дерево представляється послідовним списком і активується найбільш вилучений у ньому детектор.
У випадку збалансованого дерева цей показник може становити величину
lo g2 m 1
або lo g2m 1. Кожний класифікатор F(i)(i=1,…,P) містить qi
груп Fj i j 1, ...,qi, кожна з яких поєднує m детекторів Fjk i k 1, ...,m за до- помогою підходу один-до-усіх. Кожна із груп детекторів Fj i навчається на різ- них випадкових вибірках, які можуть включати повторювані та переупорядко- вані елементи з вихідного навчального набору L S.
c
Об'єднання груп Fj i у класифікатор F(i) здійснюється на основі гібридного правила, що представляє собою суміш голосування більшістю й голосування max-wins:
1
0 ,...,
0
1 2
. m a x
i
i
q m
i
j i
i j
c
i i
c m
c
c c F z q
F z
c c
(8)
For
reading
only
В даній формулі за рахунок вимоги 1
i c 2 qi
класифікатор F(i) стає не- здатним вирішувати конфлікти, які виникають за умови
0 ,...,
0
1
# m a x 2
2
m
i i i i
c m
c
c c q c c
(у цьому випадку виходом кла-
сифікатора є порожня множина Ø).
У процесі роботи інтерпретатора перевіряється коректність оброблюваних даних і ініціалізуються поля об’єктів усередині дерева класифікаторів. За раху- нок використання такої структури в рамках запропонованого методу стає мож- ливим будувати багаторівневі схеми.
Даний метод має розподілену архітектуру, у яких збір даних здійснюється вторинними вузлами-сенсорами (технічними засобами розвідки), а вся обробка агрегованих потоків даних виконується на централізованому сервері.
6. Визначення параметрів об’єкту відповідного класу.
Зазначений етап методу, виконуваний на стороні сенсорів (технічних засо- бів розвідки), полягає в складанні необроблених розвідувальних відомостей у класифікаційні блоки, виділенні їх параметрів і виконанні аналізу з викорис- танням декількох паралельних алгоритмів шаблонового пошуку.
Суть процедури полягає в розбивці заданого часового інтервалу
0L 0 ,L
довжиною L, протягом якого проводиться безперервне спостере- ження за рядом параметрів, на трохи більш дрібних інтервалів
0L , L , ..., L 1 k
однакової довжини 0<L'≤L, початок кожного з яких має зсув
0 L відносно початку попереднього інтервалу. Причому ki01L i 0L й
0 0
k L L
i i
тому 1 L L . k
Протягом проміжків часу 0L , ..., Lk1 від- бувається фіксація значень ω0,…, ωk-1 параметрів, і їх середня величина (інтен- сивність) та у рамках часового вікна довжини L' розраховується по формулі
1
0
1
.
k i
k i
У дослідженні використовувався інтервал зі значенням параметра L, рів- ним п’яти секундам. Довжина інтервалу, що L' згладжує, була обрана рівній од- нієї секунді. Зсув δ був установлений у півсекунди. подібний підхід дозволяє усунути рідкі по частоті й випадкові мережні сплески й тим самим знизити чи- сло неправильних спрацьовувань.
7. Попередня обробка даних про об’єкт аналізу.
Перед безпосереднім навчанням детекторів виконується попередня оброб- ка даних параметрів для зменшення ефекту їх сильної мінливості.
Багато методів, включаючи нейронні мережі та метод головних компонен- тів, чутливі до такого роду флуктуаціям і вимагають, щоб усі ознаки оброблю- ваних векторів мали однаковий масштаб.
7. 1. Нормалізація компонентів вектору.
Not
a reprint
Перший крок попередньої обробки кожного компонента xij вектору
1 M
i k k
x x
включає його нормалізацію за допомогою функції
m in
m a x m in
ij j
il
j j
x x
f x
x x
(у випадку xjm a x xjm in можна вважатися f
xi j 0 ), деm i n
1
m i n
j i j
i M
x x
та m a x
1
m a x .
j i j
i M
x x
7. 2. Мінімізація простору ознак.
Зменшення числа значимих ознак, яке досягається за допомогою методу головних компонентів [26‒30], описуваного як послідовність наступних кроків.
7. 2. 1. Обчислення математичного очікування випадкового вектору, пред- ставленого в цьому випадку у вигляді елементів набору навчальних даних:
1
1
:
n M
i ij
j i
x x
1
1 1
1 1
, ..., .
M M T
i in
i i
x x x
M M
(9) 7. 2. 2. Формування елементів незміщеної теоретичної коваріаційної матриці:
1 ,..., 1 ,...,i n :
ij
j n
1
1
. 1
M
ij k i i k j j
k
x x x x
M
(10)7. 2. 3. Знаходження власних чисел i in1 і власних векторів vi in1
матриці Σяк корінь рівнянь (із цією метою використовувався метод обертань Якобі):
d e t 0 ,
0 , v
I
I (11)
де I — одинична матриця розміром nxn.
7. 2. 4. Ранжування власних чисел i ni1 у порядку їх убування й відповід- них їм власних векторів
1:
n i i
v
1 2 ... n 0 .
(12)