• No results found

Москаленко 2019 Рукопис завершено 10 грудня 2019 р

N/A
N/A
Protected

Academic year: 2022

Share "Москаленко 2019 Рукопис завершено 10 грудня 2019 р"

Copied!
67
0
0

Повний текст

(1)

УКПП

№ держреєстрації 0117U003934 Інв. №

Міністерство освіти та науки України Сумський державний університет

(СумДУ)

40007, м. Суми, вул. Римського-Корсакова, 2 тел. (0542) 33-54-79 факс (0542) 33-54-79

ЗАТВЕРДЖУЮ

Проректор з наукової роботи д-р. фіз.-мат. наук, професор __________А.М. Чорноус ЗВІТ

ПРО НАУКОВО-ДОСЛІДНУ РОБОТУ

Інтелектуальна автономна бортова система безпілотного літального апарату для ідентифікації об'єктів на місцевості

РОЗРОБКА ІНФОРМАЦІЙНОГО ТА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ БОРТОВОЇ СИСТЕМИ БЕЗПІЛОТНОГО АПАРАТУ, ЩО ФУНКЦІОНУЄ В РЕЖИМІ НАВЧАННЯ ВИРІШУВАЛЬНИХ

ПРАВИЛ ТА КЛАСИФІКАЦІЙНОГО АНАЛІЗУ СПОСТЕРЕЖЕНЬ (проміжний)

Керівник НДР

доцент, канд. техн. наук В.В. Москаленко

2019

Рукопис завершено 10 грудня 2019 р.

Результати цієї роботи розглянуто на засіданні наукової ради СумДУ, протокол від 26.11.2019 № 4

(2)

СПИСОК АВТОРІВ

Керівник НДР, канд. техн. наук,

провідн. наук. співроб.

(10.12.2019)

Москаленко В. В. (вступ, висновки, підрозділи 1.1-1.3)

Відповідальний виконавець канд. техн. наук,

старш. наук. співроб.

(10.12.2019)

Москаленко А. С. (підрозділ 1.3, 2.2)

Виконавці:

канд. техн. наук, старш. наук. співроб.

(10.12.2019)

Берест О. Б. (підрозділ 2.3)

канд. техн. наук, старш. наук. співроб.

(10.12.2019)

Мартиненко С. С. (підрозділ 1.3)

канд. фіз.-мат. наук, старш. наук. співроб.

(10.12.2019)

Журба В. О. (підрозділ 2.2)

канд. техн. наук, старш. наук. співроб.

(10.12.2019)

Нагорний В. В. (підрозділ 2.3)

(3)

мол. наук. співроб.

(10.12.2019)

Окопний Р. П. (підрозділ 2.3)

мол. наук. співроб.

(10.12.2019)

Коробов А. Г. (підрозділ 2.1)

аспірант,

мол. наук. співроб.

(10.12.2019)

Зарецький М. О. (підрозділ 2.3)

(4)

РЕФЕРАТ Звіт про НДР: 67 с., 1 табл., 31 рис., 20 джерел.

БОРТОВА СИСТЕМА БЕЗПІЛОТНОГО ЛІТАЛЬНОГО АПАРАТУ, ЕКСТРАКТОР ОЗНАК, ВИРІШУВАЛЬНІ ПРАВИЛА, ІНФОРМАЦІЙНО- ЕКСТРЕМАЛЬНА ІНТЕЛЕКТУАЛЬНА ТЕХНОЛОГІЯ, МАШИННЕ НАВЧАННЯ, ОПТИМІЗАЦІЯ.

Об’єкт дослідження – процес машинного навчання бортової системи безпілотного апарату та автономної ідентифікації об’єктів на місцевості.

Мета роботи – підвищення функціональної ефективності бортової системи безпілотного літального апарату, що здійснює у автономному режимі локальну навігацію та класифікаційний аналіз спостережень за умов ресурсних та інформаційних обмежень.

Методи дослідження – аналіз літературних джерел, методи розрідженого кодування, методи нейромережевого та інформаційно- екстремального моделювання.

Розроблено діаграми процесів навчання вирішувальних правил та класифікаційного аналізу даних, алгоритми та програми для локалізації і трекінгу об’єктів в полі зору безпілотного пристрою та оптимізації параметрів моделі аналізу даних. Здійснено імітаційне моделювання на відкритих наборах даних. Виконано алгоритмічну і програмну реалізацію детектора рухомих об’єктів на спостереженнях з рухомої камери. При цьому запропонована інкрементальна схема навчання вирішувальних правил.

Реалізовано схему активного навчання.

Результати виконання роботи впроваджено в навчальний процес під час підготовки лекційних курсів з навчальних дисциплін «Інтелектуальні системи керування» і «Introduction to Data Science» та під час написання п’яти магістерських робіт. Також отриманий досвід використано для надання послуг, пов’язаних з впровадженням проекту “Minect.ai” в рамках госпдоговірної теми № 09-13 від 07.08.19 на суму 255,00 тис.грн. / 110 000,00 тис. грн.

(5)

ЗМІСТ

СКОРОЧЕННЯ ТА УМОВНІ ПОЗНАКИ ... 6

ВСТУП ... 7

1 МОДЕЛІ І МЕТОДИ НАВЧАННЯ БОРТОВОЇ СИСТЕМИ БЕЗПІЛОТНОГО АПАРАТУ ... 9

1.1 Моделі і методи навчання екстрактора ознак ... 9

1.2 Моделі і методи побудови вирішувальних правил ... 17

2 РЕАЛІЗАЦІЯ ІНФОРМАЦІЙНОЇ ТЕХНОЛОГІЇ АНАЛІЗУ ДАНИХ БОРТОВОЇ СИСТЕМИ БЕЗПІЛОТНОГО АПАРАТУ ... 40

2.1 Апаратно-програмне забезпечення бортової системи безпілотного апарату ... 40

2.2 Діаграми процесу навчання та екзамену бортової системи безпілотного апарату ... 49

2.3 Алгоритми функціонування бортової системи в режимі класифікаційного аналізу рухомих об’єктів ... 56

2.4 Результати фізичного моделювання ... 59

ВИСНОВКИ ... 63

ПЕРЕЛІК ДЖЕРЕЛ ПОСИЛАННЯ ... 65

(6)

СКОРОЧЕННЯ ТА УМОВНІ ПОЗНАКИ

БЛА – безпілотний літальний апарат;

ІЕІ – технологія – інформаційно-екстремальна інтелектуальна технологія;

КФЕ – критерій функціональної ефективності;

СКД – система контрольних допусків.

(7)

ВСТУП

Малогабаритні безпілотні апарати часто використовуються у задачах моніторингу території та об’єктів. При цьому безпілотний апарат часто розглядається як мобільний сенсор збору даних для їх подальшої обробки в хмарному сервісі. Однак існує тенденція до розвитку крайових обчислень з метою розвантаження комунікаційних каналів інфокомунікаційного середовища і захисту інформації. Тому багато сучасних розробок пов’язані з розширенням функціональних можливостей та підвищенням рівня автономності безпілотних апаратів. До затребуваних функціональних можливостей безпілотних апаратів відносяться пошук і класифікація об’єктів інтересу та автономна навігація.

Алгоритми детектування об’єктів інтересу і їх класифікаційний аналіз можуть бути корисними в таких практичних задачах, як відео-аналітика систем рятувально-пошукових заходів, охорони периметру, прицілювання і наведення зброї. Автономна навігація може значно полегшити задачу керування безпілотним апаратом під час польоту поруч із будівлями, деревами або в приміщенні.

Використання візуальних сенсорів в задачах автономної навігації та розпізнавання об’єктів на місцевості є перспективним підходом з точки зору інформативності, ваги та ціни. За допомогою відео камери можна одночасно здійснювати оцінку переміщення та отримувати інформацію про зовнішнє середовище. При цьому для прискорення режиму екзамену в системах інтелектуального аналізу візуальних образів розроблено різноманітні апаратні прискорювачі на основі графічних обчислювальних пристроїв та нейропроцесорів. Однак процес навчання таких моделей є досить ресурсомістким, що ускладнює їх удосконалення в автономному режимі. Це обумовлює актуальність розробки моделей і методів навчання системи інтелектуального аналізу візуальних образів для адаптації до нових задач і середовища функціонування за умов ресурсних та інформаційних обмежень.

Розробка, що пропонується, може бути корисною з точки зору зменшення накладних витрат на експлуатацію та переконфігурування безпілотного апарату

(8)

до нових умов і задач функціонування. Тобто розробка спрямована на забезпечення ефективного функціонування і зниження вимог до обсягу розмічених навчальних даних та обчислювальних ресурсів за рахунок використання нових моделей і методів навчання. Це дозволить підвищити конкурентоздатність розроблених рішень на ринку безпілотної авіації.

Проміжний звіт складається із вступу, двох розділів, висновків і переліку посилань.

Перший розділ присвячено розробці моделей і методів навчання екстрактора ознакового опису та вирішувальних правил. Розглянуто поєднання принципів розділення пояснюючих факторів та переносу знань для побудови інформативного ознакового опису спостережень за умов обмеженого обсягу розмічених навчальних даних. Також у розділі запропоновано інкрементальні алгоритми синтезу завадозахищених вирішувальних правил.

Другий розділ присвячено реалізації інформаційної технології інтелектуального аналізу візуальних даних бортової системи безпілотного апарату. Виконано опис процесів функціонування бортової системи в режимі навчання і екзамену у вигляді діаграм відображення множин та діаграм стандарту IDEF3. Розглянуто апаратно-програмне забезпечення бортової системи.

Запропоновано поєднання алгоритмів детектора і трекера рухомих об’єктів з техніками активного навчання та самонавчання для зниження трудомісткості розмітки даних та забезпечення інтерактивності машинного навчання.

Результати наукових досліджень, одержаних виконавцями проекту, опубліковано в працях [1]–[10].

(9)

1 МОДЕЛІ І МЕТОДИ НАВЧАННЯ БОРТОВОЇ СИСТЕМИ БЕЗПІЛОТНОГО АПАРАТУ

1.1 Моделі і методи навчання екстрактора ознак

Формування ознакового опису спостережень за умов ресурсних та інформаційних обмежень варто здійснювати на основі принципів, що дозволяють утилізувати всю доступну інформацію як з розміченої і нерозміченої навчальних вибірок, так і з зовнішніх джерел. Вибіркові дані і без розмітки містять багато інформації про їх структуру, яку можна виділити на основі моделей розділення пояснюючих факторів (disentangle explanatory factors). Моделі розділення пояснюючих факторів як правило будують на основі автокодувальників, машин Больцмана, алгоритмів розрідженого кодування та генеративних моделей. Крім цього навчені моделі для аналізу образів в схожих задачах є зовнішніми джерелами, що акумулюють у собі досвід, який можна використати для поточної задачі. Саме в цьому полягає принцип переносу знань (Transfer Learning), згідно якого вагові коефіцієнти навчених мереж можна запозичити як квазіоптимальну стартову точку пошуку для нової задачі. Узагальнену структуру екстрактора ознак, побудованого на таких принципах показано на рис. 1.1.

Серед моделей розділення пояснюючих факторів заслуговують на увагу ті, що основані на ідеях і методах розрідженого кодування. Покладений в їх основу ефект редукції причини (explaining away) дозволяє виявити приховані фактори (першопричини) і забезпечити інформативне і завадозахищене ознакове подання вибіркових спостережень навіть за умов обмеженого обсягу даних.

Для підвищення рівня абстрактності пояснюючих факторів екстрактор ознак може містити декілька шарів розрідженого кодування. Реалізація кодера може бути виконана на основі алгоритмів узгодженого переслідування (matching pursuit), ортогонального узгодженого переслідування (оrthogonal matching pursuit), мішка переслідувачів (bag of pursuits) чи інших. При цьому для прискорення моделі в режимі екзамену можна обчислювально складний етап оптимізації для пошуку розріджених коефіцієнтів замінити апроксимуючим кодером.

(10)

Екстрактор ознак 1 Екстрактор

ознак 2 Вхідні

дані

Конка- тенація ознако-

вого опису Параметри сформовані шляхом навчання без вчителя для розділення

пояснюючих факторів

Параметри згідно техніки переносу знань

Корекція параметрів згідно алгоритму тонкої настройки

Результуючий ознаковий опис

Рисунок 1.1 – Узагальнена структура екстрактора ознак

Навчальна вибірка апроксимуючого кодера формуватиметься як з вхідних даних, що кодуються, так і з результуючого розрідженого коду. На рис. 1.2 показано схему синтезу екстрактора ознак з використанням ідей і методів розрідженого кодування.

Кодер

Вхідні дані

Навчений словник атомів

1-го рівня

Дані, закодовані

ознаками 1-го рівня

Кодер Навчений словник атомів

2-го рівня

Дані, закодовані

ознаками 2-го рівня ...

Апроксимація кодера (наприклад, на основі алгоритму випадкового лісу)

Кодер (формувач розрідженого коду) x

y

y~

Навчений словник атомів

а б

Рисунок 1.2 – Схема побудови екстрактора ознак на основі розрідженого кодування : а – послідовність обробки даних в багатошаровому екстракторі;

б – схема навчання апроксимованого кодера

Для розрідженого кодування використовується навчений словник атомів.

Атоми мають розмірність таку ж як і будь-яке вхідне спостереження х і їх, у

(11)

найпростішому випадку, можна сформувати шляхом кластер-аналізу чи векторного квантування спостережень. В більш складному випадку навчання може здійснюватися за схемою з кінця-в-кінець і навіть з частковим залученням учителя.

Перспективним підходом до реалізації навчання словника атомів без вчителя є використання принципів нейронного газу та правила Ойа, що реалізовано в так званому алгоритмі розріджено кодуючого нейронного газу.

Алгоритм нейронного газу характеризується м’якою конкуруючою схемою навчання, що призводить до більш надійної збіжності алгоритму і оптимального розподілу кластерів на вибірці вхідних даних. При цьому використання правила Ойа дозволяє сформувати словник, що забезпечує мінімальну корельованість ознак і завадозахищеність кодування спостережень.

На ефективність аналізу образів значною мірою впливає врахування апріорної інформації про топологію вхідних даних. Для 1D, 2D та 3D топологій, що знайшли широке поширення в задачах обробки зображення та послідовностей, аналіз відбувається в рамках локальних рецептивних полів. Тобто вхідні дані скануються вікном (рецептивним полем) в рамках якого відбувається розріджене кодування або згортка зі згортковими фільтрами. На рис. 1.3 показано габарити вхідних даних з відомою топологією та умовні розміри рецептивного поля для формування карти ознак.

Функцію відображення даних в рамках скануючого рецептивного поля в піксель карти ознак назвемо скануючим кодером. На рис. 1.3а показано дані з 1D- топологією у вигляді багатовимірної послідовності даних, що складається з H сигналів, які аналізуються в рамках буферу довжиною в T відліків.

На рис. 1.3б показано дані з 2D-топологією у вигляді одноканального зображення шириною W та висотою H, що сканується кодером по вертикалі і горизонталі рецептивним полем k x k пікселів. На рис. 1.3в показано дані з 3D- топологією у вигляді D-канального зображення з шириною W та висотою H, що сканується кодером по вертикалі, горизонталі і вглиб рецептивним полем k x k х d пікселів.

(12)

Вихід k

T H

а

W H

k

k Вихід

б

k H k

W

D d < D

Вихід

в

Рисунок 1.3 – Схема формування карти ознак кодуючим вікном : а – 1D-топологія даних; б – 2D-топологія даних; в – 3D-топологія даних

У випадку зображення процес його розрідженого кодування полягає в декомпозиції на патчі, що перетинаються, кожен з яких кодується кодером в багатоканальний піксель карти ознак (рис. 1.4).

Оскільки кодер оснований на розрідженому кодуванні, то піксель карти ознак матиме розріджену активацію каналів. Отриману карту ознак можна сприймати як нове багатоканальне зображення, для якого можна повторити процедуру розрідженого кодування. При цьому кількість атомів (кластерів) кодера може бути як більшою за розмірність вхідного патчу, що відповідає надповному базису (overcomplete dictionary), так і меншою за розмірність вхідного патчу, що відповідає неповному базису (undercomplete dictionarу).

Дослідження показують, що для задачі класифікаційного аналізу можуть бути ефективними як надповні, так і неповні базиси екстрактора ознак [11].

(13)

Вхідне зображення

Декомпозиція на патчі

Розріджене кодування

Зображення другого шару

Декомпозиція на патчі

Розріджене кодування

Рисунок 1.4 – Схема аналізу зображення двошаровою моделлю на основі розрідженого кодування

У задачах аналізу часових послідовностей набула популярності каузальна архітектура моделей для роботи з даними, що мають 1D-топологію. В даній архітектурі рецептивне поле кодера охоплює поточні і минулі дані. Тобто результат аналізу кожного кодера залежить тільки від значень сигналу у минулих відліках часу (рис. 1.5). При цьому для збільшення рецептивного поля моделі її необхідно стекувати в глибину.

Вихід

Прихований шар Прихований шар Прихований шар Вхід

Рисунок 1.5 – Архітектура каузальної моделі для аналізу послідовностей

(14)

Для аналізу даних високої розмірності з відомою топологією можна використовувати діряві (dilated) рецептивні поля, які застосовуються до локальних ділянок даних, розмір яких перевищує кількість входів кодера. Тобто частина даних, що накривається рецептивним полем, ігнорується, а аналізу піддаються дані з певним просторовим або часовим кроком (рис. 1.6).

а

Вихід

Прихований шар Прихований шар Прихований шар Вхід

б

Рисунок 1.6 – Діряві рецептивні поля моделі аналізу даних : а – 2D-топологія; б – 1D-топологія казуальної моделі

Стекування кодерів з дірявими рецептивними полями дозволяє досягти великого рецептивного поля моделі з використанням невеликої кількості шарів і параметрів. При цьому не відбувається втрат інформації, оскільки кодер здійснює сканування вхідних даних в просторі або часі. Крім того наявність пропусків дозволяє знизити чутливість до високочастотних складових шуму і, як результат, підвищити завадозахищеність моделі.

Для дослідження залежностей на різних рівнях деталізації в рамках окремого шару моделі використовують поєднання кодерів з рецептивними полями різного розміру (рис. 1.7).

(15)

Вхідні дані 100x100x3

Кодер з рецептивним

полем 5х5х3 Кодер з рецептивним

полем 3х3х3 Кодер з рецептивним

полем 1х1х3

Конкатенована карта ознак

Рисунок 1.7 – Приклад використання кодерів з рецептивними полями різного розміру для формування ознакового опису різного рівня деталізації

Малі рецептивні поля кодерів дозволяють здійснювати екстракцію детальної (fine-grained) інформації, а великі рецептивні поля кодерів забезпечують екстракцію грубої (coarse-grained), як правило, контекстної інформації. Наприклад в популярних Inception-модулях згорткових мереж використовуються згорткові фільтри з ядрами 1x1, 3x3 та 5x5 для сприйняття різномасштабної просторової інформації (від детального до загрубленого рівнів).

Одним із шляхів ефективної регуляризації глибоких моделей аналізу даних є застосування методу Dropout, що зменшує ймовірність ефекту перенавчання і забезпечує навчання за схемою “з-кінця-в-кінець” (end-to-end). Його суть полягає у вимиканні випадковим чином частини нейронів нейронного шару під час навчання та усередненні результатів в режимі екзамену. Шар нейронів на кожному окремому кроці навчання розглядається як ансамбль експериментів Бернулі. Множина вимкнених нейронів на кожній ітерації навчання є випадковою величиною, що розподілена за біноміальним законом.

Таким чином метод Dropout реалізує псевдоансамблювання підмереж однієї нейронної мережі. При цьому основний ефект його застосування досягається за рахунок усування прояву взаємоадаптації (co-adaptation) нейронів.

Взаємоадаптація нейронів полягає в адаптації одних нейронів для компенсації

(16)

помилок інших нейронів, однак результати даного ефекту не узагальнюються на дані, які не брали участі у навчанні. Крім очевидних переваг застосування методу Dropout існують і недоліки. Наприклад, застосування методу Dropout призводить до збільшення в 2-3 рази часу необхідного для навчання внаслідок досить зашумленого сигналу оновлення параметрів.

У випадку апріорної невизначеності виправданим є протокол інкрементального ускладнення моделі до моменту перенавчання. Тому важливе місце поряд зі схемою навчання “з-кінця-в-кінець” (end-to-end) посідає і схема навчання “шар-за-шаром” (layer-by-layer). Ця схема може використовуватися як для навчання без вчителя моделі розділення пояснюючих факторів, так і при додаванні чи тонкій настройці запозичених шарів в рамках техніки переносу знань (Transfer Learning). При цьому за умов ресурсних та інформаційних обмежень альтернативою до методу Dropout можуть бути різноманітні техніки, основані на звичайному ансамблюванні та L1 або L2 регуляризації.

Серед методів ансамблювання в задачі виділення компактного ознакового подання заслуговує на увагу алгоритм випадкового лісу, побудований з використанням методу предиктивних кластеризуючих дерев (Predictive Clustering Trees). Синтез дерев рішень в рамках методу предиктивних кластеризуючих дерев полягає в рекурсивному зменшенні внутрішньокластерної дисперсії з кожним розщепленням вузлів дерева. У результаті шлях вхідного вектора х від вершини до листка містить цінну інформацію про структуру даних. При цьому ансамбль таких дерев рішень дозволяє сформувати ознакове подання, що стійке до шуму.

Екстракція компактного ознакового опису в даному випадку може здійснюватися шляхом конкатенації шляхів рішень, закодованих двійковим кодом (рис. 1.8).

Аналіз рис. 1.8 показує, що вузли кожного дерева пронумеровані, а кількість вузлів в дереві рішень рівна довжині двійкового коду. Тоді кодування вхідного спостереження полягає в присвоєнні одиничних значень тим бітам, що відповідають вузлам, через які проходить шлях прийняття рішення від кореню до листка відповідного дерева [12].

(17)

Рисунок 1.8 – Індукція ознакового опису ансамблем випадкових дерев рішень

Таким чином, формування ознакового опису полягає в застосуванні моделей і методів, що дозволяють утилізувати всю доступну апріорну інформацію для підвищення ефективності навчання. До апріорної інформації відноситься інформація про топологію даних, інформація про доменну область застосування системи (для пошуку сторонніх моделей, акумульовані знання яких можна запозичити згідно техніки переносу), а також інформація про структуру даних у вигляді множини пояснюючих факторів. Існує велика кількість варіантів щодо вибору моделі виділення пояснюючих факторів з вибірки нерозмічених даних, велика кількість конфігурацій рецептивних полів нейронів або кодерів та способів компактного і завадозахищеного подання ознакового опису найвищого рівня. Під час синтезу моделі виділення пояснюючих факторів перевагу пропонується віддавати моделям і методам, основаним на принципах розрідженого кодування.

При цьому настройка параметрів і гіперпараметрів моделі екстрактора ознак ґрунтується на максимізації функціональної ефективності вирішальних правил.

1.2 Моделі і методи побудови вирішувальних правил

У працях [13, 14] було показано, що побудова вирішувальних правил в рамках геометричного підходу забезпечує завадозахищеність і зниження вимог до обсягу розмічених навчальних даних. Однією з найбільш вдалих реалізацій

(18)

даного підходу є так звані сіамські нейронні мережі. Сіамська мережа складається з двох екстракторів ознак зі спільними параметрами (рис. 1.9).

Багатошарова модель f(z)

Багатошарова модель f(z) Спільні вагові

коефіцієнти W

хi yi

a = f(x , W ) b = f(y , W )

Дистанційна функція d( a , b )

i i i i

Вектор ознак

i i

Рисунок 1.9 – Структура сіамської моделі для навчання ієрархічного екстрактора ознак з учителем

Параметри екстрактора ознак вважаються оптимальними, якщо для пари семантично схожих зразків вихід мережі має близьке до нуля значення, а для пари семантично відмінних зразків – значення виходу, що близьке до одиниці. Тобто навчання сіамських мереж можна вважати навчанням метрики подібності (metric learning). Навчена сіамська мережа може виконувати роль дистаційної метрики для лінивих алгоритмів побудови вирішальних правил, таких як метод k- найближчих сусідів. На цьому принципі основано алгоритми навчання з декількох поглядів (few-shot learning). Також дані мережі можуть розглядатися як адаптивне ядро для ядерних алгоритмів побудови вирішальних правил. При цьому задача побудови функції близькості (similarity function) є еквівалентною до задачі побудови простору інваріантних ознак. Тому навчений екстрактор можна використовувати і окремо, без близнюка.

Навчальна вибірка сіамської нейронної мережі складається з семантично подібних пар зразків S та семантично відмінних пар зразків D, тобто

( ) ( ) ( ) ( ) ( )

1 2 1 1

{( , ) : 0},

i i i i i

S x x x та x є семантично близькими з маркуванням y

( ) ( ) ( ) ( ) ( )

1 2 1 1

{( , ) : 1}.

i i i i i

D x x x та x є семантично відмінними з маркуванням y

(19)

Функція втрат для сіамської мережі може мати вигляд

( ) ( ) ( ) ( ) ( ) ( )

1 2 1 2 1 2

( ) ( ) ( ) ( ) 2

1 2 1 2

( , ) ( , )log ( , )

(1 ( , ))log(1 ( , )) ,

 

   

i i i i i i

i i i i T

L x x y x x p x x

p x x p x x w

де (x1( )i ,x2( )i ) – пара зразків міні-пакету навчальної вибірки;

y x( 1( )i ,x2( )i ) – вектор маркування міні-пакету;

T – регуляризаційні ваги.

Для збільшення міжкласового зазору та зменшення внутрішньокласової дисперсії в просторі ознак, що формується екстрактором сіамської мережі функція втрат може набути вигляд

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

1 2 1 2 1 2 1 2 1 2

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

1 2 1 2 1 2 1 2

1 1

( , ) (1 ( , )) ( , ) ( , ) ( , )

1 1

(1 ( , )) ( , ) ( , ) max(0, ( , )),

   

 

i i i i i i i i i i

sim dis

n n

i i i i i i i i

i i

L x x y x x L x x y x x L x x

y x x p x x y x x m p x x

n n

де m – параметр міжкласового зазору, що може бути обчислений як m = N/M, де N, M – кількість ознак та кількість класів відповідно за умови, що N > M.

Багатокласову задачу завжди можна звести до серії двохкласових. Методи розв’язання задач двохкласової класифікації добре розроблені. При цьому часто обчислювально ефективніше працювати не з монолітним багатокласовим класифікатором, а з еквівалентною множиною двохкласових класифікаторів. До методів зведення багатокласової класифікації до серії двохкласових належать двійкове кодування кодами, що коректують помилки (Error Correcting Output Codes, ECOC), “кожен проти всіх” (one-against-all), “кожен проти кожного” (one- against-one), “турнір на вибування” (survivor), дихотомія (dichotomy), “кожен сам за себе” (everyone for himself) [14].

(20)

Під час використання кодів, що коректують помилки, номер класу записують у вигляді k-значного двійкового числа. Для цього здіснюється навчання k-класифікаторів, кожен з яких розпізнає один з k розрядів номера класу. За результатами розпізнавання вхідного вектора кожним з k класифікаторів однозначно відновлюють номер класу, до якого він належить.

Якщо окремі класифікатори помиляються, то номер класу відновлюють шляхом заміни отриманого номеру номером класу, що найближчий до отриманого за метрикою Хеммінга (рис. 1.10) [13].

Мітки класів С4 С3 С2 С1 Х

Дані

Бінарні прогнози Декодування лизькість за відстанню Хемінга ) Дихотомай- зер (бінарні класифікатори)

Кодова матриця

Рисунок 1.10 – Ілюстрація до схеми багатокласової класифікація з використанням двійкового кодування номера класу кодами,

що виправляють помилки

На рис. 1.10 показано кодову матрицю, де чорні і білі комірки позначають мітки 0 або 1 для зразків відповідних класів на етапі навчання бінарних класифікаторів. В режимі екзамену ця матриця використовується для порівняння прогнозованого коду з кодами класів. Ефективна кодова матриця повинна забезпечувати найбільшу відстань Хеммінга як між рядками кодової матриці, так і між стовбцями. Відстань між рядками забезпечує можливість самовиправлення помилок, а відстань між стовбцями забезпечує некорельованість результатів кожного з бінарних класифікаторів, що навчаються. При цьому існує багато способів формування номера класу для кодової матриці, однак саме коди, що виправляють помилки, (самокоректуючі коди) забезпечують кодування з

(21)

необхідними властивостями. Поширеним способом формування самокорек- туючих кодів є використання матриць і кодів Адамара [14].

Основним недоліком методу ECOC є ігнорування структури класів під час побудови кодової матриці без можливості оптимізації коду кожного класу в процесі навчання. Крім того відсутність кодового радіусу для кожного номера класу, що вказує на кратність помилок, які можуть бути виправлені, ускладнює виявлення викидів або новизни в даних.

Синтез класифікаційних вирішальних правил пропонується здійснювати в рамках так званої інформаційно-екстремальної інтелектуальної технології (ІЕІ- технології), яка грунтується на таких принципах :

– двійкове кодування класів розпізнавання самокоректуючими кодами (Error-Correcting Output Coding) з урахуванням внутрішньої структури класів розпізнавання;

– трансформація простору ознак для зменшення відстані між зразками однакових класів та збільшення відстані між зразками різних класів (подібно до сіамських нейронних мереж) в рамках двійкового простору Хеммінга;

– оптимізація в інформаційному розумінні вирішальних правил, що відновлюються в радіальному базисі простору Хеммінга, з метою врахування габаритів розподілу кожного класу і підвищення стійкості до шуму і новизни в даних;

– інкрементальне нарощування складності моделі;

– використання обчислювально ефективних операцій як будівельних блоків моделі.

В рамках ІЕІ-технології процес навчання моделі класифікаційного аналізу полягає в реалізації ітераційної процедури оптимізації генотипних та фенотипних параметрів функціонування, що впливають на функціональну ефек-тивність навчання. Одним з основних генотипних пара-метрів навчання моделі класифікаційного аналізу є система порогів для двійкового кодування спостережень. У найпростішому випадку ця система може бути побудована у

(22)

вигляді полів контрольних допусків, а в більш складному випадку у вигляді ансамблю дерев рішень.

Система полів контрольних допусків (СКД) на ознаки розпізнавання, що визначає координати спостережень в бінарному просторі ознак, напряму впливає на геометричні параметри замкнених роздільних гіперповерхонь, які прийнято називати контейнерами класів розпізнавання. Оптимізація СКД спрямована на таку зміну розподілу векторів спостережень в бінарному просторі, яка дозволяє оптимально в інформаційному розумінні описати розподіли класів контейнерами найпростішої (гіперсферичної) форми. Тобто алгоритм навчання повинен забезпечити у найгіршому випадку мінімальний перетин контейнерів класів, а в найкращому випадку – максимальний відступ між межами контейнерів класів (рис. 1.11).

Нечітке розбиття в просторі

Евкліда

Чітке розбиття в бінарному просторі

Хеммінга

Кодування

Рисунок 2.11 – Ілюстрація для пояснення ідеї трансформації простору ознак в рамках ІЕІ-технології

На рис. 1.11 показано межі гіперсферичних контейнерів і розподіл спостережень двох класів, де зразки одного з класів показані у вигляді чорних точок, а зразки іншого класу показані у вигляді незафарбованих кілець.

На рис. 1.12 показано поле контрольних допусків на значення і-ї ознаки

( )

, , 1,

j

хm i i N, межі яких відраховуються від усередненого значення ознаки в базовому класі ХБо{Хmо}, який обирається розробником інформаційного забезпечення. В діагностичних системах базовому класу ХБо відповідає клас, що

(23)

характеризує нормальний стан, щоб решту класів можна було розглядати як різноманітні відхилення від норми [15].

На рис. 1.12 прийнято такі позначення: хБ i,  усереднене значення ознаки в базовому класі; Amin,i, Amax,i  нижній та верхній нормовані допуски відповідно, які задають область значень i-ї ознаки і відповідних контрольних допусків;

, , H l i

A , AB l i, ,  нижня та верхня межі контрольних допусків l-го інтервалу;

K l i, , – поле контрольних допусків l-го інтервалу.

хБ i,

i

AH,1, AB,1,i хi i

K,1,

Amin,i Amax,i

хБ i,

i

AH,1, i

AH,2, i

AH,3, AB,1,i AB,2,i AB,3,i хi

i K,1,

i K,2,

i K,3,

а б

Рисунок 1.12 – Поле контрольних допусків на значення ознаки : а – одноінтервальне поле; б – триінтервальне поле

Інформаційно-екстремальне машинне навчання основане на адаптивному двійковому кодуванні ознак розпізнавання шляхом порівняння значення i-ї ознаки з відповідними нижнім AН l i, , та верхнім AВ l i, , контрольними допусками

l-го інтервалу, які розраховуються за формулами

, , ,

max

1

l Б i i

Н l i

A х ,

, , ,

max

1

l Б i i

В l i

A х ,

де i – параметр поля контрольних допусків;

max– максимальне значення параметра поля контрольних допусків.

(24)

У випадку використання СКД формування бінарної навчальної матриці

( )

{bm fj, | f 1, * ;L N l1,L; i1,N; j1, ;n m1,M} для L-інтервальної СКД здійснюється за правилом

( ) , 1, ( ), , ,

, *

1, якщо ;

0, інакше

   

  

 



j Н L l i m ij В l i

m L i L l

A x A

b (1.1)

Межі контрольних допусків ділять область можливих значень ознаки розпізнавання на 2*L+1 областей, кожній з яких відповідає окремий двійковий код i-ї ознаки, що складається з L розрядів. Кодова відстань між кодами сусідніх областей рівна одній кодовій одиниці, а кодова від-стань між кодами областей, розміщених через одну чи більше областей, рівна двом і більше кодовим одиницям. Запропонована схема кодування (1.1) дозволяє збільшити різноманітність двійкових векторів-реалізацій та враховувати напрям відхилення розподілу векторів-реалізацій образів від базового класу, який відповідає найбільш бажаному функціональному стану.

Одним із шляхів реалізації оперативного визначення оптимальних параметрів СКД є застосування популяційних алгоритмів пошукової оптимізації.

Ці алгоритми не потребують початкових наближень і дозволяють знайти оптимальне рішення за невелику кількість ітерацій. При цьому одна ітерація популяційного алгоритму потребує na запусків базового алгоритму інформаційно-екстремального машинного навчання, де na – кількість агентів популяції [13]. Базовий алгоритм інформаційно-екстремального навчання полягає в оптимізації геометричних параметрів контейнерів класів при незмінній СКД для оцінки функціональної ефективності моделі.

Одним з найпростіших в реалізації популяційних алгоритмів пошукової оптимізації є алгоритм рою частинок (Particle Swarm Optimization) [16].

Ефективність кожної частинки популяційного алгоритму, тобто близькість до глобального оптимуму, вимірюється за допомогою наперед визначеної фітнес-

Посилання

СУПУТНІ ДОКУМЕНТИ

активізація професійно спрямованої взаємодії майбутніх фахівців соціономічної сфери інтерактивними методами навчання; залучення студентів

вміння генерувати оригінальні ідеї у вирішенні дизайнерських проблем, володіння навичками дизайнерського і творчого мислення; самодіагностика та

Обґрунтовано педагогічні умови (стимулювання мотивації студентів до навчання з використанням музичних інформаційних технологій;

Практичне значення дослідження полягає в поетапному впровадженні моделі підготовки майбутніх учителів іноземної мови до використання підручників

«формування соціокультурної компетентності майбутніх фармацевтів у процесі гуманітарної підготовки»; представлено структуру соціокультурної

Тема 2. Масова музична культура як феномен сучасного суспільства. Інтелектуальні, політичні, соціокультурні контексти. Ключові поняття для аналізу

Відповідно до Закону України «Про соціальні послуги» (2019) серед базових соціальних послуг визначено супровід під час інклюзивного навчання

Розбудова сучасної національної системи освіти спонукає до пошуку і впровадження нових педагогічних підходів, форм і методів, які б

Інноваційна освітня технологія – це якісно нова сукупність форм, методів і засобів навчання, виховання й управління, яка приносить

Даний аспект створює об’єктивну необхідність розробки нових підходів до організації та здійснення митної політики України в умовах

Вимоги сучасного ринку туристичних і рекреаційних послуг України вимагають не тільки адаптації суб’єктів господарювання до нових якісних

(Received 28 March 2019; revised manuscript received 20 June 2019; published online 25 June 2019) The structural-adsorption characteristics of nanoporous carbon materials

виховання студентської молоді, до розробки і впровадження перспективних, інноваційних технологій навчання і виховання. Особливості суспільного

Актуальність наукового дослідження зумовлена необхідністю модернізації та удосконалення медичної освіти в Україні для іноземців, пошуком методів

вперше започатковано новий напрям дослідження проблеми ризику особистості на рівні системного теоретико-експериментального пізнання його

1) За результатами оцінки якості поверхневих водних об'єктів Полтавської області в 2019 р. за Методикою екологічної оцінки якості поверхневих

На підставі вивчення зазначених досліджень ми розуміємо економічну культуру як сукупність соціальних цінностей і норм, які є регулятором

Одержані результати можуть бути застосовані як для розробки методів балансування повітряних гвинтів, так і для розробки методів дослідження

Висновок: Таким чином, використання засобів MS SQL Server 2005 у поєднанні з методологією інтелектуального аналізу та добування

в) профільний агент надає механізм, за допомогою якого гене- руються та підтримуються профілі (параметри) користувачів, а також БДСТ. Профільний

Однак будь-які нові положен- ня завжди потребують їх ретельного аналізу з ме- тою визначення умов їх реалізації, що обумовлює актуальність

Зокрема, особливо важливим для розробки нових та удосконалення наяв них форм, методів та інструментів інституційного та

З цієї причини на перший план ставиться завдання пошуку нових форм і методів організації дистанційного навчання у системі