ОНЛАЙН НЕЧІТКА КЛАСТЕРИЗАЦІЯ ПОТОКІВ ДАНИХ ВЫСОКОЇ РОЗМІРНОСТІ НА ОСНОВІ АНСАМБЛІВ НЕЙРОННИХ МЕРЕЖ

Автор(и)

  • Yevgeniy Bodyanskiy Харківський національний університет радіоелектроніки http://orcid.org/0000-0001-5418-2143
  • Iryna Perova Харківський національний університет радіоелектроніки http://orcid.org/0000-0003-2089-5609
  • Polina Zhernova Харківський національний університет радіоелектроніки http://orcid.org/0000-0002-2154-4766

DOI:

https://doi.org/10.30837/2522-9818.2019.7.016

Ключові слова:

кластерування, метод нечітких C-середніх, послідовний аналіз головних компонент, ансамбль нейро-фаззі мереж, нейронна мережа Т. Кохонена, самонавчання

Анотація

Предметом дослідження в статті є нечітка кластеризація даних високої розмірності на основі ансамблевого підходу за умови, що кількість та форма кластерів невідомі. Мета роботи - створення нейро-фаззі підходу для кластеризації даних, коли потік даних подається на обробку в онлайн-режимі в припущенні, що кількість та форма кластерів невідомі. У статті вирішуються наступні завдання: компресія вхідного простору ознак в онлайн режимі, формування моделі ансамблів нейронних мереж для кластеризації даних, розробка ансамблю нейро-фаззі мереж для кластеризації даних високої розмірності, розробка підходу для кластеризації даних в онлайн режимі. Отримані наступні результати: основна ідея запропонованого підходу заснована на модифікації нечіткого алгоритму C-середніх. Для зниження розмірності вхідного простору пропонується використовувати модифіковану мережу Хебба-Сенгера, яка відрізняється підвищеною швидкодією та побудовану на основі модифікованих нейронів Ойя. Запропоновано оптимізований за швидкодією алгоритм навчання нейрона Ойя. Така мережа реалізує метод головних компонент в онлайн-режимі з високою швидкодією. Висновки: В тому випадку, якщо процедура редукції-компресії не може бути використана через можливість втрати фізичного сенсу вихідного простору, нами запропоновано новий критерій кластеризації, який містить в собі як відомий поліноміальний фаззіфікатор, так і зважування окремих компонент відхилень аналізованих образів від центроїдів кластерів. Введена рекурентна модифікація заснована на алгоритмах запропонованих в даній статті. Розроблено математичну модель для визначення якості кластеризації з використанням індекса Ксі-Бені, який був модифікований для онлайн режиму. Експериментальні результати підтвердили той факт, що запропонована система дозволяє вирішувати широкий спектр завдань Data Mining, коли набори даних обробляються в онлайн-режимі за умови, що кількість та форма кластерів не відомі, а також мають велику кількість спостережень.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Yevgeniy Bodyanskiy, Харківський національний університет радіоелектроніки

доктор технічних наук, професор, професор кафедри штучного інтелекту, науковий керівник ПНДЛ АСУ

Iryna Perova, Харківський національний університет радіоелектроніки

кандидат технічних наук, с.н.с., доцент, доцент кафедри біомедичної інженерії

Polina Zhernova, Харківський національний університет радіоелектроніки

асистент кафедри системотехніки

##submission.downloads##

Опубліковано

2019-03-22

Як цитувати

Bodyanskiy, Y., Perova, I. і Zhernova, P. (2019) «ОНЛАЙН НЕЧІТКА КЛАСТЕРИЗАЦІЯ ПОТОКІВ ДАНИХ ВЫСОКОЇ РОЗМІРНОСТІ НА ОСНОВІ АНСАМБЛІВ НЕЙРОННИХ МЕРЕЖ», СУЧАСНИЙ СТАН НАУКОВИХ ДОСЛІДЖЕНЬ ТА ТЕХНОЛОГІЙ В ПРОМИСЛОВОСТІ, (1 (7), с. 16–24. doi: 10.30837/2522-9818.2019.7.016.