DOI: https://doi.org/10.30837/2522-9818.2018.6.042

ЯДЕРНАЯ НЕЧЕТКАЯ КЛАСТЕРИЗАЦИЯ ПОТОКОВ ДАННЫХ НА ОСНОВЕ АНСАМБЛЯ НЕЙРОННЫХ СЕТЕЙ

Поліна Євгеніївна Жернова, Євгеній Володимирович Бодянський




Аннотация


Предметом исследования в статье является кластеризация данных на основе ансамбля нейронных сетей. Цель работы – создание нового подхода в задачах кластеризации потоков данных, когда информация поступает в online режиме наблюдения за наблюдением. В статье решаются следующие задачи: формирование модели ансамблей нейронных сетей для кластеризации данных, разработка методов кластеризации данных при работе с данными больших размерностей, разработка методов онлайн кластеризации данных с использованием ансамблей нейронных сетей, работающих в параллельном режиме. Получены следующие результаты: сформулированы принципы работы ансамблей нейронных сетей Т. Кохонена, и определены практические требования для работы с данными большой размерности. Показаны возможные подходы для решения перечисленных задач. Исследован принцип работы ансамбля параллельно настроенных кластеризующих сетей Т. Кохонена. Для обучения слоев ансамбля нейронных сетей использовались процедуры, работающие по принципу WTA и WTM. Были использованы радиально-базисные функции для повышения размерностей входного пространства. Разработана математическая модель для решения задачи кластеризации данных в online режиме. Разработана математическая модель для определения качества кластеризации с использованием индекса Дэвиса-Булдена, который был переформулирован для online режима. Выводы: В работе предложен новый подход к задаче кластеризации потоков данных, когда информация поступает в online режиме наблюдение за наблюдением при условии, что количество и форма кластеров заранее неизвестны. Основная идея этого подхода базируется на ансамбле нейронных сетей, который состоит из самоорганизующихся карт Кохонена. Все члены ансамбля обрабатывают информацию, которая последовательно подается в систему в параллельном режиме. Экспериментальные результаты подтвердили тот факт, что рассматриваемая система может быть использована для решения широкого круга задач Data Stream Mining.

Ключевые слова


кластеризация; метод Х-средних; самоорганизующаяся карта Кохонена; ансамбль нейронных сетей; самообучение

Полный текст:


PDF

Литература


Gan, G., Ma, Ch., Wu, J. (2007), Data Clustering: Theory, Algorithms and Applications, Philadelphia : SIAM.

Xu, R., Wunsch, D. C. (2009), Clustering, Hoboken, NJ : John Wiley & Sons, Inc., IEEE Press Series on Computational Intelligence.

Aggarwal, C. C., Reddy, C. K. (2014), Data Clustering, Algorithms and Application, Boca Raton : CRC Press.

Pelleg, D., Moor, A. (2000), "X-means: extending K-means with efficient estimation of the number of clusters", In: Proc. 17th Int. Conf. on Machine Learning, Morgan Kaufmann, San Francisco, P.727–730.

Ishioka, T. (2005), "An expansion of X-means for automatically determining the optimal number of clusters", In: Proc. 4th IASTED Int. Conf. Computational Intelligence, Calgary, Alberta, P. 91–96.

Rutkowski, L. (2008), Computational Intelligence. Methods and Techniques, Berlin-Heidelberg: Springer-Verlag.

Mumford, C. and Jain, L. (2009), Computational Intelligence. Collaboration, Fuzzy and Emergence, Berlin : Springer-Vergal.

Kruse, R., Borgelt, C., Klawonn, F., Moewes, C., Steinbrecher, M. and Held, P. (2013), Computational Intelligence. A Methodological Introduction, Berlin : Springer.

Du, K. L. and Swamy, M. N. S. (2014), Neural Networks and Statistical Learning, London : Springer-Verlag.

Kohonen, T. (1995), Self-Organizing Maps, Berlin : Springer-Verlag.

Strehl, A., Ghosh, J. (2002), "Cluster ensembles – A knowledge reuse framework for combining multiple partitions", Journal of Machine Learning Research, P. 583–617.

Topchy, A., Jain, A. K., Punch, W. (2005), "Clustering ensembles: models of consensus and weak partitions", IEEE Transactions on Pattern Analysis and Machine Intelligence, No. 27, P. 1866–1881.

Alizadeh, H., Minaei-Bidgoli, B., Parvin, H. (2013), "To improve the quality of cluster ensembles by selecting a subset of base clusters", Journal of Experimental & Theoretical Artificial Intelligence, No. 26, P. 127–150.

Charkhabi M., Dhot T., Mojarad S. A. (2014), "Cluster ensembles, majority vote, voter eligibility and privileged voters", Int. Journal of Machine Learning and Computing, No. 4, P. 275–278.

Bodyanskiy, Ye. V., Deineko, A. A., Zhernova, P. Ye., Riepin, V. O. (2017), "Adaptive modification of X-means method based on the ensemble of the T. Kohonen’s clustering neural networks", Materials of the VI Int. Sci. Conf. "Information Managements Systems and Technologies", Odessa, P. 202–204.

Bezdek, J. C., Keller, J., Krishnapuram, R., Pal N. (1999), Fuzzy Models and Algorithms for Pattern Recognition and Image Processing, The Handbook of Fuzzy Sets, Kluwer, Dordrecht, Netherlands : Springer, Vol. 4.

Cover, T. M. (1956), "Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition", IEEE Trans. on Electronic Computers, No. 14, P. 326–334.

Girolami, M. (2002), "Mercer kernel-based clustering in feature space", IEEE Trans. on Neural Networks, Vol. 13, No. 3, P. 780–784.

MacDonald, D., Fyfe, C. (2002), "Clustering in data space and feature space", ESANN'2002 Proc. European Symp. on Artificial Neural Networks, Bruges (Belgium), P. 137–142.

Camastra, F., Verri, A. (2005), "A novel kernel method for clustering," IEEE Trans. on Pattern Analysis and Machine Intelligence, No. 5, P. 801–805.

Bodyanskiy, Ye. V., Deineko, A. A., Kutsenko, Y. V., "On-line kernel clustering based on the general regression neural network and T. Kohonen’s self-organizing map", Automatic Control and Computer Sciences, No. 51 (1), P. 55–62.

Davies, D. L., Bouldin, D. W. (1979), "A Cluster Separation Measure", IEEE Transactions on Pattern Analysis and Machine Intelligence, No. 4, P. 224–227.

Murphy, P. M., Aha, D. (1994), UCI Repository of machine learning databases, available at : http://www.ics.uci.edu/mlearn/MLRepository.html, Department of Information and Computer Science, CA : University of California.


Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2018 Поліна Євгеніївна Жернова, Євгеній Володимирович Бодянський

Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» 4.0 International License.

              
 
 Все статьи, опубликованные в журнале ITSSI, доступны на условиях лицензии CC BY-NC-SA 4.0
© 2017-2019 Научный журнал "Современное состояние научных исследований и технологий в промышленности", Харьков, Украина