Problem klasyfikacji z danych niezbalansowanych

Niezbalansowanie danych to znany i powszechny problem danologów, który wciąż nie doczekał się dobrego rozwiązania. Z tym problemem, w niekonwencjonalny sposób, zmierzyli się nasi naukowcy, Hubert Jegierski (absolwent Danologii) i dr inż. Stanisław Saganowski (Katedra Inteligencji Obliczeniowej, Wydział Informatyki i Zarządzania).
Opracowana przez nich metoda polega na wzbogacaniu zbioru danych o obserwacje z innych, zewnętrznych zbiorów danych. Nasi naukowcy zaproponowali trzy scenariusze wzbogacania: losowe, zachłanne, i nadzorowane. Na podstawie szerokich badań dowiedli, że zaproponowane podejście znacznie przewyższa skutecznością dotychczasowe rozwiązania. Metoda jest szczególnie pomocna dla małych zbiorów danych, dla których poprawia skuteczność klasyfikacji nawet o 66%.
Szczegóły metody oraz pełne wyniki zostały opublikowane w bardzo dobrym czasopiśmie IEEE Access: https://doi.org/10.1109/ACCESS.2020.3007801
Zachęcamy do lektury i serdecznie gratulujemy naszym młodym naukowcom!