TWOJA PRZEGLĄDARKA JEST NIEAKTUALNA.
Wykryliśmy, że używasz nieaktualnej przeglądarki, przez co nasz serwis może dla Ciebie działać niepoprawnie. Zalecamy aktualizację lub przejście na inną przeglądarkę.
Data: 24.05.2022 Kategoria: aktualności ogólne, nagrody/odznaczenia/medale, nauka/badania/innowacje, Wydział Informatyki i Telekomunikacji
Dr inż. Paweł Zyblewski z Wydziału Informatyki i Telekomunikacji zdobył główną nagrodę w konkursie Polskiego Stowarzyszenia Sztucznej Inteligencji na najlepszą polską pracę doktorską z zakresu AI w 2021 r.
Jury doceniło jego pracę „Classifier selection for imbalanced data stream classification (Selekcja klasyfikatorów w zadaniu klasyfikacji niezbalansowanych strumieni danych)”, której promotorem był prof. Michał Woźniak z Katedry Systemów i Sieci Komputerowych.
– Tematyka mojej rozprawy doktorskiej jest ściśle powiązana z realizowanym na PWr projektem „Algorytmy klasyfikacji niezbalansowanych strumieni danych” finansowanym przez Narodowe Centrum Nauki – mówi dr inż. Paweł Zyblewski. – Miał on na celu połączenie ze sobą dwóch istotnych trendów badawczych z dziedziny rozpoznawania wzorców w zakresie analizy tzw. danych trudnych, tj. klasyfikacji strumieni danych (ang. data stream classification) oraz klasyfikacji danych niezbalansowanych (ang. imbalanced data classification) – dodaje.
Dane niezbalansowane charakteryzują się odmienną liczbą obiektów należących do poszczególnych klas problemu, co znacząco utrudnia zadanie klasyfikacji w przypadku wykorzystania standardowych algorytmów, które posiadają tendencję do faworyzowania – często mniej dla nas istotnej – klasy większościowej.
Z kolei strumienie danych wymagają ciągłej poprawy wykorzystywanych modeli, ze względu na możliwość wystąpienia w nich zjawiska tzw. dryfu koncepcji (ang. concept drift). Zjawisko to może prowadzić do przesunięcia się granicy decyzyjnej problemu, a w konsekwencji do degeneracji zdolności decyzyjnej klasyfikatora w trakcie jego eksploatacji. Te niekorzystne z praktycznego punktu widzenia zaburzenia danych w konsekwencji wpływają negatywnie na prognozowanie wielu ważnych procesów gospodarczych, w tym wspomagania decyzji medycznych, logistycznych i konsumenckich.
Nasz naukowiec zdecydował się na zajęcie tym tematem m.in. ze względu na stosunkowo niewielką liczbę prac poruszających ten problem, pomimo tego, że rzeczywiste strumienie danych często mogą wykazywać się wysokim i dynamicznie zmieniających się stopniem niezbalansowania. Powoduje to rosnące zapotrzebowanie na projektowanie algorytmów zdolnych do radzenia sobie w tych trudnych warunkach.
– Aby poradzić sobie z tymi problemami, zaproponowałem metody bazujące na dynamicznej selekcji klasyfikatorów (ang. dynamic classifier selection), które dobierają skład zespołu klasyfikatorów (ang. classifier ensemble) w zależności od wartości miar kompetencji dla danego obiektu – wyjaśnia dr inż. Paweł Zyblewski. – Podejścia te zostały uzupełnione o techniki wstępnego przetwarzania danych (ang. data preprocessing), mające na celu zbalansowanie liczności klas analizowanych problemów w celu zredukowania stronniczości w stosunku do klasy większościowej – dodaje.
Celem pracy było wykorzystanie naturalnej zdolności algorytmów selekcji klasyfikatorów do radzenia sobie z niezbalansowaniem danych oraz zaproponowanie nowych, efektywnych rozwiązań rzadko poruszanego w literaturze problemu klasyfikacji wysoce niezbalansowanych strumieni danych.
W oparciu o te założenia w pracy sformułowana i uprawdopodobniona została hipoteza zakładająca, że istnieją metody wykorzystujące zarówno wstępne przetwarzanie danych, jak i metody selekcji klasyfikatorów, które przewyższają jakość predykcji znanych z literatury metod stosowanych w klasyfikacji danych trudnych.
Rozprawa doktorska dostępna jest w Dolnośląskiej Bibliotece Cyfrowej.
Pełne wyniki konkursu można znaleźć na stronie PSSI.
Dr inż. Paweł Zyblewski jest obecnie jednym z członków zespołu realizującego projekt SWAROG, którego celem jest opracowanie systemu wykrywającego źródła celowej dezinformacji.
W najbliższym czasie wyjedzie także na miesięczny staż naukowy na University of Birmingham w Wielkiej Brytanii w ramach współpracy z zespołem prof. Leandro Minku. Staż będzie dotyczył zastosowania uczenia półnadzorowanego w zadaniu klasyfikacji strumieni danych.
mic
Nasze strony internetowe i oparte na nich usługi używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Ochrona danych osobowych »