Mgr Maciej Chrabąszcz

Zainteresowania badawcze: Bezpieczeństwo AI, Wyjaśnialna Sztuczna Inteligencja, AI Red Teaming
Maciej Chrabąszcz zajmuje się badaniami dotyczącymi bezpieczeństwa AI. W ramach badań tworzy metody pozwalające na analizę zachowań modeli AI. Celem takich analiz jest znalezienie przypadków, dla których model działa w sposób niewłaściwy lub dziwny. Dodatkowo, wykorzystując metody XAI stara się zrozumieć z czego te zachowania mogły wynikać. Pozwala to na zrozumienie kiedy model AI działa nieprawidłowo i dlaczego. Maciej jest doktorantem w Szkole Doktorskiej Politechniki Warszawskiej.
Wybrane publikacje
Artykuły
Karolina Seweryn, Anna Kołos, Agnieszka Karlińska, Katarzyna Lorenc, Katarzyna Dziewulska, Maciej Chrabaszcz, Aleksandra Krasnodebska, Paula Betscher, Zofia Cieślińska, Katarzyna Kowol, Julia Moska, Dawid Motyka, Paweł Walkowiak, Bartosz Żuk, Arkadiusz Janz, "PLLuM-Align: Polish Preference Dataset for Large Language Model Alignment", Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, , 2025, 23890–23919.
Aleksandra Krasnodębska, Maciej Chrabąszcz, Wojciech Kusa, "Rainbow-Teaming for the Polish Language: A Reproducibility Study", Proceedings of the 5th Workshop on Trustworthy NLP, TrustNLP 2025, , 155-165.