Dr Agnieszka Karlińska

Agnieszka Karlińska
Zainteresowania badawcze: analiza tekstu, NLP, w szczególności legal NLP, LLM, data-centric AI, humanistyka cyfrowa, socjolingwistyka

Agnieszka Karlińska prowadzi badania z zakresu automatycznego przetwarzania i analizy tekstu, które sytuują się na pograniczu informatyki i lingwistyki kwantytatywnej, a niekiedy wychodzą także w stronę humanistyki cyfrowej i obliczeniowych nauk społecznych. W swojej rozprawie doktorskiej badała kwestię gender bias w opiniowaniu sądowo-psychiatrycznym. W NASK zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli, ze szczególnym uwzględnieniem selekcji danych oraz procesu wychowania.

Wybrane publikacje

Artykuły

Agnieszka Karlińska, Piotr Miłkowski, Paulina Czwordon-Lis, Bartłomiej Koptyra, Jan Kocoń, "Comprehensive Sentiment Analysis of Polish Book Reviews Using Large and Small Language Models", 24th IEEE International Conference on Data Mining Workshops, ICDMW, 2024, 453-462.
Sławomir Mandes, Agnieszka Karlińska, "W stronę nowej metodologii analizy treści. Podobieństwa i różnice pomiędzy modelowaniem tematycznym i jakościową analizą treści", Przegląd Socjologii Jakościowej, 20(4), 2024, 118-143.
Anna Kołos, Inez Okulska, Kinga Głąbińska, Agnieszka Karlinska, Emilia Wiśnios, Paweł Ellerik, Andrzej Prałat, "BAN-PL: A Polish Dataset of Banned Harmful and Offensive Content from Wykop.pl Web Service", In: Calzolari N, Kan M-Y, Hoste V, Lenci A, Sakti S, Xue N, eds. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Torino, Italia: ELRA and ICCL, 2024, 2107–2118.
Agnieszka Karlinska, Cezary Rosiński, Marek Kubis, Patryk Hubar, Jan Wieczorek, "Using Bibliodata LODification to Create Metadata-Enriched Literary Corpora in Line with FAIR Principles", In: Calzolari N, Kan M-Y, Hoste V, Lenci A, Sakti S, Xue N, eds. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Torino, Italia: ELRA and ICCL, 2024, 17271–17284.