Bezpieczeństwo sztucznej inteligencji

Sztuczna inteligencja

Zrozumienie natury sztucznej inteligencji, bezpiecznego jej rozwoju oraz podatności procesów uczenia, to wielkie wyzwania współczesnej nauki. Wokół nich koncentrują się nasze badania nad inżynierią mechanizmów uczenia i reprezentacji danych, a także nad bezpieczeństwem i wyjaśnialnością modeli (XAI), w tym również modeli generatywnych czy wielkich modeli językowych (LLM). Szczególnie bliskie są nam zagadnienia etyki, ewolucji i bezpieczeństwa AI.

 

AI w Głębokiej Stymulacji Mózgu (DBS) i Traktografia – nasze przełomowe technologie! Celem operacyjnego leczenia choroby Parkinsona jest umieszczenie w mózgu elektrody kompensującej patologiczną nadaktywność obszaru zmienionego chorobowo. Obszar ten jest niewielki i znajduje się głęboko w mózgu, więc główne wyzwanie to jego precyzyjna lokalizacja. Opracowaliśmy technologię, która nie dość, że wskazuje taką właśnie precyzyjną lokalizację miejsca umieszczenia elektrody, to jeszcze skraca czas operacji na otwartym mózgu (z trzech godzin do jednej godziny)!

Ale to nie wszystko. Operacje neurochirurgiczne wiążą się z ryzykiem, ze względu na delikatną naturę tkanki mózgowej. Planowanie przedoperacyjne ma kluczowe znaczenie. Aby sprostać temu wyzwaniu, opracowaliśmy również wiarygodne modele sztucznej inteligencji, które identyfikują lokalizację elokwentnych obszarów mózgu i prowadzących do nich ścieżek nerwowych.

#Wspomaganie operacji neurochirurgicznych

 

W badaniach nad przetwarzaniem języka naturalnego (#NLProc) poszukujemy nowych, wyjaśnialnych reprezentacji danych językowych, badamy potencjał gramatyki. Szczególnie w zadaniach identyfikacji i klasyfikacji treści nietypowych, trudnych, w tym również szkodliwych (hejt, pornografia, dezinformacja). Stawiamy na modele dopasowane do problemu, a nie tylko modne, maksymalnie wykorzystujące zrozumienie istoty danych, struktur czy stylu tekstu. Mamy sentyment do wydźwięku i całej palety stylów, które dają się ująć w ramy algorytmów. Streszczamy, analizujemy, anonimizujemy. Badamy treści internetowe, dokumenty prawne, język sprzedażowy, styl ChatGPT czy parodie literackie. Tropimy i opisujemy wzorce – jako narzędzie klasyfikacji i jako obiekt lingwistyczny.

#StyloMetrix

#Gramatyczna kamasutra: jak sztuczna inteligencja rozumie podteksty?

 

Biometria i wizja komputerowa to obszary badawcze, które mają u nas długą historię, obejmującą m.in. technologię identyfikacji żywotności  oka. Od kilkunastu lat rozwijamy metody uczenia głębokiego, opracowujemy metody analizy sygnałów i obrazów. Rozwijamy systemy biometrycznej weryfikacji i identyfikacji tożsamości, badamy zagadnienia bezpieczeństwa w biometrii, a w szczególności kontroli autentyczności danych biometrycznych. Nasze technologie, w tym oparte na modelach transformerowych i generatywnych, mogą znaleźć zastosowanie w systemach wykrywania oszustw (deepfake), w systemach monitoringu, urządzeniach i aplikacjach mobilnych.

 

Nauka o danych (danologia) to rozwój algorytmów uczenia maszynowego, optymalizacji globalnej oraz metod heurystycznych. Rozwijamy systemy przetwarzania wielkich zbiorów danych oraz systemy wspomagania decyzji umożliwiające eksplorację danych, ich grupowanie, klasyfikację oraz konstruowanie prognoz. Badamy sieci społeczne i informatyczne, rozwijamy metody analizy powiązań w sieciach, szczególnie koncentrując się na zagadnieniach cyberbezpieczeństwa, dezinformacji i propagacji treści nielegalnych.

 

Pracujemy nad tymi zagadnieniami:

  • Matematyczne podstawy sztucznej inteligencji i analizy danych
  • Wykrywanie i analiza treści szkodliwych w Internecie
  • Przetwarzanie i klasyfikacja dokumentów formalno-prawnych
  • Analiza procesów uczenia maszynowego i inteligencji maszynowej
  • Inżynieria uczenia i reprezentacji danych
  • Bezpieczeństwo, higiena i przejrzystość AI (BHP-AI)
  • Etyka i ewolucja AI
  • Analiza danych multimedialnych
  • Zastosowanie AI w cyberbezpieczeństwie, medycynie, biometrii, humanistyce cyfrowej i badaniach społecznych
  • Humanistyka cyfrowa

Wybrane publikacje

Artykuły

Weronika Gutfeter, Joanna Gajewska, Andrzej Pacut, "Detecting Sexually Explicit Content in the Context of the Child Sexual Abuse Materials (CSAM): End-to-End Classifiers and Region-Based Networks", International Workshops of ECML PKDD 2023, Turin, Italy, September 18–22, 2023, Revised Selected Papers, Part II, ECML PKDD 2023, 2025, 154-168.
Giuseppe Stragapede et al., "KVC-onGoing: Keystroke Verification Challenge", Pattern Recognition, , 2024, 111287.
Michał Nowak, Bartosz Bok, Artur Wilczek, Łukasz Oleksy, Mariusz Kamola, "Forecasting extremes of football players’ performance in matches", Scientific Reports, 14, 2024, 27319.
Katarzyna Dziewulska, Konrad Ciecierski, "Mobile Application for Skin Lesions Classification", Advanced, Contemporary Control: Proceedings of the XXI Polish Control Conference, Gliwice, Poland, red. Marek Pawelczyk, Dariusz Bismor, Szymon Ogonowski, Janusz Kacprzyk, Springer, Cham, 2023, 182-192.
Antonina Krajewska, Ewa Niewiadomska-Szynkiewicz, "Efficient Data Completion and Augmentation", 2024 IEEE 11th International Conference on Data Science and Advanced Analytics (DSAA), DSAA 2024, 2024, 1-10.
Mateusz Koryciński, Konrad Ciecierski, “Tractography methods in preoperative neurosurgical planning”, Journal of Telecommunications and Information Technology, 3, 2021, 78–85.
Weronika Gutfeter, Andrzej Pacut, "Proxy Embeddings for Face Identification among Multi-Pose Templates", Proceedings of the 15th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications, VISIGRAPP 2020, Vol. 5, 2020, 513-520.
Konrad Ciecierski, Tomasz S. Mandat, "Classification of DBS microelectrode recordings using a residual neural network with attention in the temporal domain", Neural Networks, 170, 2024, 18-31.
Victor Mandat, Pawel R. Zdunek, Bartosz Krolicki, Krzysztof Szalecki, Henryk M. Koziara, Konrad Ciecierski, Tomasz S. Mandat, "Periaqueductal/periventricular gray deep brain stimulation for the treatment of neuropathic facial pain", Frontiers in Neurology, 14, 2023, 1-8.
Tomasz Lehmann, Andrzej Pacut, Piotr Paziewski, “Face and silhouette based age estimation for child detection system”, Communication Papers of the of the 17th Conference on Computer Science and Intelligence Systems, 32, 2022, 39–43.
Weronika Gutfeter, Andrzej Pacut, “Fusion of Depth and Thermal Imaging for People Detection”, Journal of Telecommunications and Information Technology, 4, 2021, 53–60.
Kamila Lis, Wojciech Szynkiewicz, Ewa Niewiadomska-Szynkiewicz, Konrad Ciecierski, "Wykrywanie anomalii w zachowaniu robota usługowego z wykorzystaniem sieci LSTM", 16. Krajowa Konferencja Robotyki – Postępy robotyki, 197, 2022, 211–222.
Mohammadreza Azimi, Seyed Ahmad Rasoulinejad, Andrzej Pacut, “Age dependency of the diabetes effects on the iris recognition systems performance evaluation results”, Biomedical Engineering / Biomedizinische Technik, 66(1), 2021, 11–19.
Kamila Lis, Mateusz Koryciński, Konrad Ciecierski, "Classification of masked image data", PLOS One, 16(7), 2021, e0254181.
Mohammadreza Azimi, Andrzej Pacut, “The Effects of Social Issues and Human Factors on the Reliability of Biometric Systems: A Review”, Arai, K., Kapoor, S., Bhatia, R. (eds) Intelligent Systems and Applications. IntelliSys 2020. Advances in Intelligent Systems and Computing, vol. 1251. Springer, Cham, 2020, 103-110.
Mohammadreza Azimi, Andrzej Pacut, “Investigation into the reliability of facial recognition systems under the simultaneous influences of mood variation and makeup”, Computers and Electrical Engineering, 85, 2020, 1–15.
Ewelina Bartuzi, Mateusz Trokielewicz, "Multispectral hand features for secure biometric authentication systems. Concurrency and Computation", Concurrency and Computation: Practice and Experience, 33(18), 2021, 6471.
Inez Okulska, Anna Kołos, Krzysztof Skibski, "Gra w klasy, czyli analiza lingwistycznych cech idiopoetyki na marginesie automatycznej klasyfikacji utworów poetyckich i ich parodii", Biuletyn Polskiego Towarzystwa Językoznawczego, LXXIX (79), 2023, 239-257.
Inez Okulska, Anna Kołos, "Morfosyntaktyczna analiza przykładów mowy nienawiści zablokowanych przez moderatorów serwisu Wykop.pl", Tertium, 8(2), 2023, 54–71.
Anna Kołos, Inez Okulska, Kinga Głąbińska, Agnieszka Karlinska, Emilia Wiśnios, Paweł Ellerik, Andrzej Prałat, "BAN-PL: A Polish Dataset of Banned Harmful and Offensive Content from Wykop.pl Web Service", In: Calzolari N, Kan M-Y, Hoste V, Lenci A, Sakti S, Xue N, eds. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Torino, Italia: ELRA and ICCL, 2024, 2107–2118.
Daniel Ziembicki, Karolina Seweryn, Anna Wróblewska, "Polish Natural Language Inference and Factivity – an Expert-based Dataset and Benchmarks", Natural Language Engineering, 30(2), 2023, 385–416.
Anna Wróblewska, Bartosz Pieliński, Karolina Seweryn, Sylwia Sysko-Romańczuk, Karol Saputa, Aleksandra Wichrowska, Hanna Schreiber, "Automating the Analysis of Institutional Design in International Agreements", Computational Science – ICCS 2023, Lecture Notes in Computer Science, vol. 10475, red. Jiří Mikyška, Clélia de Mulatier, Maciej Paszynski, Valeria V. Krzhizhanovskaya, Jack J. Dongarra, Peter M.A. Sloot, 2023, Springer, Cham.
Agnieszka Karlinska, Cezary Rosiński, Marek Kubis, Patryk Hubar, Jan Wieczorek, "Using Bibliodata LODification to Create Metadata-Enriched Literary Corpora in Line with FAIR Principles", In: Calzolari N, Kan M-Y, Hoste V, Lenci A, Sakti S, Xue N, eds. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Torino, Italia: ELRA and ICCL, 2024, 17271–17284.
Dominik Filipiak, Andrzej Zapała, Piotr Tempczyk, Anna Fensel, Marek Cygan, "Polite Teacher: Semi-Supervised Instance Segmentation with Mutual Learning and Pseudo-Label Thresholding", IEEE Access, 2024:1, 2024, 37744-37756.