Polski model językowy PLLuM opublikowany

24.02.2025

Asystent SI oparty na polskim modelu językowym PLLuM jest już dostępny dla internautów. Model ma oddawać złożoność języka polskiego, a także być wolny od treści szkodliwych i nieprawdziwych. NASK współtworzył konsorcjum, które pracowało nad modelem, a teraz przejmuje rolę lidera projektu.

Logotyp projektu PLLuM

Powstały w wyniku rocznych prac konsorcjum na zlecenie Ministerstwa Cyfryzacji model jest elastyczny i skalowalny – opublikowane zostały wersje wykorzystujące od 8 do 70 miliardów parametrów. Bazuje na etycznie pozyskanych danych – dane treningowe były wykorzystane zgodnie z przepisami o prawie autorskim lub ich właściciele udzielili licencji na ich wykorzystanie. Nad jakością odpowiedzi udzielanych przez PLLuM pracował kilkudziesięcioosobowy zespół anotatorów i anotatorek. Między innymi dzięki temu PLLuM jest modelem bezpiecznym i wolnym od szkodliwych treści.

 

“Kluczową rolę w projekcie pełnią weryfikatorzy. Dzięki ich pracy wiemy czy model rzeczywiście odpowiada tak, jakbyśmy tego chcieli. Czy nie generuje treści szkodliwych, czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał, np. jak skonstruować bombę. NASK miał tutaj ogromny wkład dzięki doświadczeniu naszych ekspertów. Specjalizujemy się w cyberbezpieczeństwie, mamy doświadczenie w pracy z treściami szkodliwymi. Nasz zespół jest dosyć mocno multidyscyplinarny. Są w nim zarówno programiści, prawnicy i ludzie, którzy z tymi treściami szkodliwymi mieli do czynienia.” – wyjaśnia prof. Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji w NASK.

 

Dzięki dostosowaniu do specyfiki języka polskiego, jak również terminologii administracji publicznej, PLLuM znajdzie szerokie zastosowanie w sektorze publicznym. Projekt wchodzi w fazę wdrożeniową, która doprowadzi do powstania asystenta dla urzędników, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli i obywatelek. Możliwe będą wdrożenia dla konkretnych urzędów, dostosowane do ich szczególnych potrzeb i specyfiki. Asystent w mObywatelu wesprze z kolei obywateli i obywatelki w uzyskiwaniu informacji publicznych.

 

W tej nowej fazie projektu NASK przejmuje funkcję lidera konsorcjum zwanego od teraz HIVE. Poza instytutem NASK, konsorcjum nadal współtworzą Politechnika Wrocławska, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, Ośrodek Przetwarzania Informacji (OPI-PIB) oraz Uniwersytet Łódzki. Do zespołu dołączają też dwaj nowi partnerzy: Centralny Ośrodek Informatyki, wdrażający model dla urzędników i w mObywatelu, oraz Akademickie Centrum Komputerowe CYFRONET AGH, które dostarczy swoich mocy obliczeniowych.

 

Wypróbuj PLLuM Chat

Pobierz modele z Hugging Face