Nowy wariant polskiego modelu AI. PLLuM lepiej zabezpieczony i gotowy do zadań urzędowych

NASK zaprezentował nowy wariant polskiego dużego modelu językowego PLLuM, dostosowany do zadań administracyjnych i lepiej chroniony przed cyberatakami. Model jest dostępny publicznie w trzech wersjach.

Lepszy zbiór danych i większe bezpieczeństwo

Nowy wariant modelu PLLuM-12B-nc-250715 został opublikowany w środę przez Państwowy Instytut Badawczy NASK. Jak przekazano w oficjalnym komunikacie, model powstał na bazie większego i lepiej przygotowanego zbioru danych, a jego zastosowania obejmują m.in. zadania administracyjne. Model trenowano m.in. na materiałach z domeny gov.pl, Biuletynu Informacji Publicznej oraz Biblioteki Nauki.

Dane wykorzystywane do treningu zbierane były z poszanowaniem polskiego i europejskiego prawa — podkreśliła dr Agnieszka Karlińska z Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK. Model PLLuM dostępny jest w trzech wariantach: bazowym, instrukcyjnym i „wychowanym”. Ten ostatni to najbardziej zaawansowana wersja, która została wyposażona w dodatkowe mechanizmy bezpieczeństwa.

„Wychowana” wersja modelu bazuje na zbiorach zapytań i odpowiedzi ocenianych przez ludzi, co zwiększa jej precyzję i bezpieczeństwo działania. Wszystkie wersje nowego modelu można pobrać po wypełnieniu formularza na platformie Hugging Face.

Odpowiedź na zagrożenia i potrzeby urzędów

Zespół projektu HIVE AI, odpowiedzialny za rozwój PLLuM, opracował metodologię tworzenia danych syntetycznych. Dane te powstają z udziałem innych modeli, ale są weryfikowane przez ludzi. Pozwala to uzyskać bardziej adekwatne odpowiedzi, dostosowane do polskiego kontekstu kulturowego — zaznaczył dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego i kierownik operacyjny projektu.

Model został też przetestowany pod kątem podatności na tzw. ataki promptowe (prompt injection). Skuteczność takich ataków udało się ograniczyć do 2–3 przypadków na 100 prób, co jest wynikiem lepszym niż w innych otwartych modelach AI — poinformował NASK.

Dr Karlińska zapowiedziała, że wkrótce zaprezentowany zostanie kolejny produkt w ramach projektu — prototyp obywatelskiego czatbota. Jego zadaniem będzie wspieranie badaczy w zbieraniu zapytań do wdrożeń modeli PLLuM, m.in. w aplikacji mObywatel.

Kolejne produkty w przygotowaniu

PLLuM to polskojęzyczny model językowy przeznaczony do zastosowań w administracji publicznej, nauce i sektorze prywatnym. Udostępniony został po raz pierwszy w lutym 2025 r.

Za jego rozwój odpowiada konsorcjum HIVE AI, powołane przez Ministerstwo Cyfryzacji. Tworzą je polskie instytucje naukowe i podmioty cyfrowe, a liderem projektu jest Państwowy Instytut Badawczy NASK. NASK poinformował, że kolejne premiery w ramach konsorcjum HIVE AI zostaną ogłoszone w nadchodzących tygodniach. Szczegóły dotyczące dostępności i działania modelu można znaleźć na platformie Hugging Face.

Źródło: PAP