Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

PyData Bydgoszcz spotkanie 33 czwartek 06.03.2025 Młyny Rothera (Spichrz Zbożowy, 2. piętro), Mennica 10, Bydgoszcz Dr hab. Piotr Pęzik, prof. UŁ Jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim, autorem ponad 100 prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl, http://spokes.clarin-pl.eu/, http://monco-pl.clarin-pl.eu/, słowników frazeologicznych HASK EN i HASK PL. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun Wyszukiwarki PELCRA dla NKJP. Kierował pracą zespołu UŁ w projekcie PLLuM. Dr Agnieszka Karlińska Jest adiunktką w Ośrodku Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK PIB, gdzie zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli. Z ramienia NASK kierowała projektem PLLuM, którego celem było utworzenie polskiego dużego modelu językowego. Aktualnie zajmuje się m.in. kwestiami związanymi z wdrażaniem polskich LLM-ów w administracji publicznej. "Polskie duże modele językowe PLLuM” "Wystąpienie będzie poświęcone procesowi tworzenia polskich dużych modeli językowych dostosowanych do potrzeb administracji publicznej. Przedstawimy kluczowe aspekty prac nad modelami z rodziny PLLuM – od pozyskiwania danych uczących, przez pretrening (zarówno w wariancie jednojęzycznym, jak i w formie kontynuacji treningu w celu adaptacji językowej) i dostrajanie na instrukcjach (ang. instruction fine-tuning), po wychowanie (ang. alignment). Omówimy wyzwania metodologiczne pojawiające się na każdym z tych etapów oraz pokażemy, jak modele sprawdzają się w różnorodnych zadaniach. Zaprezentujemy również narzędzie do szybkiej konfiguracji i testowania systemów RAG oraz nasze podejście do walidacji zdolności wyszukiwawczych modeli." PyData Bydgoszcz https://www.meetup.com/PyData-Bydgoszcz [email protected]   / pydatabydgoszcz     / pydatabydgoszcz   #BydgoszczIT   / pydatabydgoszcz   Nagranie sponsorowane przez firmę Sii https://sii.pl Realizacja wideo: Jacek Owczarz Jack Jack Films +48 884 391 000

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI
▶︎

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ
▶︎

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

Will AI Replace Analysts? Data Analyst or Data Engineer? 🙈☠️ ANSWERING YOUR QUESTIONS
▶︎

Will AI Replace Analysts? Data Analyst or Data Engineer? 🙈☠️ ANSWERING YOUR QUESTIONS

Czas pracy - podsumowanie konferencji
▶︎

Czas pracy - podsumowanie konferencji

PLLuM: co potrafi polska AI?
▶︎

PLLuM: co potrafi polska AI?

Ukraina przegra wojnę? Miller: Konflikt z Polską jej zaszkodzi. "Kwaśniewski mnie skreślił”
▶︎

Ukraina przegra wojnę? Miller: Konflikt z Polską jej zaszkodzi. "Kwaśniewski mnie skreślił”

Das Entscheidungsproblem - Grenzen der Mathematik | Mathewelten | ARTE
▶︎

Das Entscheidungsproblem - Grenzen der Mathematik | Mathewelten | ARTE

Debate: Will AI take our jobs? | Andrzej Dragan, Dawid Myśliwiec, Petros Psyllos, Marcin Nowosad
▶︎

Debate: Will AI take our jobs? | Andrzej Dragan, Dawid Myśliwiec, Petros Psyllos, Marcin Nowosad

But what is the Fourier Transform?  A visual introduction.
▶︎

But what is the Fourier Transform? A visual introduction.

Transformacja cyfrowa uczelni
▶︎

Transformacja cyfrowa uczelni

What do tech pioneers think about the AI revolution? - The Engineers, BBC World Service
▶︎

What do tech pioneers think about the AI revolution? - The Engineers, BBC World Service

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)
▶︎

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

Czy AI zastąpi FIZYKÓW? Andrzej Dragan i Paweł Janowski | 88
▶︎

Czy AI zastąpi FIZYKÓW? Andrzej Dragan i Paweł Janowski | 88

Norwegia idzie na dno - Dlaczego jest w kryzysie?
▶︎

Norwegia idzie na dno - Dlaczego jest w kryzysie?

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)
▶︎

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

How to Actually Build Mobile Apps with AI in 2026 | A Complete Beginner's Tutorial
▶︎

How to Actually Build Mobile Apps with AI in 2026 | A Complete Beginner's Tutorial

Wiedza użyteczna. O badanich z dr Zofią Małkowicz | Webinar (napisy PL)
▶︎

Wiedza użyteczna. O badanich z dr Zofią Małkowicz | Webinar (napisy PL)

PLLuM - Polish Answer to ChatGPT and DeepSeek?
▶︎

PLLuM - Polish Answer to ChatGPT and DeepSeek?

6 feste Ausdrücke, die du im Deutschen brauchst (B2/C1)
▶︎

6 feste Ausdrücke, die du im Deutschen brauchst (B2/C1)

Excel for Finance and Accounting Full Course Tutorial (3+ Hours)
▶︎

Excel for Finance and Accounting Full Course Tutorial (3+ Hours)