Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

PyData Bydgoszcz spotkanie 33 czwartek 06.03.2025 Młyny Rothera (Spichrz Zbożowy, 2. piętro), Mennica 10, Bydgoszcz Dr hab. Piotr Pęzik, prof. UŁ Jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim, autorem ponad 100 prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl, http://spokes.clarin-pl.eu/, http://monco-pl.clarin-pl.eu/, słowników frazeologicznych HASK EN i HASK PL. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun Wyszukiwarki PELCRA dla NKJP. Kierował pracą zespołu UŁ w projekcie PLLuM. Dr Agnieszka Karlińska Jest adiunktką w Ośrodku Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK PIB, gdzie zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli. Z ramienia NASK kierowała projektem PLLuM, którego celem było utworzenie polskiego dużego modelu językowego. Aktualnie zajmuje się m.in. kwestiami związanymi z wdrażaniem polskich LLM-ów w administracji publicznej. "Polskie duże modele językowe PLLuM” "Wystąpienie będzie poświęcone procesowi tworzenia polskich dużych modeli językowych dostosowanych do potrzeb administracji publicznej. Przedstawimy kluczowe aspekty prac nad modelami z rodziny PLLuM – od pozyskiwania danych uczących, przez pretrening (zarówno w wariancie jednojęzycznym, jak i w formie kontynuacji treningu w celu adaptacji językowej) i dostrajanie na instrukcjach (ang. instruction fine-tuning), po wychowanie (ang. alignment). Omówimy wyzwania metodologiczne pojawiające się na każdym z tych etapów oraz pokażemy, jak modele sprawdzają się w różnorodnych zadaniach. Zaprezentujemy również narzędzie do szybkiej konfiguracji i testowania systemów RAG oraz nasze podejście do walidacji zdolności wyszukiwawczych modeli." PyData Bydgoszcz https://www.meetup.com/PyData-Bydgoszcz [email protected] / pydatabydgoszcz / pydatabydgoszcz #BydgoszczIT / pydatabydgoszcz Nagranie sponsorowane przez firmę Sii https://sii.pl Realizacja wideo: Jacek Owczarz Jack Jack Films +48 884 391 000

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

Will AI Replace Analysts? Data Analyst or Data Engineer? 🙈☠️ ANSWERING YOUR QUESTIONS

Will AI Replace Analysts? Data Analyst or Data Engineer? 🙈☠️ ANSWERING YOUR QUESTIONS

Czas pracy - podsumowanie konferencji

Czas pracy - podsumowanie konferencji

PLLuM: co potrafi polska AI?

PLLuM: co potrafi polska AI?

Ukraina przegra wojnę? Miller: Konflikt z Polską jej zaszkodzi. "Kwaśniewski mnie skreślił”

Ukraina przegra wojnę? Miller: Konflikt z Polską jej zaszkodzi. "Kwaśniewski mnie skreślił”

Das Entscheidungsproblem - Grenzen der Mathematik | Mathewelten | ARTE

Das Entscheidungsproblem - Grenzen der Mathematik | Mathewelten | ARTE

Debate: Will AI take our jobs? | Andrzej Dragan, Dawid Myśliwiec, Petros Psyllos, Marcin Nowosad

Debate: Will AI take our jobs? | Andrzej Dragan, Dawid Myśliwiec, Petros Psyllos, Marcin Nowosad

But what is the Fourier Transform? A visual introduction.

But what is the Fourier Transform? A visual introduction.

Transformacja cyfrowa uczelni

Transformacja cyfrowa uczelni

What do tech pioneers think about the AI revolution? - The Engineers, BBC World Service

What do tech pioneers think about the AI revolution? - The Engineers, BBC World Service

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

Czy AI zastąpi FIZYKÓW? Andrzej Dragan i Paweł Janowski | 88

Czy AI zastąpi FIZYKÓW? Andrzej Dragan i Paweł Janowski | 88

Norwegia idzie na dno - Dlaczego jest w kryzysie?

Norwegia idzie na dno - Dlaczego jest w kryzysie?

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

How to Actually Build Mobile Apps with AI in 2026 | A Complete Beginner's Tutorial

How to Actually Build Mobile Apps with AI in 2026 | A Complete Beginner's Tutorial

Wiedza użyteczna. O badanich z dr Zofią Małkowicz | Webinar (napisy PL)

Wiedza użyteczna. O badanich z dr Zofią Małkowicz | Webinar (napisy PL)

PLLuM - Polish Answer to ChatGPT and DeepSeek?

PLLuM - Polish Answer to ChatGPT and DeepSeek?

6 feste Ausdrücke, die du im Deutschen brauchst (B2/C1)

6 feste Ausdrücke, die du im Deutschen brauchst (B2/C1)

Excel for Finance and Accounting Full Course Tutorial (3+ Hours)

Excel for Finance and Accounting Full Course Tutorial (3+ Hours)