Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф
Вы вдруг решили, что вам недостаточно LLaMA-2 и вы очень хотите сделать свою LLM. Где взять данные для предобучения? Большая часть проблем в воспроизведении результатов ChatGPT лежит именно в данных для предобучения. Модель берет все свои знания о мире с этапа претрейна, алаймент же позволяет их вытащить. Анатолий рассказал, какие есть тонкости и нюансы при подготовке датасетов для предобучения и что они уже сделали с командой. Наш телеграм: https://t.me/tinkoffai Дайджесты, статьи и анонсы митапов: https://t.me/itstinkoff Жизнь команда изнутри и вакансии по направлениям: https://t.me/tinkoffjobs Блог на Хабре: https://l.tinkoff.ru/habr-tinkoff #ai #ml #rl #тинькофф

▶︎
Алерон Миленкин | RAG и как его правильно готовить

▶︎
Введение в большие языковые модели (LLM)

▶︎
В чем особенности автоматизации поддержки в банке — Ирина Степанюк, Тинькофф

▶︎
Что такое RAG в LLM и причём тут векторные базы данных

▶︎
ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

▶︎
Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь

▶︎
How the NLP Research team works after the release of GPT-4 — Daniil Gavrilov, Tinkoff

▶︎
Использование LLM в разметке данных

▶︎
MCP and browser usage with local LLM. LM Studio

▶︎
Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

▶︎
Как работают LLM: DeepSeek, ChatGPT и другие? — Ивар ft. Михаил Бурцев | Мыслить как ученый #6

▶︎
Экономика LLM: что надо и сколько стоит использование больших языковых моделей

▶︎
RAG для чайников: делаем модель умнее за 15 минут

▶︎
Как приручить LLM?

▶︎
Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды

▶︎
Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)

▶︎
Самое простое объяснение нейросети

▶︎
Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

▶︎
LLM + RAG: ингредиенты приготовления умного ИИ-ассистента

▶︎
