Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф

Вы вдруг решили, что вам недостаточно LLaMA-2 и вы очень хотите сделать свою LLM. Где взять данные для предобучения? Большая часть проблем в воспроизведении результатов ChatGPT лежит именно в данных для предобучения. Модель берет все свои знания о мире с этапа претрейна, алаймент же позволяет их вытащить. Анатолий рассказал, какие есть тонкости и нюансы при подготовке датасетов для предобучения и что они уже сделали с командой. Наш телеграм: https://t.me/tinkoffai Дайджесты, статьи и анонсы митапов: https://t.me/itstinkoff Жизнь команда изнутри и вакансии по направлениям: https://t.me/tinkoffjobs Блог на Хабре: https://l.tinkoff.ru/habr-tinkoff #ai #ml #rl #тинькофф

Алерон Миленкин | RAG и как его правильно готовить
▶︎

Алерон Миленкин | RAG и как его правильно готовить

Введение в большие языковые модели (LLM)
▶︎

Введение в большие языковые модели (LLM)

В чем особенности автоматизации поддержки в банке — Ирина Степанюк, Тинькофф
▶︎

В чем особенности автоматизации поддержки в банке — Ирина Степанюк, Тинькофф

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat
▶︎

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь
▶︎

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь

How the NLP Research team works after the release of GPT-4 — Daniil Gavrilov, Tinkoff
▶︎

How the NLP Research team works after the release of GPT-4 — Daniil Gavrilov, Tinkoff

Использование LLM в разметке данных
▶︎

Использование LLM в разметке данных

MCP and browser usage with local LLM. LM Studio
▶︎

MCP and browser usage with local LLM. LM Studio

Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?
▶︎

Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Как работают LLM: DeepSeek, ChatGPT и другие?  — Ивар ft. Михаил Бурцев | Мыслить как ученый #6
▶︎

Как работают LLM: DeepSeek, ChatGPT и другие? — Ивар ft. Михаил Бурцев | Мыслить как ученый #6

Экономика LLM: что надо и сколько стоит использование больших языковых моделей
▶︎

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

RAG для чайников: делаем модель умнее за 15 минут
▶︎

RAG для чайников: делаем модель умнее за 15 минут

Как приручить LLM?
▶︎

Как приручить LLM?

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды
▶︎

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)
▶︎

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)

Самое простое объяснение нейросети
▶︎

Самое простое объяснение нейросети

Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск
▶︎

Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

LLM + RAG: ингредиенты приготовления умного ИИ-ассистента
▶︎

LLM + RAG: ингредиенты приготовления умного ИИ-ассистента

Протоколы без боли: как мы делали автоматическое протоколирование в X5
▶︎

Протоколы без боли: как мы делали автоматическое протоколирование в X5