Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф

Вы вдруг решили, что вам недостаточно LLaMA-2 и вы очень хотите сделать свою LLM. Где взять данные для предобучения? Большая часть проблем в воспроизведении результатов ChatGPT лежит именно в данных для предобучения. Модель берет все свои знания о мире с этапа претрейна, алаймент же позволяет их вытащить. Анатолий рассказал, какие есть тонкости и нюансы при подготовке датасетов для предобучения и что они уже сделали с командой. Наш телеграм: https://t.me/tinkoffai Дайджесты, статьи и анонсы митапов: https://t.me/itstinkoff Жизнь команда изнутри и вакансии по направлениям: https://t.me/tinkoffjobs Блог на Хабре: https://l.tinkoff.ru/habr-tinkoff #ai #ml #rl #тинькофф

Алерон Миленкин | RAG и как его правильно готовить

Алерон Миленкин | RAG и как его правильно готовить

Введение в большие языковые модели (LLM)

Введение в большие языковые модели (LLM)

В чем особенности автоматизации поддержки в банке — Ирина Степанюк, Тинькофф

В чем особенности автоматизации поддержки в банке — Ирина Степанюк, Тинькофф

Что такое RAG в LLM и причём тут векторные базы данных

Что такое RAG в LLM и причём тут векторные базы данных

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь

How the NLP Research team works after the release of GPT-4 — Daniil Gavrilov, Tinkoff

How the NLP Research team works after the release of GPT-4 — Daniil Gavrilov, Tinkoff

Использование LLM в разметке данных

Использование LLM в разметке данных

MCP and browser usage with local LLM. LM Studio

MCP and browser usage with local LLM. LM Studio

Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Как работают LLM: DeepSeek, ChatGPT и другие? — Ивар ft. Михаил Бурцев | Мыслить как ученый #6

Как работают LLM: DeepSeek, ChatGPT и другие? — Ивар ft. Михаил Бурцев | Мыслить как ученый #6

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

RAG для чайников: делаем модель умнее за 15 минут

RAG для чайников: делаем модель умнее за 15 минут

Как приручить LLM?

Как приручить LLM?

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)

Самое простое объяснение нейросети

Самое простое объяснение нейросети

Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

LLM + RAG: ингредиенты приготовления умного ИИ-ассистента

LLM + RAG: ингредиенты приготовления умного ИИ-ассистента

Протоколы без боли: как мы делали автоматическое протоколирование в X5

Протоколы без боли: как мы делали автоматическое протоколирование в X5