Теоретический туториал: Как учить большие языковые модели

Обзор основных идей создания LLM. Поговорили про данные, особенности архитектур, этапы обучения и методы его масштабирования. Туториал будет интересен специалистам в ML и DL, которые не занимаются обучением LLM или только погружаются в эту тему. Спикер: Мурат Апишев, техлид поиска в Samokat.tech, ex-SberDevices, ex-Just AI, ex-Yandex Модератор: Петр Гусев ML Lead в Deliveroo, экс-Яндекс: MLE в команде рекомендаций Яндекс.Медиасервисов 00:00 Знакомство 01:45 Сейчас "LLM" ≈ "AI" 03:25 Языковое моделирование 05:05 Промптинг LLM 09:55 Архитектура 26:00 Токенизация 31:35 Позиционное кодирование 34:47 Этапы обучения и Данные для обучения 51:15 Баланс между параметрами и данными 54:30 Масштабирование обучения 01:02:40 Эффективность обучения 01:15:10 Алгоритмы оптимизации 01:17:35 Эффективность дообучения 01:20:50 Качество генерации 01:23:30 Архитектура 01:27:40 Масштабирование обучения 01:27:50 Обработка длинного контекста 01:30:45 Мультимодальность 01:30:55 Оценка качества LLM __________ Подписывайся на наши соц. сети: LinkedIn UnionVK:   / unionvk   Instagram UnionVK:   / unionvk_   LinkedIn YNDX Family:   / yndx-family   Instagram YNDX Family:   / yndxfamily   #vk #яндекс #llm #ai #языковыемодели

Круглый стол "Voice Tech: cинтез и распознавание речи"
▶︎

Круглый стол "Voice Tech: cинтез и распознавание речи"

Занятие 4. Семинар. Классификация текстов. Предобученные модели и huggingface.
▶︎

Занятие 4. Семинар. Классификация текстов. Предобученные модели и huggingface.

System Design Explained: APIs, Databases, Caching, CDNs, Load Balancing & Production Infra
▶︎

System Design Explained: APIs, Databases, Caching, CDNs, Load Balancing & Production Infra

Мастерство промпт-инжиниринга
▶︎

Мастерство промпт-инжиниринга

Как работают большие языковые модели (LLM)
▶︎

Как работают большие языковые модели (LLM)

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

Экономика LLM: что надо и сколько стоит использование больших языковых моделей
▶︎

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

Using Large Language Models | Build Your Own LLM Workshop #1
▶︎

Using Large Language Models | Build Your Own LLM Workshop #1

Как бэкенд Толоки выбирает задания для исполнителей
▶︎

Как бэкенд Толоки выбирает задания для исполнителей

Введение в большие языковые модели (LLM)
▶︎

Введение в большие языковые модели (LLM)

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать
▶︎

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

Как работают LLM: DeepSeek, ChatGPT и другие?  — Ивар ft. Михаил Бурцев | Мыслить как ученый #6
▶︎

Как работают LLM: DeepSeek, ChatGPT и другие? — Ивар ft. Михаил Бурцев | Мыслить как ученый #6

Методы дообучения LLM (LoRA)
▶︎

Методы дообучения LLM (LoRA)

Как готовятся  данные для машинного обучения?
▶︎

Как готовятся данные для машинного обучения?

Мурат Апишев | Как обучать большие языковые модели
▶︎

Мурат Апишев | Как обучать большие языковые модели

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial
▶︎

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial

Building an AI Dark Factory:  A Codebase That Writes Its Own Code, Live
▶︎

Building an AI Dark Factory: A Codebase That Writes Its Own Code, Live

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)
▶︎

Обучение LLM: сбор данных и кодирование. Лекция от Andrej Karpathy (23 ноября 2023)

Открытые модели и их обучение
▶︎

Открытые модели и их обучение

Power Automate Beginner to Pro Tutorial [Full Course]
▶︎

Power Automate Beginner to Pro Tutorial [Full Course]