Мичил Егоров — Вашей компании LLM не нужен? Построение инфраструктуры с нуля

Подробнее о конференции PiterPy: https://jrg.su/QZ6wK1 — — Скачать презентацию с сайта PiterPy — https://jrg.su/HxEN5z Подробно рассматриваем построение инфраструктуры для использования больших языковых моделей (LLM) с нуля, опираясь на опыт Х5 Tech. Спикер начал с объяснения, что такое LLM и почему они становятся все более важными для современных технологий. Обсудил ключевые компоненты, необходимые для создания масштабируемой и надежной инфраструктуры. Сравнил три популярных бэкенда для инференса LLM: llama-cpp, TGI и vLLM, выделяя их преимущества и недостатки. Особое внимание уделил подводным камням llama-cpp и рассмотрел, действительно ли vLLM — идеальное решение. Затронул тему информационного поиска и его связь с LLM — объяснил, как эти модели могут улучшить процессы поиска по базам знаний. В заключение показал, как заставить LLM писать качественный текст, на основе опыта внедрения чат-бота для сотрудников Пятерочки.

Valeria Petrenko: Are NumPy and PyTorch obsolete?

Valeria Petrenko: Are NumPy and PyTorch obsolete?

How Netflix Uses Java - 2026 Edition

How Netflix Uses Java - 2026 Edition

Я перестал мечтать и начал делать (вот что сработало)

Я перестал мечтать и начал делать (вот что сработало)

Что такое RAG в LLM и причём тут векторные базы данных

Что такое RAG в LLM и причём тут векторные базы данных

Артем Самойлов. Мультиагентные системы и автопромптинг

Артем Самойлов. Мультиагентные системы и автопромптинг

Построение инфраструктуры LLM с нуля на основе опыта Х5 Tech / Мичил Егоров

Построение инфраструктуры LLM с нуля на основе опыта Х5 Tech / Мичил Егоров

Александр Киверин — Оптимизация PostgreSQL-запросов: все, что нужно знать на практике

Александр Киверин — Оптимизация PostgreSQL-запросов: все, что нужно знать на практике

6 проектов, 0 сотрудников: мой второй мозг на Claude

6 проектов, 0 сотрудников: мой второй мозг на Claude

Анатолий Круглов — Рефакторинг больших сервисов

Анатолий Круглов — Рефакторинг больших сервисов

Три паттерна успешных внедрений проектов с LLM под капотом

Три паттерна успешных внедрений проектов с LLM под капотом

Как взять LLM за RAGа Доклад Александра Абрамова True Tech Day

Как взять LLM за RAGа Доклад Александра Абрамова True Tech Day

Я не верю, что Набиуллина вернется в Центробанк | Вячеслав Ширяев на Breakfast Show

Я не верю, что Набиуллина вернется в Центробанк | Вячеслав Ширяев на Breakfast Show

LLM в IT-командах: как ИИ влияет на код-ревью и продуктивность разработчиков

LLM в IT-командах: как ИИ влияет на код-ревью и продуктивность разработчиков

Building an LLM Infrastructure from Scratch Based on X5 Tech's Experience | Michiel Egorov

Building an LLM Infrastructure from Scratch Based on X5 Tech's Experience | Michiel Egorov

Исчезновение Набиуллиной: совпадений слишком много | Николай Корженевский на Breakfast Show

Исчезновение Набиуллиной: совпадений слишком много | Николай Корженевский на Breakfast Show

Это уже происходит. Как ИИ захватит мир?

Это уже происходит. Как ИИ захватит мир?

Устраиваюсь кодером НЕ УМЕЯ кодить [ Пранк работодателей ]

Устраиваюсь кодером НЕ УМЕЯ кодить [ Пранк работодателей ]

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50

Цепи Маркова — математика предсказаний [Veritasium]

Цепи Маркова — математика предсказаний [Veritasium]

Как один программист уничтожил монополию корпораций на видео

Как один программист уничтожил монополию корпораций на видео