Мичил Егоров — Вашей компании LLM не нужен? Построение инфраструктуры с нуля

Подробнее о конференции PiterPy: https://jrg.su/QZ6wK1 — — Скачать презентацию с сайта PiterPy — https://jrg.su/HxEN5z Подробно рассматриваем построение инфраструктуры для использования больших языковых моделей (LLM) с нуля, опираясь на опыт Х5 Tech. Спикер начал с объяснения, что такое LLM и почему они становятся все более важными для современных технологий. Обсудил ключевые компоненты, необходимые для создания масштабируемой и надежной инфраструктуры. Сравнил три популярных бэкенда для инференса LLM: llama-cpp, TGI и vLLM, выделяя их преимущества и недостатки. Особое внимание уделил подводным камням llama-cpp и рассмотрел, действительно ли vLLM — идеальное решение. Затронул тему информационного поиска и его связь с LLM — объяснил, как эти модели могут улучшить процессы поиска по базам знаний. В заключение показал, как заставить LLM писать качественный текст, на основе опыта внедрения чат-бота для сотрудников Пятерочки.

Valeria Petrenko: Are NumPy and PyTorch obsolete?
▶︎

Valeria Petrenko: Are NumPy and PyTorch obsolete?

How Netflix Uses Java - 2026 Edition
▶︎

How Netflix Uses Java - 2026 Edition

Я перестал мечтать и начал делать (вот что сработало)
▶︎

Я перестал мечтать и начал делать (вот что сработало)

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

Артем Самойлов. Мультиагентные системы и автопромптинг
▶︎

Артем Самойлов. Мультиагентные системы и автопромптинг

Построение инфраструктуры LLM с нуля на основе опыта Х5 Tech / Мичил Егоров
▶︎

Построение инфраструктуры LLM с нуля на основе опыта Х5 Tech / Мичил Егоров

Александр Киверин — Оптимизация PostgreSQL-запросов: все, что нужно знать на практике
▶︎

Александр Киверин — Оптимизация PostgreSQL-запросов: все, что нужно знать на практике

6 проектов, 0 сотрудников: мой второй мозг на Claude
▶︎

6 проектов, 0 сотрудников: мой второй мозг на Claude

Анатолий Круглов — Рефакторинг больших сервисов
▶︎

Анатолий Круглов — Рефакторинг больших сервисов

Три паттерна успешных внедрений проектов с LLM под капотом
▶︎

Три паттерна успешных внедрений проектов с LLM под капотом

Как взять LLM за RAGа  Доклад Александра Абрамова True Tech Day
▶︎

Как взять LLM за RAGа Доклад Александра Абрамова True Tech Day

Я не верю, что Набиуллина вернется в Центробанк | Вячеслав Ширяев на Breakfast Show
▶︎

Я не верю, что Набиуллина вернется в Центробанк | Вячеслав Ширяев на Breakfast Show

LLM в IT-командах: как ИИ влияет на код-ревью и продуктивность разработчиков
▶︎

LLM в IT-командах: как ИИ влияет на код-ревью и продуктивность разработчиков

Building an LLM Infrastructure from Scratch Based on X5 Tech's Experience | Michiel Egorov
▶︎

Building an LLM Infrastructure from Scratch Based on X5 Tech's Experience | Michiel Egorov

Исчезновение Набиуллиной: совпадений слишком много | Николай Корженевский на Breakfast Show
▶︎

Исчезновение Набиуллиной: совпадений слишком много | Николай Корженевский на Breakfast Show

Это уже происходит. Как ИИ захватит мир?
▶︎

Это уже происходит. Как ИИ захватит мир?

Устраиваюсь кодером НЕ УМЕЯ кодить [ Пранк работодателей ]
▶︎

Устраиваюсь кодером НЕ УМЕЯ кодить [ Пранк работодателей ]

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50
▶︎

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50

Цепи Маркова — математика предсказаний [Veritasium]
▶︎

Цепи Маркова — математика предсказаний [Veritasium]

Как один программист уничтожил монополию корпораций на видео
▶︎

Как один программист уничтожил монополию корпораций на видео