Arenadata. Локальные LLM в реальных задачах

Недавно выступил на Arenaday 2025 с докладом о том, как мы в Arenadata используем локальные языковые модели (LLM) для решения реальных бизнес-задач. Поделюсь ключевыми инсайтами и современными подходами. 🔹 Почему локальные модели? Локальные опенсорсные модели стали популярны не случайно. Три ключевых преимущества: ✅ Безопасность корпоративных данных — никакие данные не покидают периметр компании. ✅ Независимость от внешних поставщиков — полный контроль над инфраструктурой. ✅ Специализация под задачи — модель заточена под конкретный домен. Мы активно используем квантизованную модель Qwen2.5 с 70 миллиардами параметров. 🔹 Структурированный вывод: решение проблемы "творческих" LLM Одна из главных проблем языковых моделей — их непредсказуемость. Для продакшена нужны четкие, структурированные ответы. ✅ Constrained Decoding и Structured Output позволяют генерировать ответы строго по заданной JSON-схеме. Используя Pydantic-классы, мы определяем структуру данных, а библиотека Outlines обеспечивает соблюдение формата на уровне токенов. Кейс 1: Классификация входящих писем Автоматизировали сортировку писем на info@arenadata с помощью подходов Chain of Thought и Structured Output: 🔹 Модель анализирует признаки письма. 🔹 Формирует цепочку рассуждений. 🔹 Выдает структурированный результат с категорией и уровнем уверенности. Результат: предсказуемая классификация с прозрачной логикой. Кейс 2: Автоматизация подбора корпоративных подарков Создали мультиагентную систему из трех специализированных агентов: 🔹 Planner Agent — координатор, анализирует и делегирует задачи. 🔹 Gift Recommender Agent — эксперт по подаркам с инструментами поиска и бронирования. 🔹 Text-to-SQL Agent — специалист по работе с базами данных. Ключевой инсайт: агенты обмениваются структурированными командами и SQL-запросами, избегая переполнения контекста. 🔹 Практические выводы ✅ Структурированный вывод критически важен для промышленного использования LLM. ✅ Агентская архитектура эффективнее монолитных решений для сложных задач. ✅ Управление контекстом — ключ к масштабируемости систем с LLM. ✅ Локальные модели дают контроль и безопасность без потери качества.

Что такое RAG в LLM и причём тут векторные базы данных

Что такое RAG в LLM и причём тут векторные базы данных

Владимир Харин. 1С и AI: от хайпа к практике. Создаем MCP-сервер для интеграции ваших баз с LLM

Владимир Харин. 1С и AI: от хайпа к практике. Создаем MCP-сервер для интеграции ваших баз с LLM

Как на самом деле выглядит работа в IT | Один день из жизни программиста

Как на самом деле выглядит работа в IT | Один день из жизни программиста

ПРОСТО О СЛОЖНОМ. ARENADATA. КАК БИЗНЕС РАНЬШЕ ВООБЩЕ СПРАВЛЯЛСЯ БЕЗ ЭТИХ ТЕХНОЛОГИЙ?

ПРОСТО О СЛОЖНОМ. ARENADATA. КАК БИЗНЕС РАНЬШЕ ВООБЩЕ СПРАВЛЯЛСЯ БЕЗ ЭТИХ ТЕХНОЛОГИЙ?

Локальные нейросети для корпоративных нужд - Гейст Константин, iSpring

Локальные нейросети для корпоративных нужд - Гейст Константин, iSpring

Using Large Language Models | Build Your Own LLM Workshop #1

Using Large Language Models | Build Your Own LLM Workshop #1

Пишем код с локальной LLM | AI-assisted coding | Настраиваем LMStudio | Результат

Пишем код с локальной LLM | AI-assisted coding | Настраиваем LMStudio | Результат

Локальные LLM для разработки. Как упростить рутинные действия и не расстраивать ИБ / Виктор Ниденс

Локальные LLM для разработки. Как упростить рутинные действия и не расстраивать ИБ / Виктор Ниденс

Родион Мостовой - Решение сложных задач через LLM + AI Code Review - AI Driven Development @MOST IT

Родион Мостовой - Решение сложных задач через LLM + AI Code Review - AI Driven Development @MOST IT

Секреты сборки компьютера для инференса LLM. Нейросети запускаем локально.

Секреты сборки компьютера для инференса LLM. Нейросети запускаем локально.

Дмитрий Аношин — Два типа инженеров данных

Дмитрий Аношин — Два типа инженеров данных

Paid LLM vs. Local Model on a Home Laptop – Is There a Big Difference?

Paid LLM vs. Local Model on a Home Laptop – Is There a Big Difference?

Теоретический туториал: Как учить большие языковые модели

Теоретический туториал: Как учить большие языковые модели

ТСП: Твой личный AI. Как и зачем создаются offline LLM.

ТСП: Твой личный AI. Как и зачем создаются offline LLM.

LLM scaling hits limits: MIT study

LLM scaling hits limits: MIT study

How to choose infrastructure for LLM? From hardware selection to working in Kubernetes 💥

How to choose infrastructure for LLM? From hardware selection to working in Kubernetes 💥

GraphRAG: The Marriage of Knowledge Graphs and RAG: Emil Eifrem

GraphRAG: The Marriage of Knowledge Graphs and RAG: Emil Eifrem

От PostgreSQL к Arenadata DB // Курс «Greenplum для разработчиков и архитекторов баз данных»

От PostgreSQL к Arenadata DB // Курс «Greenplum для разработчиков и архитекторов баз данных»

Local LLMs for Coding on a Low-End PC: What Really Works

Local LLMs for Coding on a Low-End PC: What Really Works

Что есть кроме ChatGPT и как это готовить: разворачиваем локальные LLM у себя на компьютере!

Что есть кроме ChatGPT и как это готовить: разворачиваем локальные LLM у себя на компьютере!