Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

Это доклад Ирины Барской, руководителя службы аналитики и исследований в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Екатерина рассмотрела важную проблему: почему чем лучше становятся LLM-модели, тем сложнее построить систему оценки их качества. Из доклада узнали, как с этим жить: как строить метрики, какие бенчмарки самые правильные и надёжные, нужны ли нам эксперты и как выстраивать процессы разметки данных. Подписывайтесь на телеграм-канал Яндекса для ML-специалистов: https://t.me/yandexforml

(Un)Real Data — Synthetic Data Generation | Daria Andreeva, X5 Tech

(Un)Real Data — Synthetic Data Generation | Daria Andreeva, X5 Tech

AI в действии | Юридическая сторона использования AI

AI в действии | Юридическая сторона использования AI

AI-инструмент для разработчика: как мы обучали LLM кодить | Виктор Плошихин, Yandex Infrastructure

AI-инструмент для разработчика: как мы обучали LLM кодить | Виктор Плошихин, Yandex Infrastructure

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

Вызовы стоматологического бизнеса в 2026 году: налоги, финансы, маркетинг и автоматизация

Вызовы стоматологического бизнеса в 2026 году: налоги, финансы, маркетинг и автоматизация

1970s Inspired French Pop | Slow Parisian Cafe Vibes | Chanson Aura

1970s Inspired French Pop | Slow Parisian Cafe Vibes | Chanson Aura

Гений коммуникации. Нина Зверева о правиле 8 секунд, ошибках и формуле успешного выступления

Гений коммуникации. Нина Зверева о правиле 8 секунд, ошибках и формуле успешного выступления

Что такое RAG в LLM и причём тут векторные базы данных

Что такое RAG в LLM и причём тут векторные базы данных

Рекомендательные системы: сложности разработки и пути решения | Пётр Чуйков, HeadHunter

Рекомендательные системы: сложности разработки и пути решения | Пётр Чуйков, HeadHunter

Самое глубокое интервью об ИИ: Суцкевер о природе разума, эволюции и машинном сознании

Самое глубокое интервью об ИИ: Суцкевер о природе разума, эволюции и машинном сознании

Vladimir Surdin on the most incredible discoveries in space // Science. Let's talk?

Vladimir Surdin on the most incredible discoveries in space // Science. Let's talk?

Революционная ситуация: признаки. Статус S09E42

Революционная ситуация: признаки. Статус S09E42

AI for the Little Ones: How LLM and AI Agent Work

AI for the Little Ones: How LLM and AI Agent Work

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial

Andrew Ng: Building Faster with AI

Andrew Ng: Building Faster with AI

How AI DECEIVES HUMANS | Roman Yampolskiy

How AI DECEIVES HUMANS | Roman Yampolskiy

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

Алёна Зайцева | Как мы делали умного помощника в Лавке на основе YaGPT

Алёна Зайцева | Как мы делали умного помощника в Лавке на основе YaGPT

Как один программист уничтожил монополию корпораций на видео

Как один программист уничтожил монополию корпораций на видео

Karpathy показал, как Claude сам строит базу знаний

Karpathy показал, как Claude сам строит базу знаний