Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск

Это доклад Ирины Барской, руководителя службы аналитики и исследований в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Екатерина рассмотрела важную проблему: почему чем лучше становятся LLM-модели, тем сложнее построить систему оценки их качества. Из доклада узнали, как с этим жить: как строить метрики, какие бенчмарки самые правильные и надёжные, нужны ли нам эксперты и как выстраивать процессы разметки данных. Подписывайтесь на телеграм-канал Яндекса для ML-специалистов: https://t.me/yandexforml

(Un)Real Data — Synthetic Data Generation | Daria Andreeva, X5 Tech
▶︎

(Un)Real Data — Synthetic Data Generation | Daria Andreeva, X5 Tech

AI в действии | Юридическая сторона использования AI
▶︎

AI в действии | Юридическая сторона использования AI

AI-инструмент для разработчика: как мы обучали LLM кодить | Виктор Плошихин, Yandex Infrastructure
▶︎

AI-инструмент для разработчика: как мы обучали LLM кодить | Виктор Плошихин, Yandex Infrastructure

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис
▶︎

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

Вызовы стоматологического бизнеса в 2026 году: налоги, финансы, маркетинг и автоматизация
▶︎

Вызовы стоматологического бизнеса в 2026 году: налоги, финансы, маркетинг и автоматизация

1970s Inspired French Pop | Slow Parisian Cafe Vibes | Chanson Aura
▶︎

1970s Inspired French Pop | Slow Parisian Cafe Vibes | Chanson Aura

Гений коммуникации. Нина Зверева о правиле 8 секунд, ошибках и формуле успешного выступления
▶︎

Гений коммуникации. Нина Зверева о правиле 8 секунд, ошибках и формуле успешного выступления

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

Рекомендательные системы: сложности разработки и пути решения | Пётр Чуйков, HeadHunter
▶︎

Рекомендательные системы: сложности разработки и пути решения | Пётр Чуйков, HeadHunter

Самое глубокое интервью об ИИ: Суцкевер о природе разума, эволюции и машинном сознании
▶︎

Самое глубокое интервью об ИИ: Суцкевер о природе разума, эволюции и машинном сознании

Vladimir Surdin on the most incredible discoveries in space // Science. Let's talk?
▶︎

Vladimir Surdin on the most incredible discoveries in space // Science. Let's talk?

Революционная ситуация: признаки. Статус S09E42
▶︎

Революционная ситуация: признаки. Статус S09E42

AI for the Little Ones: How LLM and AI Agent Work
▶︎

AI for the Little Ones: How LLM and AI Agent Work

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial
▶︎

Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial

Andrew Ng: Building Faster with AI
▶︎

Andrew Ng: Building Faster with AI

How AI DECEIVES HUMANS | Roman Yampolskiy
▶︎

How AI DECEIVES HUMANS | Roman Yampolskiy

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan
▶︎

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

Алёна Зайцева | Как мы делали умного помощника в Лавке на основе YaGPT
▶︎

Алёна Зайцева | Как мы делали умного помощника в Лавке на основе YaGPT

Как один программист уничтожил монополию корпораций на видео
▶︎

Как один программист уничтожил монополию корпораций на видео

Karpathy показал, как Claude сам строит базу знаний
▶︎

Karpathy показал, как Claude сам строит базу знаний