Человек и LLM. Как оценивать качество моделей и строить метрики | Ирина Барская, Яндекс Поиск
Это доклад Ирины Барской, руководителя службы аналитики и исследований в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Екатерина рассмотрела важную проблему: почему чем лучше становятся LLM-модели, тем сложнее построить систему оценки их качества. Из доклада узнали, как с этим жить: как строить метрики, какие бенчмарки самые правильные и надёжные, нужны ли нам эксперты и как выстраивать процессы разметки данных. Подписывайтесь на телеграм-канал Яндекса для ML-специалистов: https://t.me/yandexforml

▶︎
(Un)Real Data — Synthetic Data Generation | Daria Andreeva, X5 Tech

▶︎
AI в действии | Юридическая сторона использования AI

▶︎
AI-инструмент для разработчика: как мы обучали LLM кодить | Виктор Плошихин, Yandex Infrastructure

▶︎
«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

▶︎
Вызовы стоматологического бизнеса в 2026 году: налоги, финансы, маркетинг и автоматизация

▶︎
1970s Inspired French Pop | Slow Parisian Cafe Vibes | Chanson Aura

▶︎
Гений коммуникации. Нина Зверева о правиле 8 секунд, ошибках и формуле успешного выступления

▶︎
Что такое RAG в LLM и причём тут векторные базы данных

▶︎
Рекомендательные системы: сложности разработки и пути решения | Пётр Чуйков, HeadHunter

▶︎
Самое глубокое интервью об ИИ: Суцкевер о природе разума, эволюции и машинном сознании

▶︎
Vladimir Surdin on the most incredible discoveries in space // Science. Let's talk?

▶︎
Революционная ситуация: признаки. Статус S09E42

▶︎
AI for the Little Ones: How LLM and AI Agent Work

▶︎
Free Event: Power BI Beginner to Pro 2026 Edition - Full Hands-On Tutorial

▶︎
Andrew Ng: Building Faster with AI

▶︎
How AI DECEIVES HUMANS | Roman Yampolskiy

▶︎
Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

▶︎
Алёна Зайцева | Как мы делали умного помощника в Лавке на основе YaGPT

▶︎
Как один программист уничтожил монополию корпораций на видео

▶︎
