Алексей Зайцев. Как приручить нейросеть: галлюцинации, guardrails и контроль рисков

Нейросети способны решать задачи на уровне человека и эксперта, но по-прежнему могут уверенно сообщать недостоверные сведения. Почему галлюцинации заложены в сам принцип работы языковых моделей? Можно ли определить, что модель не уверена в своём ответе? И какие механизмы позволяют бизнесу снижать риски? В лекции «Безопасный ИИ для бизнеса» Алексей Зайцев, доцент Центра ИИ Сколтеха и руководитель Лаборатории прикладных исследований Сколтех–Сбербанк, объясняет: — почему большая языковая модель не устанавливает истину, а прогнозирует продолжение текста; — чем фактологические галлюцинации отличаются от внутренних противоречий; — как обнаруживать ошибки с помощью повторной генерации, анализа внутренних состояний и внешних ограничителей; — что такое guardrails и почему единственного универсального механизма защиты не существует; — как корпоративные базы знаний и RAG повышают надёжность ответов; — какие атаки возможны на языковые модели и почему безопасность всегда связана с компромиссом между качеством, стоимостью и уровнем контроля; — как обычному пользователю проверять ответы нейросети без глубоких технических знаний. Лекция состоялась на онлайн-практикуме Битрикс24 «AIшница 4.0: Нейросети для бизнеса». Таймкоды 00:00 — Начало выступления 01:45 — Алексей Зайцев и исследования лаборатории LARSS 03:31 — Что представляет собой современный ИИ 05:35 — Как языковая модель генерирует ответ 08:57 — Почему нейросети неизбежно ошибаются 10:37 — Внутренние и фактологические галлюцинации 13:14 — Знает ли модель, что она не уверена 15:06 — Как внутренние состояния модели выдают ошибку 16:42 — Ограничители ИИ: стоимость, качество и универсальность 19:02 — Что делать, если ответ признан ненадёжным 20:47 — Как снизить количество галлюцинаций 23:33 — Контекст, корпоративные базы знаний и RAG 24:46 — Атаки на языковые модели и риск утечки данных 26:20 — Главные выводы 28:12 — Как проверять ИИ обычному пользователю 31:43 — Когда необходим человеческий контроль Главная мысль: модели будут ошибаться, но уровень риска можно последовательно снижать — с помощью достоверного контекста, ограничителей, независимой проверки и участия человека в критически важных решениях.

Mikhail Kasyanov: Putin is losing touch with reality | Vitaly Portnikov

Mikhail Kasyanov: Putin is losing touch with reality | Vitaly Portnikov

Der Weltkrieg kommt, aber Merz und Co. sind ihm nicht gewachsen – Weltwoche Daily DE

Der Weltkrieg kommt, aber Merz und Co. sind ihm nicht gewachsen – Weltwoche Daily DE

Новое интервью Карпатого: мы создаём не разум, а призраков без контроля

Новое интервью Карпатого: мы создаём не разум, а призраков без контроля

Революционная ситуация: признаки. Статус S09E42

Революционная ситуация: признаки. Статус S09E42

Data Fest 2026 | Артём Башарин: предсказание нескольких токенов с помощью вероятностных схем

Data Fest 2026 | Артём Башарин: предсказание нескольких токенов с помощью вероятностных схем

AI: Hype vs Reality — Hallucinations, Synthetic Media & Jobs | Asst. Prof. Alexey Zaytsev

AI: Hype vs Reality — Hallucinations, Synthetic Media & Jobs | Asst. Prof. Alexey Zaytsev

Абьюз, ресурс, травма и другие токсичные понятия / Виктор Вахштайн* и Ирина Воробьева / Понятия

Абьюз, ресурс, травма и другие токсичные понятия / Виктор Вахштайн* и Ирина Воробьева / Понятия

Цепи Маркова — математика предсказаний [Veritasium]

Цепи Маркова — математика предсказаний [Veritasium]

Евгений Бурнаев: как инженерный ИИ меняет проектирование и науку | IT Purple Conf 2026

Евгений Бурнаев: как инженерный ИИ меняет проектирование и науку | IT Purple Conf 2026

Data Fest 2026 | Александр Тюрин: оптимальная распределенная оптимизация

Data Fest 2026 | Александр Тюрин: оптимальная распределенная оптимизация

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

Why Smart People Don't Want Children? ALIPOV | KOPANTSEV

Why Smart People Don't Want Children? ALIPOV | KOPANTSEV

Lecture by AI professor at Oxford

Lecture by AI professor at Oxford

Will artificial intelligence need us, and how quickly will humans become dumber? Neurobiologist V...

Will artificial intelligence need us, and how quickly will humans become dumber? Neurobiologist V...

4 секрета настоящих экспертов [Veritasium]

4 секрета настоящих экспертов [Veritasium]

Инфраструктура ИИ, компромисс точности и поисковые системы — Аш Варданян | Мыслить как ученый #56

Инфраструктура ИИ, компромисс точности и поисковые системы — Аш Варданян | Мыслить как ученый #56

Do black holes break physics? — Semikhatov, Akhmedov

Do black holes break physics? — Semikhatov, Akhmedov

Создатель Claude: экономика будет без людей

Создатель Claude: экономика будет без людей

"Don't idealize them": Osetinskaya on Russian-speaking entrepreneurs in emigration

"Don't idealize them": Osetinskaya on Russian-speaking entrepreneurs in emigration

Turing Award Winner: Disagreeing with Google, Postgres, Future Problems | Mike Stonebraker

Turing Award Winner: Disagreeing with Google, Postgres, Future Problems | Mike Stonebraker