Алексей Зайцев. Как приручить нейросеть: галлюцинации, guardrails и контроль рисков
Нейросети способны решать задачи на уровне человека и эксперта, но по-прежнему могут уверенно сообщать недостоверные сведения. Почему галлюцинации заложены в сам принцип работы языковых моделей? Можно ли определить, что модель не уверена в своём ответе? И какие механизмы позволяют бизнесу снижать риски? В лекции «Безопасный ИИ для бизнеса» Алексей Зайцев, доцент Центра ИИ Сколтеха и руководитель Лаборатории прикладных исследований Сколтех–Сбербанк, объясняет: — почему большая языковая модель не устанавливает истину, а прогнозирует продолжение текста; — чем фактологические галлюцинации отличаются от внутренних противоречий; — как обнаруживать ошибки с помощью повторной генерации, анализа внутренних состояний и внешних ограничителей; — что такое guardrails и почему единственного универсального механизма защиты не существует; — как корпоративные базы знаний и RAG повышают надёжность ответов; — какие атаки возможны на языковые модели и почему безопасность всегда связана с компромиссом между качеством, стоимостью и уровнем контроля; — как обычному пользователю проверять ответы нейросети без глубоких технических знаний. Лекция состоялась на онлайн-практикуме Битрикс24 «AIшница 4.0: Нейросети для бизнеса». Таймкоды 00:00 — Начало выступления 01:45 — Алексей Зайцев и исследования лаборатории LARSS 03:31 — Что представляет собой современный ИИ 05:35 — Как языковая модель генерирует ответ 08:57 — Почему нейросети неизбежно ошибаются 10:37 — Внутренние и фактологические галлюцинации 13:14 — Знает ли модель, что она не уверена 15:06 — Как внутренние состояния модели выдают ошибку 16:42 — Ограничители ИИ: стоимость, качество и универсальность 19:02 — Что делать, если ответ признан ненадёжным 20:47 — Как снизить количество галлюцинаций 23:33 — Контекст, корпоративные базы знаний и RAG 24:46 — Атаки на языковые модели и риск утечки данных 26:20 — Главные выводы 28:12 — Как проверять ИИ обычному пользователю 31:43 — Когда необходим человеческий контроль Главная мысль: модели будут ошибаться, но уровень риска можно последовательно снижать — с помощью достоверного контекста, ограничителей, независимой проверки и участия человека в критически важных решениях.

Mikhail Kasyanov: Putin is losing touch with reality | Vitaly Portnikov

Der Weltkrieg kommt, aber Merz und Co. sind ihm nicht gewachsen – Weltwoche Daily DE

Новое интервью Карпатого: мы создаём не разум, а призраков без контроля

Революционная ситуация: признаки. Статус S09E42

Data Fest 2026 | Артём Башарин: предсказание нескольких токенов с помощью вероятностных схем

AI: Hype vs Reality — Hallucinations, Synthetic Media & Jobs | Asst. Prof. Alexey Zaytsev

Абьюз, ресурс, травма и другие токсичные понятия / Виктор Вахштайн* и Ирина Воробьева / Понятия
![Цепи Маркова — математика предсказаний [Veritasium]](https://i.ytimg.com/vi/QI7oUwNrQ34/hqdefault.jpg?sqp=-oaymwEjCNACELwBSFryq4qpAxUIARUAAAAAGAElAADIQj0AgKJDeAE=&rs=AOn4CLDz0E4MWk9wsmjc3xMrK9fiXiDDdg)
Цепи Маркова — математика предсказаний [Veritasium]

Евгений Бурнаев: как инженерный ИИ меняет проектирование и науку | IT Purple Conf 2026

Data Fest 2026 | Александр Тюрин: оптимальная распределенная оптимизация

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

Why Smart People Don't Want Children? ALIPOV | KOPANTSEV

Lecture by AI professor at Oxford

Will artificial intelligence need us, and how quickly will humans become dumber? Neurobiologist V...
![4 секрета настоящих экспертов [Veritasium]](https://i.ytimg.com/vi/EVvw8NX8ky8/hqdefault.jpg?sqp=-oaymwEjCNACELwBSFryq4qpAxUIARUAAAAAGAElAADIQj0AgKJDeAE=&rs=AOn4CLA4-qfaLIokpVygc6k9BHWcWMhXDw)
4 секрета настоящих экспертов [Veritasium]

Инфраструктура ИИ, компромисс точности и поисковые системы — Аш Варданян | Мыслить как ученый #56

Do black holes break physics? — Semikhatov, Akhmedov

Создатель Claude: экономика будет без людей

"Don't idealize them": Osetinskaya on Russian-speaking entrepreneurs in emigration

