Сергей Богданов | SOTA Распознавание Сущностей путем дистилляции LLM

Спикер: Сергей Богданов Название доклада: "SOTA Распознавание Сущностей путем дистилляции LLM" Описание доклада: Контрибьюшн: создал лучшую BERT-sized foundation модель для задачи Named Entity Recognition: обычно люди брали bert + линейный слой, наша модель обгоняет этот пайплайн на несколько процентов, нужно лишь заменить bert на нашу модель Ссылка на мероприятие: https://ods.ai/events/halloween2023 Ссылка на трек: https://ods.ai/tracks/sibfest4-nlp Наши соц.сети: Telegram: https://t.me/datafest Вконтакте: https://vk.com/datafest Канал с вакансиями в telegram: https://t.me/odsjobs Канал с вакансиями в matrix: https://matrix.to/#/#jobs-list:matrix.ods.ai

Karina Romanova - LLAMA, 100,500 fine-tuning variations
▶︎

Karina Romanova - LLAMA, 100,500 fine-tuning variations

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

Тренировки по ML. Бонусная встреча. Knowledge distillation
▶︎

Тренировки по ML. Бонусная встреча. Knowledge distillation

Капитанский мостик 07.06.2026: BYD оплатит ДТП | Святой Престол и ИИ | Anthropic и тормоза
▶︎

Капитанский мостик 07.06.2026: BYD оплатит ДТП | Святой Престол и ИИ | Anthropic и тормоза

JDBC — ваш швейцарский нож для работы с данными
▶︎

JDBC — ваш швейцарский нож для работы с данными

Теория струн (ScienceClic)
▶︎

Теория струн (ScienceClic)

Измерение объективной степени случайности конечного набора точек [1] // Владимир Арнольд
▶︎

Измерение объективной степени случайности конечного набора точек [1] // Владимир Арнольд

Вся IT-база в ОДНОМ видео: Память, Процессор, Код
▶︎

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Физику ведёт физрук: что происходит в школах? САВВАТЕЕВ | КОПАНЦЕВ
▶︎

Физику ведёт физрук: что происходит в школах? САВВАТЕЕВ | КОПАНЦЕВ

Когда мы знаем, что ничего не знаем. Гость – Алексей Семихатов // Подкаст «Программный комитет»
▶︎

Когда мы знаем, что ничего не знаем. Гость – Алексей Семихатов // Подкаст «Программный комитет»

«Дистилляция моделей на примере SBERT.» Александр Абрамов (Cбер)
▶︎

«Дистилляция моделей на примере SBERT.» Александр Абрамов (Cбер)

История Linux и UNIX! Кто породил ВСЕ современные системы!
▶︎

История Linux и UNIX! Кто породил ВСЕ современные системы!

«Карты, Вагнер, два компа»: как кубанский сисадмин переиграл ФСБ (и не сел)
▶︎

«Карты, Вагнер, два компа»: как кубанский сисадмин переиграл ФСБ (и не сел)

Главная проблема ИИ, которую никто не может решить
▶︎

Главная проблема ИИ, которую никто не может решить

Самый неожиданный способ тренировки мозга • Владимир Алипов, нейробиолог
▶︎

Самый неожиданный способ тренировки мозга • Владимир Алипов, нейробиолог

Реальная польза от LLM на примере Universal NER / Иван Самсонов и Андрей Соколов (ВКонтакте)
▶︎

Реальная польза от LLM на примере Universal NER / Иван Самсонов и Андрей Соколов (ВКонтакте)

Transformer Neural Networks Derived from Scratch
▶︎

Transformer Neural Networks Derived from Scratch

Transformers, the tech behind LLMs | Deep Learning Chapter 5
▶︎

Transformers, the tech behind LLMs | Deep Learning Chapter 5

НАДВИГАЕТСЯ ИНФЛЯЦИОННЫЙ ШТОРМ/ ПРОПАЛА НАБИУЛЛИНА/ ПМЭФ ПОЗОРА/ ИНВЕСТИЦИИ РУХНУЛИ. Милов
▶︎

НАДВИГАЕТСЯ ИНФЛЯЦИОННЫЙ ШТОРМ/ ПРОПАЛА НАБИУЛЛИНА/ ПМЭФ ПОЗОРА/ ИНВЕСТИЦИИ РУХНУЛИ. Милов

Решение задачи классификации текста с помощью SOTA нейронной сети на основе BERT архитектуры
▶︎

Решение задачи классификации текста с помощью SOTA нейронной сети на основе BERT архитектуры