#055 ML Илья Гусев. Как запускать большие языковые модели локально

Гостем выпуска стал Илья Гусев - известный NLP-специалист, сделавший большой вклад в область своими опенсорс-проектами, среди которых анализатор морфологии, генератор стихов, сборка различных датасетов и некоторые другие. Один из таких проектов как раз и стал поводом к сегодняшнему общению. Это большая языковая модель, заточенная на работу с русским языком - Сайга. Но говорим в выпуске мы далеко не только о ней. Илья сделал классный исторический экскурс в современные языковые модели, рассказал некоторые подробности об их устройстве, о тех подходах, которые применяют, чтобы такие модели можно было запускать на домашнем компьютере, как с помощью языковых моделей можно решать разные задачи и стоит ли вообще использовать локальные модели. Интересного и полезного прослушивания! Ссылки выпуска: Статья Ильи на Хабре "Как (быстро) сделать русский локальный ChatGPT" (https://habr.com/ru/articles/759386/) Сервис для запуска больших языковых моделей локально - lmstudio (https://lmstudio.ai/) Репозиторий сервиса oobabooga, с помощью которого можно запустить веб-интерфейс для работы с LLM локально (https://github.com/oobabooga/text-gen...) Репозиторий сервиса Text Generation Inference (TGI), который позволяет развертывать и поддерживать LLM (https://github.com/huggingface/text-g...) Статья на arxiv "Self-Consuming Generative Models Go MAD" с анализом того, к чему приводят разные подходы обучения LLM на синтетических датасетах, сгенерированных другими LLM (https://arxiv.org/abs/2307.01850) Пост Ильи со списком материалов для погружения в NLP (https://t.me/natural_language_process...) Выпуск подкаста на mawe - https://mlpodcast.mave.digital/ep-55 Все выпуски подкаста на mawe - https://mlpodcast.mave.digital Подкаст на Apple Podcasts - https://podcasts.apple.com/ru/podcast... Подкаст на Google Подкастах - https://podcasts.google.com/feed/aHR0... Подкаст в Яндекс Музыке - https://music.yandex.ru/album/9781458 Паблик подкаста ВКонтакте - https://vk.com/mlpodcast Телеграм-канал "Стать специалистом по машинному обучению" - https://t.me/toBeAnMLspecialist Чат в телеграм, где можно обсудить выпуски, предложить гостей и темы подкаста и просто пообщаться (https://t.me/MachineLearningPodcast) Телеграм автора подкаста - @kmsint Бесплатный курс по созданию телеграм-ботов на Python и aiogram от автора подкаста - https://stepik.org/course/120924/ Продвинутый курс по созданию телеграм-ботов на Python - https://stepik.org/a/153850 Поблагодарить автора подкаста можно добрым словом и/или донатом: https://www.tinkoff.ru/rm/kryzhanovsk...

#056 ML Юрий Окуловский. Гаражные стартапы в условиях бигбиза
▶︎

#056 ML Юрий Окуловский. Гаражные стартапы в условиях бигбиза

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать
▶︎

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

Мурат Апишев | Как обучать большие языковые модели
▶︎

Мурат Апишев | Как обучать большие языковые модели

ИИ против ИИ: эволюция угроз и защиты
▶︎

ИИ против ИИ: эволюция угроз и защиты

Маленькие большие языковые модели
▶︎

Маленькие большие языковые модели

#049 ML Данила Медведев. Риски ИИ и будущие войны в когнитивном театре военных действий
▶︎

#049 ML Данила Медведев. Риски ИИ и будущие войны в когнитивном театре военных действий

6 проектов, 0 сотрудников: мой второй мозг на Claude
▶︎

6 проектов, 0 сотрудников: мой второй мозг на Claude

#051 ML Антон Чунаев. MLOps - что это, и почему MLOps это не DevOps
▶︎

#051 ML Антон Чунаев. MLOps - что это, и почему MLOps это не DevOps

Все Каловые Массы ВЫЙДУТ ЗА НОЧЬ! Как очистить кишечник без химии и таблеток?
▶︎

Все Каловые Массы ВЫЙДУТ ЗА НОЧЬ! Как очистить кишечник без химии и таблеток?

Дрессировка открытых языковых моделей | Илья Гусев в ЛЕЯ
▶︎

Дрессировка открытых языковых моделей | Илья Гусев в ЛЕЯ

#054 ML Валерий Бабушкин и Арсений Кравченко. Как написать книгу об ML System Design
▶︎

#054 ML Валерий Бабушкин и Арсений Кравченко. Как написать книгу об ML System Design

Экономика LLM: что надо и сколько стоит использование больших языковых моделей
▶︎

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

КАК ОБЫЧНАЯ ЖЕНЩИНА СТАЛА САМОЙ ОПАСНОЙ ПОЛИТИЧЕСКОЙ ФИГУРОЙ БРИТАНИИ? ЖЕЛЕЗНАЯ ЛЕДИ
▶︎

КАК ОБЫЧНАЯ ЖЕНЩИНА СТАЛА САМОЙ ОПАСНОЙ ПОЛИТИЧЕСКОЙ ФИГУРОЙ БРИТАНИИ? ЖЕЛЕЗНАЯ ЛЕДИ

Как большие языковые модели создают галлюцинации: лекция профессора Крылова на канале Artezio
▶︎

Как большие языковые модели создают галлюцинации: лекция профессора Крылова на канале Artezio

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь
▶︎

Интерстеллар, центр за $1 000 000 000, мегалазер / вДудь

ВРЕМЯ НЕЛЬЗЯ ИЗМЕРИТЬ. Семихатов и Сурдин
▶︎

ВРЕМЯ НЕЛЬЗЯ ИЗМЕРИТЬ. Семихатов и Сурдин

Илья Гусев - Синтетические датасеты как способ сокращения неравенства
▶︎

Илья Гусев - Синтетические датасеты как способ сокращения неравенства

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing
▶︎

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing

10 ПСИХОЛОГИЧЕСКИХ КЛЮЧЕЙ, ЧТОБЫ ВАС ВОСПРИНИМАЛИ КАК РОСКОШЬ, А НЕ КАК ВАРИАНТ  МИХАИЛУ ЛАБКОВСКОМУ
▶︎

10 ПСИХОЛОГИЧЕСКИХ КЛЮЧЕЙ, ЧТОБЫ ВАС ВОСПРИНИМАЛИ КАК РОСКОШЬ, А НЕ КАК ВАРИАНТ МИХАИЛУ ЛАБКОВСКОМУ

Your cash in Europe has ONE YEAR left! What should you do with it NOW?!
▶︎

Your cash in Europe has ONE YEAR left! What should you do with it NOW?!