Обучаем BERT модель для классификации текста / NLP на PyTorch

В этом видео пройдем полный цикл разработки модели бинарной классификации текстовых отзывов на PyTorch. Научимся определять, является ли отзыв позитивным или негативным. По итогу задеплоим обученную RoBERTa модель в Triton Server. Что разберем: Предобработка данных и подготовка датасета Принцип работы токенизаторов Архитектура трансформеров и fine-tuning Лучшие методики для достижения высокого качества обучения Интерпретация предсказаний модели Экспорт в ONNX и деплой ансамбля в Triton Inference Server 📦 Материалы и код к видео: https://github.com/Koldim2001/text-fe... ⏱ Таймкоды из видео: 0:58 - Предобработка данных и подготовка датасета 7:07 - Как нейросети обрабатывают текст 13:24 - Изучаем работу токенизатора 19:19 - Подготовка датасета и даталоадера в PyTorch 25:35 - Загружаем модель и настраиваем ее 34:42 - Пишем код обучения модели 45:28 - Анализируем итоги обучения 48:05 - Изучаем тестовые метрики и ищем инсайты 55:19 - Инференс обученной модели через PyTorch 57:00 - Интерпретация работы модели с помощью LIME 1:00:48 - Переводим модель в ONNX 1:02:39 - Запускаем Triton Inference Server в Docker 1:04:17 - Как устроено ансамблирование моделей в Triton 1:15:18 - Выполняем инференс ансамбля Triton по gRPC 🎓 Собрал плейлист с видео по нарастающей сложности - от основ до продвинутых практик DL:    • Компьютерное зрение с нуля до профи   #NLP #PyTorch #Transformers #ONNX #TritonInferenceServer #MLOps #DeepLearning #RoBERTa #DL #BERT

Improving the traffic analytics project
▶︎

Improving the traffic analytics project

Как запустить в прод нейросеть: Triton Inference Server + TensorRT
▶︎

Как запустить в прод нейросеть: Triton Inference Server + TensorRT

MLflow Experiment Tracking: PyTorch and Scikit-learn
▶︎

MLflow Experiment Tracking: PyTorch and Scikit-learn

Machine Learning Model Deployment: From Code to Production
▶︎

Machine Learning Model Deployment: From Code to Production

Курс для Computer Vision разработчиков
▶︎

Курс для Computer Vision разработчиков

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды
▶︎

Локальная LLM за 20 минут: Qwen 3.6 + LM Studio | Без воды

How to Run AI on a Computer Offline and for Free: A Complete Guide to Local Models
▶︎

How to Run AI on a Computer Offline and for Free: A Complete Guide to Local Models

Richard Stallman: The Most Inconvenient Man in IT
▶︎

Richard Stallman: The Most Inconvenient Man in IT

Что такое RAG в LLM и причём тут векторные базы данных
▶︎

Что такое RAG в LLM и причём тут векторные базы данных

Why do we need topology?
▶︎

Why do we need topology?

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat
▶︎

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat

Как всего шесть чисел управляют Вселенной
▶︎

Как всего шесть чисел управляют Вселенной

Самый неожиданный способ тренировки мозга • Владимир Алипов, нейробиолог
▶︎

Самый неожиданный способ тренировки мозга • Владимир Алипов, нейробиолог

Главная проблема ИИ, которую никто не может решить
▶︎

Главная проблема ИИ, которую никто не может решить

Как работать с видео в OpenCV
▶︎

Как работать с видео в OpenCV

Neural networks. The simplest and clearest explanation from scratch with examples.
▶︎

Neural networks. The simplest and clearest explanation from scratch with examples.

Как один программист уничтожил монополию корпораций на видео
▶︎

Как один программист уничтожил монополию корпораций на видео

Цепи Маркова — математика предсказаний [Veritasium]
▶︎

Цепи Маркова — математика предсказаний [Veritasium]

WHY ARE WE ALL TIRED? THIS IS THE REASON!
▶︎

WHY ARE WE ALL TIRED? THIS IS THE REASON!

Вся IT-база в ОДНОМ видео: Память, Процессор, Код
▶︎

Вся IT-база в ОДНОМ видео: Память, Процессор, Код