022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)
Вот мы и добрались до очередной революции в области искусственного интеллекта – появление трансформера. В том числе в компьютерном зрении начинаем с модели Vision Transformer. В этом видео будет много новой информации. Начнём с разбора особенностей ViT модели. А затем углубимся в принципы работы Внимания и Трансформеров. Причём с трансформером будем разбираться сразу на задаче компьютерного зрения. Хотя маленькая отсылка к работе с текстами будет. В любом случае в это видео будут вмещены 2 важнейшие научные статьи в области искусственного интеллекта: «Attention is all you need» и «An image is worth 16x16 words, Transformers for image recognition at scale.» В остальном же всё как и в предыдущих видео. Разберёмся с архитектурой, познакомимся с некоторыми авторами, обучим модель на датасете Арма и посмотрим на результаты. Таймкоды: 00:00 | Введение 02:48 | Знакомимся с авторами 08:40 | Основа архитектуры Vision Transformer 16:44 | Устройства энкодера трансформера 30:03 | Ещё немного слов о Vision Transformer 32:04 | Полученные результаты при использовании модели ViT 34:00 | Обучаем модель ViT_l_16 и тестируем 36:58 | Анализируем предсказания 40:10 | Заключение

023 Классификация изображений. Часть 16. EfficientNet v2 (2021)

Transformer, explained in detail | Igor Kotenkov | NLP Lecture (in Russian)

AI-агент для офисных задач: знакомство с Codex

050. YOLO. Часть 1. Детекция. Обучение на собственном датасете.

Механизмы внимания в Transformer

Продвинутая разработка на LangGraph: Human-in-the-Loop и реальные кейсы
![Преобразование Фурье [3Blue1Brown]](https://i.ytimg.com/vi/9bqrTYCS6DQ/hqdefault.jpg?sqp=-oaymwEjCNACELwBSFryq4qpAxUIARUAAAAAGAElAADIQj0AgKJDeAE=&rs=AOn4CLD_7EikapEUjG1CNux57daADWNd-w)
Преобразование Фурье [3Blue1Brown]

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Что такое RAG в LLM и причём тут векторные базы данных

Компьютерное зрение для начинающих. Создаём виртуальную игру "Камень, ножницы, бумага"

Vision Transformer

Подробный обзор архитектуры Трансформер

Vision Transformer for Image Classification

Техноимперия Китая: Мы Уже Проиграли? (Это Пугает) @megaprojekty

RGB или HSV для обучения моделей? А может ещё Canny подмешать?

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Трамп уверен в победе/Новое «вторжение» в Европу/Хабек обвиняет Путина/Удар по Бербок

Лекция. Трансформеры в компьютерном зрении

Can the Entire Universe Be Described by a Single Theory? — Semikhatov, Musaev

