Представление текста в цифровом виде для нейросети | Нейросети для анализа текстов

В видео рассматриваются различные методы токенизации и векторизации текста для представления его в виде, пригодном для обработки нейросетью. Страница курса - https://www.asozykin.ru/courses/nnpython Нейронные сети могут работать только с числами. Поэтому перед обработкой текста нейронной сетью, его нужно конвертировать в набор чисел. Для этого используется два шага: 1. Токенизация - разделение текста на отдельные части: символы, слова, предложения. 2. Векторизация - представление каждого токена в виде чисел: кода или вектора (one hot encoding или embedding). Предварительно обученные плотные векторные представления слов: 1. GloVe (Global Vectors) - https://nlp.stanford.edu/projects/glove/ 2. Word2Vec, Google - https://code.google.com/archive/p/wor... 3. FastText, Facebook - https://fasttext.cc Плотные векторные представления слов для русского языка: 1. RusVectōrēs – https://rusvectores.org 2. RUSSE (Russian Semantic Evaluation) – https://russe.nlpub.org/downloads/ Tomas Mikolov, Wen-tau Yih, Geoffrey Zweig. Linguistic Regularities in Continuous Space Word Representations - https://www.microsoft.com/en-us/resea... Как можно поддержать курс: 1. Яндекс Кошелек - https://money.yandex.ru/to/4100142982... 2. PayPal - https://www.paypal.me/asozykin Заранее спасибо за помощь! Добавляйтесь в друзья в социальных сетях: вКонтакте - https://vk.com/avsozykin Instagram -   / sozykin_andr   Facebook -   / asozykin   Twitter -   / andreysozykin   Мой сайт - https://www.asozykin.ru Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках -    / andreysozykincs  

Анализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстов
▶︎

Анализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстов

Прикладное машинное обучение 1. Intro to NLP. Word embeddings
▶︎

Прикладное машинное обучение 1. Intro to NLP. Word embeddings

Векторные представления текстов и графов. Word2Vec. FastText. Модели внимания и трансформеры. BERT
▶︎

Векторные представления текстов и графов. Word2Vec. FastText. Модели внимания и трансформеры. BERT

Представление текста вектором One Hot Encoding | Нейросети для анализа текстов
▶︎

Представление текста вектором One Hot Encoding | Нейросети для анализа текстов

Как работают НЕЙРОСЕТИ на самом деле?
▶︎

Как работают НЕЙРОСЕТИ на самом деле?

Цепи Маркова — математика предсказаний [Veritasium]
▶︎

Цепи Маркова — математика предсказаний [Veritasium]

КАК РАБОТАЕТ WORD2VEC И ПОЧЕМУ ОН НЕ РАБОТАЕТ
▶︎

КАК РАБОТАЕТ WORD2VEC И ПОЧЕМУ ОН НЕ РАБОТАЕТ

Рекуррентные нейросети | Нейросети для анализа текстов
▶︎

Рекуррентные нейросети | Нейросети для анализа текстов

Вся IT-база в ОДНОМ видео: Память, Процессор, Код
▶︎

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Рассчитываем контекстную близость слов с помощью библиотеки Word2vec
▶︎

Рассчитываем контекстную близость слов с помощью библиотеки Word2vec

Одномерные сверточные сети | Нейросети для анализа текстов
▶︎

Одномерные сверточные сети | Нейросети для анализа текстов

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50
▶︎

Черниговская vs Собчак, Эрнст просит денег, Машков еле читает, Сигал жалуется. Перемотка №50

NLP практика. Определяем тональность текста при помощи NLTK и DL
▶︎

NLP практика. Определяем тональность текста при помощи NLTK и DL

Написал нейросети для рисования | Как работает DeepDream?
▶︎

Написал нейросети для рисования | Как работает DeepDream?

Глубинное обучение 1, лекция 6 - токенизация текстов, эмбеддинги слов, TextCNN
▶︎

Глубинное обучение 1, лекция 6 - токенизация текстов, эмбеддинги слов, TextCNN

ИИ играет в мафию
▶︎

ИИ играет в мафию

Это уже происходит. Как ИИ захватит мир?
▶︎

Это уже происходит. Как ИИ захватит мир?

Device Searches 2026: What the FSB Looks for at the Border and How to Hide Your Data
▶︎

Device Searches 2026: What the FSB Looks for at the Border and How to Hide Your Data

Векторизация текстов на естественном языке
▶︎

Векторизация текстов на естественном языке

Физику ведёт физрук: что происходит в школах? САВВАТЕЕВ | КОПАНЦЕВ
▶︎

Физику ведёт физрук: что происходит в школах? САВВАТЕЕВ | КОПАНЦЕВ