Classes desbalanceadas: você está fazendo errado!
Sabe aquele modelo pra classificar transações bancárias em fraude e não fraude... e aquele pra prever se o paciente tem ou não diabetes? São exemplos de problemas do mundo real que possuem classes desbalanceadas! Mas cuidado, padawan! Tem muito tutorial errado espalhado por esse internet. Vamos aprender a fazer oversampling do jeito certo! Cola no Let's Data que nunca mais vai ter modelo errado em produção! Ao final deste vídeo você será capaz de: ✅ Detalhar o que é o problema de classificação com classes desbalanceadas ✅ Descrever o que são as técnicas de undersampling e oversampling ✅ Detalhar porque a validação é importante para casos de oversampling ✅ Implementar uma validação com oversampling do zero e da forma correta! Clica logo no play e no like :) Não se esqueça de se inscrever no canal para assistir aos próximos vídeos! --------- ⬇️ Download do eBook "Como se Tornar um Cientista de Dados?": https://ebook.letsdata.ai/ --------- Leon Sólon é bacharel em Ciência da Computação e mestre em Ciência de Dados pela Universidade de Brasília - UnB. Possui mais de 20 anos de experiência na área de TI e mais há mais de 5 anos como cientista de dados. Atualmente é Auditor-Fiscal da Receita Federal (atuando como cientista de dados) e cientista de dados da startup Bludworks. ---------- 📸 Nos siga no Instagram: / letsdata.ai 🐦 Nos siga no Twitter: / letsdataai Site: https://letsdata.ai LinkedIn: / lets-data ✉️ E-mail: [email protected] ---------- Ouça nosso podcast nos principais players: 🟣 Spotify: https://open.spotify.com/show/0VsNN95... 🟣 iTunes: https://podcasts.apple.com/us/podcast... 🟣 Google Podcast: https://podcasts.google.com/feed/aHR0... 🟣 Deezer: https://www.deezer.com/show/2770422 #oversampling #smote #dados #datascience #inteligenciaartificial

Do Zero às Primeiras Consultas com SQL | SQL Básico - Parte 1

CRISP-DM: a melhor metodologia para projetos de Data Science

MACHINE LEARNING PARA PREVER FRAUDES

Classificação e regressão com XGBoost

O que é Cloud? O que é Nuvem?

ENTENDENDO DE VEZ A DIFERENÇA ENTRE NORMALIZAÇÃO E PADRONIZAÇÃO DOS DADOS

O que é Kaggle?

Overfitting e Underfitting: O que é | Como Analisar | Como Tratar

Algoritmo de modelagem LightGBM usando Python

Nunca Mais Use Grid Search Para Ajustar Hiperparâmetros

Como colocar um modelo de Machine Learning em PRODUÇÃO

Lidando com Classes Desbalanceadas - Machine Learning

#055 - Trabalhando na Europa

Como calcular o CREDIT SCORE com modelo de Machine Learning

PRAY FIRST BEFORE STARTING YOUR DAY | GOD WILL GUIDE YOUR STEPS TODAY

Descubra o Poder do ChatGPT: Como aumentar sua produtividade

Como usar Clusters para encontrar padrões nos seus dados | ML do Básico ao Aplicado

Trabalhando com Datasets Desbalanceados

Fazendo uma Rede Neural do Zero! #1 - FeedForward

