Qué son los Datos Desbalanceados y Cómo balancearlos usando Submuestreo y Sobremuestreo con Python

Un problema de clasificación que frecuentemente se presenta en contextos reales: es tener datos desbalanceados, lo cual sesga la creación de clasificadores de aprendizaje de máquina. En este video se explica en qué consiste el problema de los datos desbalanceados y cómo resolverlo utilizando submuestreo y sobremuestreo. 👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en https://www.xiperia.com ℹ️ Octavio Gutiérrez es el único responsable del contenido, afirmaciones y opiniones expresadas en este video, las cuales no están vinculadas a las organizaciones a las que está asociado. 🌐 Para conocer más sobre Octavio Gutiérrez, visita su perfil en LinkedIn   / octaviogutierrez   Para citar este recurso educativo utiliza la siguiente referencia: Gutiérrez-García, J.O. [Código Máquina]. (2023, 7 de Agosto). Qué son los Datos Desbalanceados y Cómo balancearlos usando Submuestreo y Sobremuestreo con Python [Video]. YouTube. [Incluye aquí la URL del video]. ******************************************** Para guiar tu aprendizaje, en este vínculo (   • Curso de Inteligencia Artificial (IA) y Ma...  ) se encuentra una guía secuencial para aprender: 1. Programación Básica con Python; 2. Manejo de Datos; 3. Visualización de Datos; 4. Análisis de Datos; y 5. Aprendizaje de Máquina y Ciencia de Datos. ******************************************** Índice del Video: 0:00 Introducción 2:00 Contexto: datos de cáncer mama 3:34 Datos desbalanceados 4:19 Submuestreo 6:22 Sobremuestreo 7:30 Creación de Clasificadores 12:58 Manejo de Datos Desbalanceados con python Si este video y tema fue de tu interés, también tenemos otro video donde describimos otra técnica para lidiar con el problema de datos desbalanceados:    • Cómo crear Clasificadores de Machine Learn...   ⭐ Apoya a Código Máquina dando un Like, Comentando, Compartiendo o con un Super Gracias. 📊 Los datos no mienten: La caída del cabello se frena con mantenimiento predictivo, no correctivo. El nuevo shampoo sólido anticaída de la co-fundadora de Código Máquina es el upgrade de alto rendimiento que tu hardware biológico necesita. 🧪💻🧬 👉 Consigue el tuyo y estabiliza el sistema: https://bit.ly/Sinhaki El código del video está disponible en GitHub https://github.com/CodigoMaquina/code #DataScience #aprendizajeautomático #MachineLearning #AprendizajeDeMaquina #ScikitLearn #SkLearn #CienciaDeDatos

Ni muy muy, Ni tan tan: Subajuste y Sobreajuste (under- & overfitting) - Machine Learning con Python
▶︎

Ni muy muy, Ni tan tan: Subajuste y Sobreajuste (under- & overfitting) - Machine Learning con Python

K-means (o K-medias) para detección de Clusters: Algoritmo e implementación con Python
▶︎

K-means (o K-medias) para detección de Clusters: Algoritmo e implementación con Python

Aprende Ciencia de datos - Curso completo para principiantes [Tutorial]
▶︎

Aprende Ciencia de datos - Curso completo para principiantes [Tutorial]

How to handle imbalanced datasets in Python
▶︎

How to handle imbalanced datasets in Python

Cómo funciona un Sistema Neuro-Simbólico de IA en un dataset de plantas
▶︎

Cómo funciona un Sistema Neuro-Simbólico de IA en un dataset de plantas

Análisis Exploratorio de Series de Tiempo con Gráficas de Autocorrelación y Retardo usando Python
▶︎

Análisis Exploratorio de Series de Tiempo con Gráficas de Autocorrelación y Retardo usando Python

Regresión Lineal con Python
▶︎

Regresión Lineal con Python

Gradiente Descendente Paso a Paso con Python: Un Algoritmo de Optimización para Machine Learning
▶︎

Gradiente Descendente Paso a Paso con Python: Un Algoritmo de Optimización para Machine Learning

Árboles de Decisión (decision trees) usando Entropía con Python
▶︎

Árboles de Decisión (decision trees) usando Entropía con Python

START YOUR TUESDAY WITH FAITH | TODAY GOD IS GIVING YOU UNEXPECTED OPPORTUNITIES | FATHER FREDDY ...
▶︎

START YOUR TUESDAY WITH FAITH | TODAY GOD IS GIVING YOU UNEXPECTED OPPORTUNITIES | FATHER FREDDY ...

Tutorial: ANÁLISIS EXPLORATORIO DE DATOS con Python
▶︎

Tutorial: ANÁLISIS EXPLORATORIO DE DATOS con Python

Aditya Lahiri: Dealing With Imbalanced Classes in Machine Learning | PyData New York 2019
▶︎

Aditya Lahiri: Dealing With Imbalanced Classes in Machine Learning | PyData New York 2019

Hands-On Machine Learning: Logistic Regression with Python and Scikit-Learn
▶︎

Hands-On Machine Learning: Logistic Regression with Python and Scikit-Learn

K-Vecinos Más Cercanos (KNN) para Clasificación con Python
▶︎

K-Vecinos Más Cercanos (KNN) para Clasificación con Python

Random Forest (Bosque Aleatorio) para Clasificación con Python
▶︎

Random Forest (Bosque Aleatorio) para Clasificación con Python

Random Forest Algorithm - Random Forest Explained | Random Forest in Machine Learning | Simplilearn
▶︎

Random Forest Algorithm - Random Forest Explained | Random Forest in Machine Learning | Simplilearn

Curso Inteligencia Artificial para Programadores en 2026 (Conceptos, Herramientas, Claude Code)
▶︎

Curso Inteligencia Artificial para Programadores en 2026 (Conceptos, Herramientas, Claude Code)

Tutorial de inteligencia artificial para cualquier persona
▶︎

Tutorial de inteligencia artificial para cualquier persona

EMPIEZA EL MIÉRCOLES CON FE | SEÑOR, SANA A QUIENES SUFREN AHORA | PADRE FREDDY BUSTAMANTE
▶︎

EMPIEZA EL MIÉRCOLES CON FE | SEÑOR, SANA A QUIENES SUFREN AHORA | PADRE FREDDY BUSTAMANTE

Detección de Datos Anómalos (outliers) con Bosques de Aislamiento (iForests) y Python
▶︎

Detección de Datos Anómalos (outliers) con Bosques de Aislamiento (iForests) y Python