Databricks Certified Associate Developer for Apache Spark 3.0 - sesión 01 - Español

Repositorio: https://github.com/DataEngineering-LA... Apache Spark es actualmente uno de los sistemas más populares para el procesamiento de datos a gran escala, con API en múltiples lenguajes de programación y una gran cantidad de bibliotecas integradas y de terceros. Aunque el proyecto ha existido durante varios años, primero como un proyecto de investigación que comenzó en UC Berkeley en 2009, luego en la Apache Software Foundation desde 2013, la comunidad de código abierto continúa creando API más potentes y bibliotecas de alto nivel sobre Spark, por lo que todavía hay mucho que escribir sobre el proyecto. -------------------------------------------------------------------- ¿Te gustaría participar de la comunidad y aprender de la mano de otros entusiastas del mundo de los datos? 📈 Linkedin: https://lnkd.in/e6h3ym3 📚 Slack: https://lnkd.in/eV7hgF3 ✉ Telegram: https://t.me/dataengineeringlatam 📺 YouTube: https://lnkd.in/e6zwGwx 📸 Instagram:   / dataengineeringlatam   🐦 Twitter:   / dataengilatam   👍 Facebook:   / dataengineeringlatam   ¿Quieres dar charla en la comunidad? Bienvenidos todos los que quieran participar compartiendo conocimiento: 🎤 https://lnkd.in/eV5jTzr Grupos de Estudios: Telegram: https://t.me/dataengineeringlatam 🎤 English speaking and stuff 🎤 DAMA's Study Group (Data Management) 🎤 Databricks Certified Associate 🎤 Apache Airflow Study Club 🎤 Power BI como debe ser 🎤 Club de Lectura / Designing data-intensive Applications 🐗 📢 ¡Pasa la voz y ayúdanos a ser la comunidad más grande y chévere de todas!