*Si quieres consultar otras opciones de pago haz clic aquí
¿Qué es Apache Spark?
Apache Spark es un framework de programación para procesar datos masivos o big data, de forma distribuida, diseñado para ser rápido. Spark ha batido récords en velocidad de procesamiento.
Como su propio nombre indica, ha sido desarrollado por el Apache Foundation, lo que garantiza su licencia Open Source.
Es el sistema de computación paralela más utilizado en empresas como Facebook, IBM, Microsoft, NASA o Netflix.
Trailer
Más información
Horas de formación
La duración estimada del curso es de 4-6 horas.
Se puede acortar o alargar dependiendo de las horas diarias invertidas.
Requisitos
Para este curso es necesario tener conocimientos básicos de programación en Python.
Online y a tu ritmo
El 100% de los contenidos del curso son online, por lo que podrás aprender desde cualquier sitio del mundo al ritmo que quieras.
¿Qué aprenderás?
✅ Sobre el Big Data y la computación paralela
✅ A trabajar con Spark RDDs en pyspark
✅ A trabajar con Spark SQL y sus DataFrames en pyspark
✅ A trabajar con Spark MLlib en pyspark
Temario
- Cuenta AWS (Amazon Web Services) (5:40)
- Creación de una maquina virtual EC2 en AWS (6:51)
- Configuración SSH para Windows (6:42)
- Configuración SSH para Mac (3:09)
- Configuración de Spark en AWS EC2 con Python y Jupyter Notebooks
- Configuración Jupyter Notebook en AWS EC2 (8:23)
- Configuración Spark (5:34)
- Expresiones Lambda (5:26)
- Introducción a Spark con Python (7:45)
- Transformaciones Spark 1 - filter(), map() y flatMap() (7:41)
- Transformaciones Spark 2 - sample(), distinct() y groupBy() (7:04)
- Transformaciones Spark 3 - union(), intersection(), subtract() y cartesian() (7:20)
- Acciones Spark 1 - Alternativas a collect() (6:25)
- Acciones Spark 2 - reduce(), fold() y aggregate() (12:15)
- Acciones Spark 3 - Acciones para contar elementos (7:15)
- Introducción al Proyecto 1 (2:15)
- Pistas para el proyecto
- Solución al Proyecto 1 (6:33)
- Introducción a Spark SQL (1:01)
- Introducción a Spark SQL DataFrames (3:02)
- Spark SQL Schema (3:23)
- Spark SQL select(), withColumn() y withColumnRenamed() (4:04)
- Spark SQL consultas SQL (2:37)
- Spark SQL filter() / where() (7:48)
- Spark SQL groupBy() y agg() (3:28)
- Spark SQL otras funciones (5:36)
- Spark SQL Valores Nulos (7:18)
- Spark SQL Fecha y Tiempo (3:42)
- Ejercicio
- Solución al ejercicio (5:08)
Consigue tu certificado
Al finalizar este curso, obtendrás un certificado que podrás mostrar a futuros empleadores y demostrar que conocimientos tienes.
Otros cursos parecidos
Preguntas frecuentes
¿Qué necesito para empezar?
Solo necesitas una conexión a Internet, un ordenador, una tablet o un teléfono móvil. Para las partes prácticas se recomienda utilizar un ordenador para poder descargarte el software necesario y practicar, ya que es la mejor forma de aprender.
¿Durante cuánto tiempo tengo acceso al curso?
¿Cómo suena acceso de por vida? Después de inscribirte, tendrás acceso ilimitado a este curso.
¿Qué pasa si no estoy satisfecho con el curso?
Nuestro objetivo es que todos nuestros estudiantes esten satisfechos. Por eso, si no lo estas, durante los primeros 14 días te haremos un reembolso completo.