Spark y Python con PySpark en AWS para Big Data
Big Data, Computación Paralela, RDDs, Spark SQL DataFrames y Spark MLlib todo en Python y Jupyter Notebooks
¿Quieres aprender Spark?
En este curso aprenderás lo que es la computación paralela utilizando Spark y Python con PySpark en un Jupyter notebook que corre en AWS - Amazon Web Services.
Spark es un framework de programación para datos distribuidos y es de los más utilizados para el Big Data hoy en día. En este curso aprenderás a trabajar con Spark y sus RDDs, con Spark SQL y sus DataFrames y aprenderás la sintaxis básica de Spark ML, para algoritmos de aprendizaje automático o Machine Learning.
Este curso está diseñado para cualquier persona que quiera empezar a meterse en el mundo del big data con Spark y Python. Es un curso totalmente práctico y dinámico en el que empezarás desde cero con Spark.
Detalle del curso:
Pago Único
75% Dto. 199 usd
*Precio en U$D Dólares Americanos
*Precio FINAL impuestos incluidos
Empezaremos con una introducción al big data, a la computación paralela y a Apache Spark.
Luego os llevaremos paso a paso para crear una cuenta de AWS, crear una máquina virtual utilizando el sistema de computación EC2 y configurar todo lo necesario para poder utilizar Spark y Jupyter Notebooks en AWS.
En las primeras partes del curso trabajaremos con Spark y su formato RDD (Resilient Distributed Datasets o Datos Distribuidos Resilientes). Luego trabajaremos con Spark SQL y sus DataFrames y acabaremos aprendiendo a implementar un algoritmos de regresión lineal en Spark ML.
Como ves hay mucho temario. Iremos paso a paso explicando primero la teoría y después haciendo casos prácticos.
Su Instructor
Datademia esta dedicada a enseñarte las herramientas necesarias para trabajar con datos.
Plan de Estudios
-
ComienzaCuenta AWS (Amazon Web Services) (5:40)
-
ComienzaCreación de una maquina virtual EC2 en AWS (6:51)
-
ComienzaConfiguración SSH para Windows (6:42)
-
ComienzaConfiguración SSH para Mac (3:09)
-
ComienzaConfiguración de Spark en AWS EC2 con Python y Jupyter Notebooks
-
ComienzaConfiguración Jupyter Notebook en AWS EC2 (8:23)
-
ComienzaConfiguración Spark (5:34)