• ENTRAR
  • No hay productos en el carrito.

Cloudera – Curso: Training for Spark and Hadoop

Descripción
El curso proporciona los conceptos claves y conocimientos para procesar datos en un clúster Hadoop, utilizando las herramientas más avanzadas actualmente. Los participantes aprenderán a identificar qué herramienta es la más adecuada para utilizar en alguna situación dada y adquirir experiencia en el desarrollo de éstas.

Objetivos
• Al finalizar el curso, los participantes serán capaces de.
• Distribuir datos, almacenar y procesar en un clúster Hadoop.
• Utilizar Sqoop y Flume.
• Procesar los datos distribuidos con Apache Spark
• Modelar datos estructurados como tablas en Impala y Hive.
• Elegir el mejor formato de almacenamiento de datos para diferentes patrones de uso de datos.
• Mejores prácticas para el almacenamiento de datos.

Audiencia
• Desarrolladores e Ingenieros que tengan experiencia en programación

Prerequisitos
• Manejo básico de Linux y Sql

Tipo Clase y Duración
• Presencial, 4 día

Esquema del Curso
• Introducción a Hadoop y del Ecosistema Hadoop.
• Arquitectura Hadoop y HDFS.
• Importación de datos relacionales con Apache Sqoop.
• Introducción a Impala y Hive.
• Modelado y gestión de datos con Impala y Hive.
• Formato de datos.
• Partición de datos.
• Captura de datos con Apache Flume.
• Fundamentos Spark.
• RDDs en Sparck.

Información
• Material digital
• Certificado digital
• Coffee-break
• Relatores Certificados

Menús de configuración en el Panel de Administración

Help-Desk
X