Módulo 1: Desarrollo de aplicaciones MapReduce
Conceptos Básicos de Hadoop
Desarrollo de Aplicaciones MapReduce
API MapReduce
Resolución de problemas con MapReduce
Ecosistema Hadoop: Oozie,Hue,Hive y Pig
Módulo 2: Análisis de datos con Hive, Impala y Pig
Formatos de ficheros: Avro, Columnar, Texto
Acceso y procesamiento de datos:HCatalog, Kite SDK y Apache Crunch
Análisis de datos con Hive
Análisis de datos con Pig
Análisis de datos en tiempo real: Impala
Módulo 3: Procesamiento de datos con Spark
Características de Spark Resilient Distributed Datasets(RDDs)
Desarrollo de aplicaciones con Spark
Procesamiento de datos en tiempo real con Spark Streaming
Spark SQL
Introd. a Machine Learning: MLLIB
Módulo 4: Procesamiento de datos con Spark
Ingesta de información: Sqoop y Flume
Indexación y visualización: SolR y Banana
Base de datos NoSQL de documentos: MongoDB
Base de datos NoSQL de columnas: Cassandra y HBase
Base de datos de grafos: Neo4J