Temario
El término Big Data suele aplicarse a la información que no puede ser procesada o analizada usando procesos o herramientas tradicionales. Actualmente las empresas tienen acceso a una gran cantidad de información pero no saben como obtener valor añadido de la misma, con herramientas Big Data se puede procesar esta información donde muchas veces proviene de múltiples origenes como pueden ser las redes sociales o grandes bases de datos. También se pueden tratar los datos de múltiples fuentes y formatos, ya sean de texto, datos, imágenes o mezcla de todos estos.
Objetivo:
Dotar al participante en las técnicas de análisis y herramientas para la toma de decisiones con grandes volumenes de datos, de igual forma, el participante aprenderá las metodologías, arquitecturas, tecnologías y plataformas necesarias para la implementación de Big Data.
Perfil del participante:
Experiencia en el manejo de bases de datos relacionales, bases sólidas de programación orientada a objetos y programación con Java SE.
TEMARIO
Arquitectura y componentes Biga Data
Bases de datos NoSQL
Hadoop
Map Reduce
HDFS
Have
Pig
Big Data con MongoDB
Introducción a MongoDB
Manejo básico de datos
Agregación de datos con MongoDB
MapReduce
Aggregation Framework
Arquitectura de una solución MongoDB
Uso de índices
Creación del modelo de datos
Replicación y distribución de datos
Big Data analitico con Hadoop
Introducción a Hadoop
Big Data y Business Intelligence
Modelado de datos para análisis Big Data
Herramientas Big Data Analytics
Sistema de archivos distribuidos
Gestor de recursos
Planificador de tareas
Casos de estudio
Implementando Hadoop
Configuración del entorno
Creación y ejecución de tareas Map/Reduce
Interfáz para múltiples lenguajes
Ecosistemas Hadoop
Bases de datos distribuidas
Comunicación con bases de datos relacionales
Otras opciones Map/Reduce
Modelos predictivos Big Data
Data Mining
Text Mining
Web Mining
Forecast
Otros modelos predictivos
Análisis de casos Big Data en la vida Real