Descripción
Introduccion
Los programas monográficos Big Data &ndash, Hadoop(BDH)son cursos profesionales de especialización técnica dirigidos a ingenieros informáticos que deseen convertirse en especialistas en el ecosistema líder y de referencia en el mundo del Big Data: Apache Hadoop.
Hadoop se ha convertido en la plataforma más utilizada en los proyectos Big Data de multitud de compañías de prácticamente todos los sectores, haciendo posible el procesamiento masivo de datos en una escala de petabytes. Como consecuencia, el perfil de especialista en Hadoop es cada vez más demandado y valorado, pues las empresas necesitan profesionales capaces de:
* Diseñar, operar y administrar clustersHadoop.
* Desarrollar, migrar y optimizar aplicaciones que usan clustersHadoop.
* Analizar grandes cantidades de datos en clustersHadoop
Objetivos:
Diseñar y ejecutar nuevas estrategias y algoritmos de análisis de grandes volúmenes de datos usando el ecosistema Hadoop.
Implementar nuevas estrategias de analítica en base al procesamiento masivo paralelo de Hadoop.
Realizar análisis de datos no estructurados.
Dirigido a:
Graduado en estadística, matemáticas, computación, o equivalente, con experiencia previa en informática y en el manejo de software de análisis de datos (por ej. SPSS, Matlab, etc.).
Con orientación al diseño de algoritmos.
Temario
Contenidos:
Introducción Big Data y Hadoop
Data Science (A.D. y M.Learning)
Metodologías de análisis de datos
R, IPython, NumPy, SciPy
Entorno MapReduce y HDFS
Computac. paralela con R Hadoop
HadoopStreaming con R
Text Mining e introducción a PLN