Estudios de Big Data

¿Quieres estudiar para ser Científico de Datos? En la actualidad es una de las profesiones se necesitan expertos especializados en Big Data y análisis de datos.

Con este curso de Big Data aprenderás de forma práctica, a través de profesionales con muchos años de experiencia en el sector, convertir datos en productos y servicios mediante el uso de las herramientas estadísticas más habituales en el mundo de la Ciencia de Datos.

Fórmate en un sector con garantías de la mano de la empresa DNV-GL, multinacional que opera en más de 100 países especializada en el sector de la energía, en el marítimo, en del petróleo/gas y en el desarrollo de software.

Sabrás escribir tu propio código para analizar grandes cantidades de datos, así como aplicar modelos de machine learning o aprendizaje estadístico a estos datos usando R, Python y  Spark.
En el mundo de hoy, vivimos inundados de datos. En un solo minuto en internet se registran millones de búsquedas en Google, se envían cientos de millones de correos electrónicos, millones de posts en Facebook,  tweets,  fotos en Instagram o compras en Amazon. Y no solo en Internet se crean datos, las empresas y las transacciones comerciales están digitalizadas, se almacena cada compra que realizamos, cuánta electricidad estamos consumiendo, dónde realizamos cada llamada telefónica o  las condiciones de presión y temperatura en las que se fabricó un producto industrial.
Pero para procesar toda la información contenida en los datos hace falta tecnología y profesionales que sean capaces de analizarla y convertirla en conocimiento.
La tecnología necesaria es lo que se conoce como Big Data, y consiste en desarrollo de software capaz de gestionar y analizar grandes cantidades de datos, que en la mayoría de ocasiones se generan en tiempo real y habitualmente tienen una estructura diversa.

 

MÓDULO 1: CIENCIA DE DATOS

  1.  Introducción general  al Big Data y la ciencia de datos. ¿Qué es el Big Data y la Ciencia de Datos?
  2. Introducción a R y Rstudio. Aprenderás a utilizar R: lenguaje de programación que permite realizar análisis mucho más potentes y reproducibles.
  3. Estadística descriptiva. La estadística descriptiva tiene por misión recolectar, presentar y caracterizar un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.
  4. Visualización de datos y comunicación de resultados. Aprenderás algunas de las herramientas que ggplot2 proporciona para crear gráficos eficaces, bien diseñados para la difusión y la publicación.
  5. Inferencia estadística. El objetivo de la inferencia estadística es obtener conclusiones sobre las características de una población basadas en medidas realizadas sobre una muestra (frecuentemente pequeña) de esta.
  6. Conceptos básicos de aprendizaje estadístico. Aprenderás técnicas que te permitan entender las relaciones que existen entre los datos, lo denominaremos aprendizaje estadístico. 
  7. Modelos de regresión. Tipo de modelos de regresión que te permitirán invertir el presupuesto de publicidad de forma más eficiente en los próximos países/regiones en los que se produzcan lanzamientos de producto.
  8. Modelos de clasificación. Tres de las técnicas de clasificación o clasificadores más utilizados: regresión logística, análisis de discriminantes y K-vecinos.

MÓDULO 2: HERRAMIENTAS BIG DATA

  1. Python para análisis de datos. Python es uno de los lenguajes de programación más populares utilizado desde el desarrollo de aplicaciones y servicios web hasta en la programación de sistemas operativos.
  2. Introducción al Big Data. Visión general de Big Data y la Ciencia de Datos, problemas que resuelve y cómo los resolverlos.
  3. Tecnologías Big Data I. Hadoop. Hadoop es un ecosistema de herramientas Open Source que te permitirán almacenar enormes volúmenes de datos en diferentes servidores. 
  4. Tecnologías Big Data II: Spark. Apache Spark es una framework de computación en cluster open-source. Proporciona un motor optimizado que soporta la ejecución de grafos en general. Además, soporta un conjunto extenso de herramientas de alto nivel entre las que se incluyen Spark SQL (para el procesamiento de datos estructurados basada en SQL), MLlib para implementar machine learning, GraphX para el procesamiento de grafos y Spark Streaming. 
  5. Tecnologías Big Data III: BDD NoSQL. En bases de dato NoSql los datos almacenados no requieren estructuras fijas (tablas) y habitualmente escalan bien horizontalmente. Los sistemas NoSQL se denominan a veces "no sólo SQL" para subrayar el hecho de que también pueden soportar lenguajes de consulta de tipo SQL. 
  6. Arquitectura Big Data. Uno de los perfiles más demando dentro del Big Data, es el Arquitecto que se encarga de definir la infraestructura que tendrá la plataforma de Big Data y los casos de uso de esta.

PROYECTO FINAL DE CURSO.

 
Estarás preparado para optar a puestos de:
  • Científico de Datos (Data Scientist)
  • Ingeniero de datos
  • Inteligencia de Negocio,  Analista de negocio (Business Intelligence) 
  • Arquitecto y programador Big Data
En general cualquier puesto que requiera ser capaces de analizar datos, especialmente los relacionados con Big Data
 

El curso de Big Data están dirigidos a personas con estudios de:

  • Ciclo formativo de Grado Superior en Desarrollo de aplicaciones informáticas.
  • Ingeniero Informático.
  • Grado en Matemáticas.
  • Grado en Física.
  • Ingeniero Industrial.
 
te informamos sin compromiso
Rellene el formulario para que el centro pueda responderle
0034
Estudios mínimos: DIPLOMATURA o GRADOS
   He leído y acepto la información legal