II WorkShop sobre BIG DATA

II WorkShop sobre BIG DATA

JORNADA BIG DATA

 

En el mundo de hoy, vivimos inundados de datos. En un solo minuto en internet se registran millones de búsquedas en Google, se envían cientos de millones de correos electrónicos, millones de posts en Facebook,  tweets,  fotos en Instagram o compras en Amazon. Y no solo en Internet se crean datos, las empresas  y  las transacciones comerciales están digitalizadas, se almacena cada compra que realizamos,  cuánta  electricidad estamos consumiendo,  dónde realizamos cada llamada telefónica o  las condiciones de presión y temperatura en las que se fabricó un producto industrial. Pero para procesar toda la información contenida en los datos hace falta tecnología y profesionales que sean capaces de analizarla y convertirla en conocimiento.

 

La tecnología necesaria es lo que se conoce como Big Data, y consiste en desarrollo de software capaz de gestionar y analizar grandes cantidades de datos, que en la mayoría de ocasiones se generan en tiempo real y habitualmente tienen una estructura diversa.

 

Los profesionales, los científicos de datos,  deben  ser capaces de procesar  los datos en bruto,  realizar análisis estadísticos, diseñar y aplicar modelos de aprendizaje y además ser capaces de comunicar sus resultados de forma eficaz y convincente a través de visualizaciones,  presentaciones,  aplicaciones web o dashboards. 

 

En 2009, Hal Varian, director financiero de Google, dijo que la profesión más “sexy” del siglo XXI  iba a ser la de Científico de Datos.  Y de momento los datos lo confirman. Diversos estudios  llevados a cabo por alguna de las compañías más importantes en la búsqueda de empleo como LinkedIn, Ramstad o Indeed sitúan los Científicos de Datos, Ingenieros de Datos y especialistas en tecnologías Big Data en los primeros puestos de sus rankings de profesiones más demandadas.

 

En este curso aprenderás de forma práctica, a través de profesionales con muchos años de experiencia en el sector,  convertir datos en productos y servicios mediante el uso de las herramientas estadísticas más habituales en el mundo de la Ciencia de Datos. Sabrás escribir tu propio código para analizar grandes cantidades de datos, así como aplicar modelos de machine learning o aprendizaje estadístico a estos datos usando R, Python y  Spark.

 

Big Data y lenguaje de programación R en MasterD Madrid

 

En este Workshop vamos a ver una introducción para entender qué es exactamente la ciencia de datos y el Big Data y cuáles son sus procesos fundamentales.

 

Por otro lado vamos a hacer sumergirnos en el leguaje R usando  entorno de desarrollo Rstudio.  R es un sistema para análisis estadístico, manipulación y análisis de datos, simulación y representación gráfica creado por Ross Ihaka y Robert Gentleman en 1993. R deriva del lenguaje S creado por los Laboratorios AT&T Bell.

 

R más que un software estadístico puede considerarse como un lenguaje de programación en el que podemos programar nuestros procedimientos propios y aplicaciones.

 

Hoy en día el lenguaje R ha traspasado las fronteras de la estadística y es posible realizar casi cualquier cosa desde él.

 

Es software de código abierto con licencia GNU-GPL, y además es gratuito.  Sin embargo, tiene un fuerte equipo que lo desarrolla y mantiene (el “core group” está formado por más de 20 personas actualmente) y todos su desarrollos han sido masivamente probados.

 

R es el “estándar de facto” en computación estadística. Entre algunas de las grandes virtudes de R encontramos:

  • Grandes capacidades gráficas.
  • Miles de paquetes extienden su funcionalidad
  • Gran comunidad de desarrolladores e usuarios. Es fácil obtener ayuda de los expertos a través de listas de correo, foros o redes sociales.
  • Muchos paquetes orientados al modelado estadístico y al “machine learning”
  • Generación de documentación automática/reproducible (Rmarkdown) y aplicaciones web (shiny)
  • Integración con herramientas Big Data: Hadoop, Spark, etc.

 

Academia MasterD Madrid

 

Página de MasterD Madrid en Google+

Academia MasterD Madrid en Facebook.

Fotos de MasterD Madrid en Flickr.

1 respuesta a II WorkShop sobre BIG DATA

14 de junio del 2018

Espectacular Workshop sobre BIGDATA. Necesitamos a técnicos cualificados en esta tecnología para que nos ayuden a organizar y analizar todos los datos de los que disponemos. Van a jugar un papel fundamental en la cuarta revolución industrial (INDUSTRIA 4.0) o en la denominada "digitalización de la industria". No os podéis perder el siguiente.

RESPONDER
Nuevo Comentario