Temario del curso

Introducción

  • El Proceso de Ciencia de Datos
  • Roles y responsabilidades de un Científico de Datos

Preparación del Entorno de Desarrollo

  • Bibliotecas, frameworks, lenguajes y herramientas
  • Desarrollo local
  • Desarrollo web colaborativo

Recopilación de Datos

  • Diferentes Tipos de Datos
    • Estructurados
      • Bases de datos locales
      • Conectores de bases de datos
      • Formatos comunes: xlxs, XML, Json, csv, ...
    • No Estructurados
      • Clicks, sensores, smartphones
      • APIs
      • Internet de las Cosas (IoT)
      • Documentos, imágenes, videos, sonidos
  • Estudio de caso: Recopilación continua de grandes cantidades de datos no estructurados

Almacenamiento de Datos

  • Bases de datos relacionales
  • Bases de datos no relacionales
  • Hadoop: Sistema de Archivos Distribuido (HDFS)
  • Spark: Conjunto de Datos Distribuidos Resilientes (RDD)
  • Almacenamiento en la nube

Preparación de Datos

  • Ingesta, selección, limpieza y transformación
  • Garantizar la calidad de los datos - corrección, significado y seguridad
  • Informes de excepciones

Lenguajes utilizados para la Preparación, Procesamiento y Análisis

  • Lenguaje R
    • Introducción a R
    • Manipulación de datos, cálculo y visualización gráfica
  • Python
    • Introducción a Python
    • Manipulación, procesamiento, limpieza y análisis de datos

Análisis de Datos

  • Análisis exploratorio
    • Estadísticas básicas
    • Visualizaciones preliminares
    • Comprender los datos
  • Causalidad
  • Características y transformaciones
  • Aprendizaje Automático (Machine Learning)
    • Supervisado vs no supervisado
    • Cuándo usar qué modelo
  • Procesamiento del Lenguaje Natural (NLP)

Visualización de Datos

  • Mejores Prácticas
  • Selección del gráfico adecuado para los datos adecuados
  • Paletas de colores
  • Pasar al siguiente nivel
    • Tableros (Dashboards)
    • Visualizaciones interactivas
  • Cuentacuentos con datos

Resumen y Conclusión

Requerimientos

  • Comprensión general de los conceptos de bases de datos
  • Comprensión básica de estadísticas
 35 Horas

Número de participantes


Precio por Participante​

Testimonios (5)

Próximos cursos

Categorías Relacionadas