Implementación de soluciones analíticas con Azure Databricks « Atrás
Metodología Virtual
Tipo SEMINARIO
Fecha inicio 21/05/2026
Fecha fin 21/05/2026
Datos de la edición
  • Periodo de inscripción : 04/05/2026 - 20/05/2026
  • Horario : Horario de 16:30 a 20:30 horas.
  • Número de plazas : 232
  • Periodo de docencia : 21/05/2026 - 21/05/2026

Azure Databricks se ha consolidado como una de las plataformas más potentes para construir soluciones modernas de analítica de datos a gran escala. Esta sesión muestra cómo utilizar Databricks y Apache Spark para abordar proyectos de datos de principio a fin, desde la ingestión y transformación de información hasta la automatización de procesos y la preparación de entornos listos para producción. Microsoft orienta este curso a profesionales que quieren desarrollar competencias prácticas en procesamiento distribuido, modelado analítico y construcción de pipelines sobre Azure Databricks.

A lo largo de la sesión se explorará cómo trabajar con Spark DataFrames, Spark SQL y PySpark, cómo moverse por el entorno de Databricks y cómo crear y optimizar tablas Delta. También se abordarán aspectos clave de ingeniería de datos, como el diseño de procesos ETL, la gestión de cambios de esquema, el control de calidad del dato, la orquestación de cargas con Jobs y pipelines, y el uso de mecanismos de gobierno y seguridad como Unity Catalog. El objetivo es ofrecer una visión práctica y estructurada de cómo construir soluciones analíticas robustas, escalables y bien gobernadas sobre Azure Databricks.

Objetivos :
  • Comprender el papel de Azure Databricks en la construcción de soluciones analíticas modernas
  • Aprender a trabajar con Spark DataFrames, Spark SQL y PySpark para procesar grandes volúmenes de datos
  • Conocer cómo crear, gestionar y optimizar tablas Delta
  • Diseñar procesos ETL y flujos de transformación de datos en entornos distribuidos
  • Entender cómo automatizar cargas y procesos mediante Jobs y pipelines
  • Descubrir capacidades de gobierno, seguridad y control del dato en Azure Databricks
Dirigido a :

Profesionales de datos, data engineers, analistas avanzados, desarrolladores y perfiles técnicos que quieran aprender a diseñar, implementar y operar soluciones analíticas modernas sobre Azure Databricks y Apache Spark. Según Microsoft, resulta especialmente útil contar previamente con fundamentos de Python y SQL, así como cierta familiaridad con formatos como CSV, JSON o Parquet.

Perfil del docente :

El ponente será Jaime Gallo García, arquitecto de software, consultor tecnológico y Microsoft Certified Trainer (MCT), con una sólida trayectoria en proyectos de analítica de datos, business intelligence y plataformas cloud de Microsoft. Ha trabajado en el diseño e implantación de soluciones basadas en Azure, Power BI, Machine Learning, Big Data y SQL Server, participando en iniciativas de análisis predictivo, reporting avanzado e inteligencia de negocio para organizaciones de primer nivel. Su experiencia combina visión arquitectónica, conocimiento técnico y aplicación práctica de tecnologías de datos en entornos reales.

Además de su actividad como arquitecto y consultor, ha impartido cerca de 7.000 horas de formación oficial como instructor certificado de Microsoft, con especial foco en tecnologías vinculadas al ecosistema de datos y analítica. Cuenta con certificaciones Microsoft del itinerario DP, lo que refuerza un perfil especialmente adecuado para sesiones relacionadas con ingeniería de datos, analítica avanzada y soluciones sobre plataformas como Azure Databricks. Su trayectoria profesional le permite aportar una visión práctica, actual y orientada a proyectos reales de explotación y transformación del dato.

  • Duración :
    2 horas
  • Metodología :
    Virtual
  • Tecnología :
    • Microsoft
    • Cloud
  • Introducción a Azure Databricks y Apache Spark
  • Exploración del workspace y gestión de recursos de proceso
  • Ingestión, transformación y análisis de datos con Spark
  • Uso de Spark DataFrames, Spark SQL y PySpark
  • Creación y optimización de tablas Delta
  • Diseño de procesos ETL y tratamiento de cambios de esquema
  • Calidad del dato y buenas prácticas en procesamiento distribuido
  • Automatización y orquestación con Jobs y pipelines
  • Gobierno del dato, seguridad y Unity Catalog
  • Conclusiones y siguientes pasos