Implementación de solucións analíticas con Azure Databricks « Atrás
Metodoloxía Virtual
Tipo SEMINARIO
Data inicio 21/05/2026
Data fin 21/05/2026
Datos da edición
  • Período de inscrición : 04/05/2026 - 20/05/2026
  • Horario : Horario de 16:30 a 20:30 horas.
  • Número de prazas : 232
  • Período de docencia : 21/05/2026 - 21/05/2026

Azure Databricks consolidouse como unha das plataformas máis potentes para construír solucións modernas de analítica de datos a gran escala. Esta sesión mostra como utilizar Databricks e Apache Spark para abordar proxectos de datos de principio a fin, desde a inxestión e transformación de información ata a automatización de procesos e a preparación de contornas listas para produción. Microsoft orienta este curso a profesionais que queren desenvolver competencias prácticas en procesamiento distribuído, modelado analítico e construción de pipelines sobre Azure Databricks.

Ao longo da sesión explorarase como traballar con Spark DataFrames, Spark SQL e PySpark, como moverse pola contorna de Databricks e como crear e optimizar táboas Delta. Tamén se abordarán aspectos clave de enxeñería de datos, como o deseño de procesos ETL, a xestión de cambios de esquema, o control de calidade do dato, a orquestración de cargas con Jobs e pipelines, e o uso de mecanismos de goberno e seguridade como Unity Catalog. O obxectivo é ofrecer unha visión práctica e estruturada de como construír solucións analíticas robustas, escalables e ben gobernadas sobre Azure Databricks.

Obxectivos :
  • Comprender o papel de Azure Databricks na construción de solucións analíticas modernas
  • Aprender a traballar con Spark DataFrames, Spark SQL e PySpark para procesar grandes volumes de datos
  • Coñecer como crear, xestionar e optimizar táboas Delta
  • Deseñar procesos ETL e fluxos de transformación de datos en contornas distribuídas
  • Entender como automatizar cargas e procesos mediante Jobs e pipelines
  • Descubrir capacidades de goberno, seguridade e control do dato en Azure Databricks
Dirixido a :

Profesionais de datos, data engineers, analistas avanzados, desenvolvedores e perfís técnicos que queiran aprender a deseñar, implementar e operar solucións analíticas modernas sobre Azure Databricks e Apache Spark. Segundo Microsoft, resulta especialmente útil contar previamente con fundamentos de Python e SQL, así como certa familiaridade con formatos como CSV, JSON ou Parqué.

Perfil do docente :

O relator será Jaime Gallo García, arquitecto de software, consultor tecnolóxico e Microsoft Certified Trainer (MCT), cunha sólida traxectoria en proxectos de analítica de datos, business intelligence e plataformas cloud de Microsoft. Traballou no deseño e implantación de solucións baseadas en Azure, Power BI, Aprendizaxe automática, Big Data e SQL Server, participando en iniciativas de análise preditiva, reporting avanzado e intelixencia de negocio para organizacións de primeiro nivel. A súa experiencia combina visión arquitectónica, coñecemento técnico e aplicación práctica de tecnoloxías de datos en contornas reais.

Ademais da súa actividade como arquitecto e consultor, impartiu preto de 7.000 horas de formación oficial como instrutor certificado de Microsoft, con especial foco en tecnoloxías vinculadas ao ecosistema de datos e analítica. Conta con certificacións Microsoft do itinerario DP, o que reforza un perfil especialmente adecuado para sesións relacionadas con enxeñería de datos, analítica avanzada e solucións sobre plataformas como Azure Databricks. A súa traxectoria profesional permítelle achegar unha visión práctica, actual e orientada a proxectos reais de explotación e transformación do dato.

  • Duración :
    2 horas
  • Metodoloxía :
    Virtual
  • Tecnoloxía :
    • Microsoft
    • Cloud
  • Introdución a Azure Databricks e Apache Spark
  • Exploración do workspace e xestión de recursos de proceso
  • Inxestión, transformación e análise de datos con Spark
  • Uso de Spark DataFrames, Spark SQL e PySpark
  • Creación e optimización de táboas Delta
  • Deseño de procesos ETL e tratamento de cambios de esquema
  • Calidade do dato e boas prácticas en procesamiento distribuído
  • Automatización e orquestración con Jobs e pipelines
  • Gobierno do dato, seguridade e Unity Catalog
  • Conclusións e seguintes pasos