Apache Spark e procesamento masivo territorial - 2ª edición « Atrás
Tipo de edición Edición única (desempregados/as e ocupados/as)
Metodoloxía Virtual
Tipo CURSO
Matrícula Gratuíta
Data inicio 14/09/2026
Data fin 17/09/2026
Certificación oficial Non
Nº inscritos 1
Datos da edición
  • Período de inscrición : 01/07/2026 - 31/08/2026
  • Horario : Luns 14 e xoves 17 de setembro de 15:00 a 20:00 horas.
  • Número de prazas : 20
  • Período de docencia : 14/09/2026 - 17/09/2026
  • Criterios de selección :
    • Por orde de solicitude

Esta especialización práctica de 10 horas ensinará aos profesionais a orquestrar canles de datos empregando ecosistemas distribuídos baseados en Apache Spark (PySpark). Usando entornos Jupyter/Colab, transformarán conxuntos de datos brutos en capas analíticas limpas e optimizadas para a súa integración en plataformas xeoespaciais.

Dita actuación realizarase no marco do proxecto denominado "Aceleración de ecosistemas de emprendemento e innovación baseados en Xemelgos Dixitais". Plan de Recuperación, Transformación e Resiliencia - Financiado pola Unión Europea - NextGenerationEU.

Obxectivos :
  1. Comprender a computación distribuída.
  2. Desenvolver fluxos ETL en PySpark.
  3. Limpar e transformar dataframes territoriais.
Dirixido a :

Científicos de datos, enxeñeiros de datos, analistas de datos e desenvolvedores de Python centrados na xestión ETL de información xeográfica.

Perfil do docente :

Data Engineer senior experto en ecosistemas Hadoop/Spark e programación Python, con perfil altamente técnico.

  • Duración :
    10 horas
  • Metodoloxía :
    Virtual
  • Matrícula :
    Gratuíta
  • Tecnoloxía :
    • Xemelgos dixitais/Gemelos digitales
  • Beneficios :
    • Diploma de asistencia
  • Módulos transversais :
    • Igualdade de 5 horas
  1. Fundamentos de computación distribuída e Apache Spark.
  2. Xestión de Dataframes e execución de sentenzas Spark SQL.
  3. Orquestración de fluxos ETL masivos sobre datos espaciais.
  4. Técnicas de indexación espacial (Geohashing, particionamento).
  5. Automatización de pipelines mediante Jupyter Notebooks.