Cursos - Apache Spark e procesamento masivo territorial - 2ª edición - CNTG

Apache Spark e procesamento masivo territorial - 2ª edición « Atrás

Tipo de edición	Edición única (desempregados/as e ocupados/as)
Metodoloxía	Virtual
Tipo	CURSO
Matrícula	Gratuíta
Data inicio	14/09/2026
Data fin	17/09/2026
Certificación oficial	Non
Nº inscritos	1

PDF

Ficha
Apache Spark e procesamento masivo territorial - 2ª edición

Datos da edición

Período de inscrición : 01/07/2026 - 31/08/2026
Horario : Luns 14 e xoves 17 de setembro de 15:00 a 20:00 horas.
Número de prazas : 20
Período de docencia : 14/09/2026 - 17/09/2026
Criterios de selección :
- Por orde de solicitude

Datos xerais
Temario

Esta especialización práctica de 10 horas ensinará aos profesionais a orquestrar canles de datos empregando ecosistemas distribuídos baseados en Apache Spark (PySpark). Usando entornos Jupyter/Colab, transformarán conxuntos de datos brutos en capas analíticas limpas e optimizadas para a súa integración en plataformas xeoespaciais.

Dita actuación realizarase no marco do proxecto denominado "Aceleración de ecosistemas de emprendemento e innovación baseados en Xemelgos Dixitais". Plan de Recuperación, Transformación e Resiliencia - Financiado pola Unión Europea - NextGenerationEU.

Obxectivos :

Comprender a computación distribuída.
Desenvolver fluxos ETL en PySpark.
Limpar e transformar dataframes territoriais.

Dirixido a :

Científicos de datos, enxeñeiros de datos, analistas de datos e desenvolvedores de Python centrados na xestión ETL de información xeográfica.

Perfil do docente :

Data Engineer senior experto en ecosistemas Hadoop/Spark e programación Python, con perfil altamente técnico.

Duración :
10 horas
Metodoloxía :
Virtual
Matrícula :
Gratuíta
Tecnoloxía :
- Xemelgos dixitais/Gemelos digitales
Beneficios :
- Diploma de asistencia
Módulos transversais :
- Igualdade de 5 horas

Fundamentos de computación distribuída e Apache Spark.
Xestión de Dataframes e execución de sentenzas Spark SQL.
Orquestración de fluxos ETL masivos sobre datos espaciais.
Técnicas de indexación espacial (Geohashing, particionamento).
Automatización de pipelines mediante Jupyter Notebooks.