| Tipo de edición | Edición única (desempleados/as y ocupados/as) |
|---|---|
| Metodología | Virtual |
| Tipo | CURSO |
| Matrícula | Gratuita |
| Fecha inicio | 14/09/2026 |
| Fecha fin | 17/09/2026 |
| Certificación oficial | No |
| Nº inscritos | 1 |
Especialización práctica de 10 horas en la que los profesionales aprenderán a orquestar pipelines de datos usando ecosistemas distribuidos basados en Apache Spark (PySpark). Utilizando entornos Jupyter/Colab, transformarán conjuntos de datos crudos en capas analíticas limpias y óptimas para la integración en plataformas geoespaciales.
Dicha actuación se realizará en el marco del proyecto denominado "Aceleración de ecosistemas de emprendimiento e innovación basados en Gemelos Digitales". Plan de Recuperación, Transformación y Resiliencia - Financiado por la Unión Europea - NextGenerationEU.
- Comprender los fundamentos de la computación distribuida.
- Desarrollar flujos ETL masivos en PySpark.
- Limpiar y transformar dataframes territoriales complejos.
Científicos de datos, Data Engineers, analistas de datos y desarrolladores Python orientados a la gestión ETL de información geográfica.
Data Engineer senior experto en ecosistemas Hadoop/Spark y programación Python, con perfil altamente técnico y experiencia en optimización de algoritmos distribuidos.
- Duración :
10 horas - Metodología :
Virtual - Matrícula :
Gratuita - Tecnología :
- Xemelgos dixitais/Gemelos digitales
- Beneficios :
- Diploma de asistencia
- Módulos transversales :
- Igualdad de 5 horas
- Fundamentos de computación distribuida y Apache Spark.
- Gestión de Dataframes y ejecución de sentencias Spark SQL.
- Orquestación de flujos ETL masivos sobre datos espaciales.
- Técnicas de indexación espacial (Geohashing, particionamiento).
- Automatización de pipelines mediante Jupyter Notebooks.