Lead Data Engineer

Michael Page

Madrid
60.000-65.000 € al año
Permanente
Tiempo completo

Hace 16 días
Solicite fácilmente

La figura estará incluida en el equipo de IT Digital & Data Transformation, tendrá responsabilidad sobre los grupos de Italia y España, y tendrá que ocuparse en particular de:

Implementación de canales de procesamiento de datos no analíticos de fuentes internas y externas, enriquecimiento de datos y almacenamiento en el lago de datos.
activar procesos de gobernanza de la calidad de los datos para garantizar la calidad, la coherencia, la precisión y el cumplimiento, así como el linaje de los datos
trabajar en estrecha colaboración con el equipo de ciencia de datos para facilitar el uso de datos y la implementación de algoritmos de aprendizaje automático en producción.

En concreto se tratará de:

Ingestión de flujos de datos de diferentes fuentes en la nube y on-premise
implementación de procesos de procesamiento de datos no analíticos
implementación de flujos para alimentar otros sistemas
industrialización de procesos analíticos escritos por científicos de datos
garantizar que los datos sean precisos y coherentes, gracias al uso de herramientas específicas como herramientas de gestión de metadatos, diccionario de datos, etc.
comprobar que la plataforma de big data funciona correctamente, en particular verificando el correcto funcionamiento de las tuberías, monitorizando los tiempos ETL y la coherencia de los datos de salida.
supervisión de las actividades de desarrollo para que sean consistentes con las tecnologías utilizadas y sigan las mejores prácticas definidas por el grupo

Cliente final|Proyecto indefinido y en crecimientoSe requiere al menos 5 años de experiencia en el puesto y en particular:

Experiencia en la creación de soluciones basadas en datos en entornos nativos de la nube.

Experiencia con herramientas y técnicas de calidad y gobernanza de datos.

Conocimiento y uso de al menos una de las diversas pilas de big data en la nube de GCP, AWS o Azure.

conocimiento profundo de los lenguajes Python y SQL, se valora el conocimiento de bash

conocimiento de los principales marcos de Big Data, en particular Spark Hive Airflow

conocimiento de los principios del modelado y gestión de datos en tiempo real

Visión a largo plazo sobre cómo hacer avanzar la infraestructura de datos al siguiente nivel, explorando y evaluando nuevas tecnologías según corresponda.

Buena capacidad para comunicarse en inglés o español.

Se aceptan conocimientos de tecnologías y habilidades de análisis como científico de datos.

Importante empresa editorial líder en España ubuicada en la zona norte de Madrid

Seguro de vida
Restaurante de empresa (comida en sus instalaciones por 1 euro al día)
Parking dentro del recinto
Plan de retribución flexible
Beneficios por convenio: ayuda a las gafas, ayuda por nacimiento hijo, etc….
Horario flexible. Son 36 horas/semana. El horario dependerá del área.
Vacaciones:

28 días laborables
El 24 y 31 diciembre
+ 3 días más por asuntos propios
2 días de teletrabajo.

Michael Page