Opportunity Description
Stack & Ferramentas
- Lakehouse & storage: Apache Iceberg, Amazon S3, Athena + Glue (Trino + Hive na evolução)
- Streaming & ingestão: Kafka (MSK), Apache Flink, Debezium (CDC), Schema Registry
- Transformação & orquestração: dbt, Apache Airflow
- Semantic layer & OLAP: Cube.js, ClickHouse, Apache Pinot, Trino
- Governança & qualidade: OpenMetadata, Lake Formation, Great Expectations
- Infra & dev: EKS/Kubernetes, ArgoCD, Crossplane, GitHub, Claude Code
O que Buscamos
Essenciais
Domínio de SQL e otimização de queries em ambientes distribuídos (Mínimo 5 anos).
Python com experiência sólida em PySpark ou processamento distribuído.
Orquestração (Airflow), ELT e dbt aplicados em larga escala (Mínimo 4 anos) .
Streaming (Kafka, Flink) e arquiteturas Lakehouse com Apache Iceberg (Mínimo 3 anos).
Sólida noção de governança, qualidade e modelagem de dados.
<...Ready to Apply?
Submit your application for Engenheiro de dados sênior at Leega Consultoria
Apply for this Position