- Accueil
- Travail à Domicile
- SRE - DataPlatform
Déjà pourvu
Ne rate pas la prochaine offre. Reçois des postes adaptés directement par e-mail.
SRE - DataPlatform
Résumé du poste
Modèle de travail
SRE - DataPlatform
Être SRE chez VeepeeTech, c'est intégrer une communauté SRE transversale tout en rejoignant une équipe Data Platform orientée produit.
Vous contribuerez à la fiabilité, la scalabilité et l'opérabilité de services de données critiques en appliquant les pratiques SRE et DevOps, tout en partageant vos connaissances entre les équipes.
La Data Platform évolue actuellement vers une architecture lakehouse moderne déployée sur VeepeeCloud (notre plateforme on-premise), basée sur des technologies telles que Trino, Iceberg et le stockage objet, avec de fortes ambitions en matière de performance, d'efficacité des coûts et de propriété de la plateforme.
Vous travaillerez dans un environnement distribué (France & Espagne), au sein d'une équipe de 40 à 50 professionnels de la donnée couvrant l'ingénierie, l'analytique, la science des données et la gouvernance.
Vous jouerez un rôle clé pour assurer la fiabilité et la scalabilité de cette plateforme de données de nouvelle génération, tout en accompagnant la transition des architectures cloud public vers des architectures hybrides/on-premise.
🎯 TÂCHES
Platform Reliability & Operations
- Assurer la fiabilité et la performance de nos services de data platform (Trino, Iceberg, S3, Kafka, Flink)
- Définir et implémenter les meilleures pratiques SRE : SLI/SLO, budgets d'erreur, observabilité
- Construire et maintenir les frameworks de monitoring, d'alerting et de réponse aux incidents (Prometheus, Grafana, etc.)
Cloud Migration & Architecture
- Contribuer à la migration du datawarehouse cloud public vers la stack lakehouse VeepeeCloud
- Soutenir la coexistence entre les systèmes cloud et on-premise et assurer la cohérence et la fiabilité
- Aider à la conception d'architectures résilientes pour les couches d'ingestion, de transformation et de service
Kubernetes & Infrastructure
- Opérer et améliorer les services fonctionnant sur Kubernetes (clusters GKE/EKS & on-premise)
- Automatiser le provisionnement de l'infrastructure en utilisant Terraform, Atlantis et/ou Crossplane
- Améliorer les workflows GitOps pour le déploiement et la configuration de la plateforme
FinOps & Performance Optimization
- Collaborer avec les équipes pour optimiser l'utilisation du calcul/stockage (requêtes Trino, slots BigQuery, etc.)
- Construire des outils et des tableaux de bord pour suivre les coûts, l'utilisation et l'efficacité
- Soutenir la transition vers des charges de travail on-premise rentables
Developer Enablement
- Améliorer les capacités de self-service pour les équipes de données (par ex. provisionnement de ressources Trino/Iceberg)
- Aider les équipes à adopter les meilleures pratiques en matière de fiabilité, d'observabilité et de déploiement
- Rédiger une documentation technique claire et des runbooks
Resilience & DRP
- Contribuer à la définition et à la mise en œuvre du Plan de Reprise d'Activité (PRA)
- Assurer la résilience multi-DC (FR1 / NL1) et les stratégies de réplication des données
- Participer à la gestion des incidents et aux postmortems
👉 Compétences INDISPENSABLES
- Expérience solide avec Kubernetes en production
- Expérience avec les systèmes de données distribués (ou forte volonté d'apprendre)
- Compréhension solide des principes SRE (monitoring, alerting, SLAs/SLOs)
- Expérience avec l'Infrastructure as Code (Terraform ou similaire)
- Familiarité avec les workflows GitOps
- Expérience avec les outils d'observabilité (Prometheus, Grafana, systèmes de logging)
- A l'aise pour travailler dans des environnements cloud
- Fort état d'esprit collaboratif et capacité à travailler en transverse
- Maîtrise de l'anglais
👉 Compétences APPRÉCIÉES
- Expérience avec Trino, Iceberg ou les architectures lakehouse de données
- Expérience avec Ceph S3 ou les systèmes de stockage objet
- Connaissance de Kafka / Flink / Airflow
- Expérience avec les pratiques FinOps et l'optimisation des coûts
- Expérience avec Crossplane ou les modèles de self-service de plateforme
- Compétences en programmation (Python, Java ou Go)
- Expérience avec les architectures multi-régions / multi-DC
✅ AVANTAGES
- Bonus variable ;
- L'environnement dynamique et créatif au sein d'équipes internationales ;
- La variété des cours d'auto-formation sur notre plateforme e-learning ;
- Participation à des meetups et conférences locales et internationales ;
- Flexible Office avec jusqu'à 3 jours de télétravail
⚙️ PROCESSUS DE RECRUTEMENT
- 1️⃣ 30 min de Présélection RH avec un Recruteur Veepeeᵀᵉᶜʰ
- 2️⃣ Échange technique général
- 3️⃣ Échange technique avec le manager
- 4️⃣ Entretien d'équipe
Nous sommes convaincus qu'il vous appartient de définir votre façon de travailler, de vous développer et de progresser.
Chez Veepee nous vous garantissons que vous pouvez juste être vous-même !
Au service de la diversité et de l'inclusion, Veepee s'engage à examiner toutes les candidatures reçues sur un pied d'égalité.
🔗 ENTREPRISE
Pour plus d'informations sur notre écosystème : https://careers.veepee.com/en/home-page-en/