- Accueil
- Travail à Domicile
- Senior Site Reliability Engineer (SRE)
Senior Site Reliability Engineer (SRE)
Résumé du poste
Modèle de travail
Nous cherchons un·e Senior SRE qui aime autant tenir un système en prod que le faire évoluer. Quelqu'un pour qui la fiabilité n'est pas une couche qu'on ajoute en dernier, mais quelque chose qui se conçoit dès le départ.
Tu rejoins une équipe tech de 10 personnes, CTO inclus, et tu seras la référence sur tout ce qui touche à la stabilité, la performance et l'observabilité de notre plateforme. Rodrigue et les développeurs sont tes interlocuteurs directs, sans couche de management entre vous et les vrais sujets.
Répartition attendue : 70 % infra/30 % développement backend.
🛠️ Ce que tu feras concrètement
- Concevoir et opérer une infrastructure hautement disponible, scalable, capable de gérer un grand volume de données IoT en temps réel
- Contribuer au choix et à la mise en place d'un nouveau cloud provider, de la phase d'évaluation jusqu'au déploiement
- Installer une culture SRE dans l'équipe, avec la philosophie "you build it, you run it", en accompagnant les développeurs sur les pratiques DevOps
- Mettre en place et faire évoluer le monitoring, l'alerting et l'observabilité de bout en bout
- Piloter la gestion des incidents pour réduire le MTTR et améliorer la résilience
- Sécuriser la plateforme et maintenir la conformité, sans sacrifier la vélocité ni exploser les coûts
- Automatiser ce qui peut l'être : infra as code, CI/CD, outillage interne
- Contribuer au développement backend quand c'est utile, sur une stack Rust/ Python
- Peser dans les décisions d'architecture et participer à la vision technique de nos produits
⚙️ La stack
Pas besoin d'être expert sur tout, mais l'envie de creuser est attendue.
- Cloud : AWS (idéalement), GCP, Digital Ocean
- Langages : Python (indispensable en prod), Rust (la curiosité est bienvenue, l'expertise pas requise)
- Infra : Kubernetes, Docker, Helm
- Observabilité : Prometheus, Grafana, OpenTelemetry
- CI/CD : GitLab CI ou équivalent
- Architecture : microservices, systèmes distribués, CQRS
👤 Ce que nous cherchons
Côté expérience :
- Solide background SRE/DevOps/Platform Engineering, 5 ans minimum
- Bonne compréhension des systèmes distribués et des enjeux de scaling
- Expérience sur des applications web à fort trafic
- Capable de coder en production : Python indispensable, Rust un vrai plus
- À l'aise avec AWS et les environnements cloud modernes
Côté façon de travailler :
- Tu prends les sujets en main sans attendre
- Tu aimes que l'équipe monte en compétences
- Tu as un sens du produit et tu comprends pourquoi ce que tu construis compte pour les clients
- Tu communiques clairement, y compris quand quelque chose ne va pas
🧠 Ce que nous cherchons vraiment
Nous ne cherchons pas quelqu'un qui exécute des tickets. Nous cherchons quelqu'un qui comprend les enjeux, anticipe les problèmes et fait avancer les sujets même quand les contours ne sont pas totalement définis.
🌟 Pourquoi rejoindre Sensinov ?
- Une solution à impact concret : ce que tu construis se traduit directement en économies d'énergie chez des clients réels, à grande échelle
- Une entreprise ambitieuse : références solides et un marché qui s'accélère
- Une équipe engagée et accessible : 10 personnes, un accès direct au CTO, des décisions qui se prennent vite
🎁 Nos avantages
- Carte Swile
- Mutuelle Alan
- Environ 7 jours de RTT par an
- Télétravail 2 jours par semaine
- Formation interne
- Cadre de travail agréable
- Corbeille de fruits
🔬 Process de recrutement
- Échange avec Sophie (RH) : motivations, valeurs, contexte
- Entretien technique avec Rodrigue (CTO) : compétences, vision, fit avec le poste
- Tests techniques (coding + architecture) : pour évaluer ta maîtrise sur des cas concrets
Infos pratiques :
- Localisation : Labège
- Télétravail : 2 jours par semaine
- Contrat : CDI
- Rémunération : selon profil