Déjà pourvu

Ne rate pas la prochaine offre. Reçois des postes adaptés directement par e-mail.

Senior MLOps Engineer - Data Ingestion - Paris

Résumé du poste

Paris
Data Scientist

Modèle de travail

Hybride · 2 jours à domicile
il y a 1 mois
Description du poste

Votre Impact

Nous recherchons un(e) Ingénieur(e) MLOps Senior pour rejoindre la Team Panda (Data & ML Operations) au sein de l'équipe Data & AI Platform.

Votre mission sera de construire et maintenir des pipelines ML sécurisés en production, transformant notre manière de gérer les données de santé à grande échelle. Vous travaillerez au sein d'une feature team développant une infrastructure de données critique qui permet la prise de décision basée sur les données tout en protégeant la confidentialité des patients pour des millions d'utilisateurs.

Travailler dans la tech chez Doctolib, c'est construire des produits et fonctionnalités innovants pour améliorer le quotidien des équipes soignantes et des patients.

Ce que vous allez construire

Vos responsabilités incluent, sans s'y limiter :

  • Concevoir et implémenter des pipelines ML de bout en bout en production (LLM et modèles personnalisés) avec des frameworks robustes de déploiement, d'évaluation et de monitoring.
  • Être responsable de l'architecture de pseudonymisation des données au sein des services d'ingestion, convertissant le Tier 0 (identifiants personnels) en Tier 1 (données anonymisées) tout en garantissant la qualité des données et la performance des modèles.
  • Construire et maintenir des services d'exportation de données sécurisés avec détection de menaces basée sur le ML pour prévenir les vecteurs d'attaque (injection SQL, etc.) en utilisant des modèles adaptatifs plutôt que des règles manuelles.
  • Gérer les jeux de données de référence (golden datasets) et implémenter des frameworks d'évaluation de modèles en production pour assurer la qualité de l'anonymisation et la fiabilité du système.
  • Construire et maintenir des pipelines de données qui extraient, transforment et chargent efficacement les données à partir de diverses sources, en gérant plusieurs formats de données (texte, images, audio, vidéo).
  • Implémenter des outils d'automatisation et d'orchestration à l'aide de plateformes d'orchestration ML (MLflow, Braintrust ou similaires) pour rationaliser le provisionnement de l'infrastructure et réduire l'effort manuel.
  • Surveiller les plateformes de données et ML pour la performance, la fiabilité et la sécurité ; identifier et résoudre les problèmes de manière proactive.
  • Mentorer les membres de l'équipe sur l'expertise MLOps et les meilleures pratiques pour réduire les silos de connaissances et renforcer les capacités organisationnelles.

La vie chez Doctolib Tech

  • Nos solutions sont construites sur une plateforme unique entièrement cloud-native qui prend en charge les interfaces web et mobiles, plusieurs langues, et est adaptée aux exigences des pays et des spécialités médicales.
  • Notre stack est composée de Rails, TypeScript, Java, Python, Kotlin, Swift et React Native.
  • Nous exploitons l'IA de manière éthique dans nos produits pour responsabiliser les patients et les professionnels de la santé. Découvrez notre vision de l'IA ici.

Envie d'en savoir plus sur notre culture et notre environnement tech ? Visitez le site Doctolib Tech.

Ce que vous apportez

Avant de lire la suite : si vous n'avez pas le profil exact décrit ci-dessous, mais que vous pensez que cette description de poste correspond à vos compétences, nous vous encourageons toujours à postuler.

Vous serez un excellent candidat si :

  • Vous avez au moins 7 ans d'expérience en tant qu'Ingénieur(e) MLOps ou Ingénieur(e) Plateforme ML, avec une expérience avérée dans la gestion du cycle de vie des modèles en production.
  • Vous avez une expérience de niveau expert avec les outils d'orchestration ML (MLflow, Braintrust ou similaires) pour les pipelines de traitement par lots et d'inférence.
  • Vous avez une solide base en Site Reliability Engineering (SRE) axée sur l'excellence opérationnelle, la fiabilité et l'observabilité.
  • Vous avez une expertise en Python pour l'automatisation et le scripting de pipelines ML.
  • Vous maîtrisez les outils d'infrastructure-as-code tels que Terraform et l'orchestration de conteneurs (Kubernetes).
  • Vous avez de l'expérience avec les frameworks d'évaluation de modèles et la gestion des jeux de données de référence.
  • Vous avez une solide compréhension de l'infrastructure cloud (idéalement GCP, AWS ou Azure).
  • Vous possédez d'excellentes compétences en résolution de problèmes, axées sur l'identification et la résolution des goulots d'étranglement de l'infrastructure.
  • Vous êtes fluent en anglais.

Ce serait un plus si :

  • Vous avez une expérience de déploiement de LLM ou de modèles personnalisés en production.
  • Vous avez des connaissances sur les frameworks de sécurité et de confidentialité des données (RGPD, anonymisation, pseudonymisation).
  • Vous avez de l'expérience dans la construction et le monitoring de services de sécurité et de systèmes de détection de menaces.
  • Vous avez de solides compétences en communication et en mentorat pour favoriser le transfert de connaissances entre les équipes.

Ce que nous offrons

  • Assurance santé complète gratuite pour vous et vos enfants.
  • 25 jours de congés payés par an, plus jusqu'à 14 jours de RTT.
  • Services gratuits de santé mentale et de coaching via notre partenaire Moka.care.
  • Possibilité de travailler depuis l'étranger jusqu'à 10 jours par an grâce à notre politique de jours de flexibilité.
  • Chèques déjeuner (carte Swile) d'une valeur de 8,50 € par jour travaillé, dont 4,50 € pris en charge par Doctolib.
  • Une subvention du comité d'entreprise pour rembourser une partie de l'adhésion à un club de sport ou à un cours créatif.
  • Remboursement à 50% de votre abonnement de transport en commun.
  • Programme Parent Care : recevez un mois de congé supplémentaire en plus du congé parental légal.
  • Pour les aidants et les travailleurs en situation de handicap, un package incluant une adaptation de la politique de télétravail, des jours de congés supplémentaires pour raisons médicales et un soutien psychologique.
  • Aide à la relocalisation en cas de mobilité internationale.
  • Accès aux meilleurs outils d'IA pour le codage, le développement et formations dédiées.

Notre processus d'entretien

  • Entretien Recruteur
  • Étude de cas technique
  • Entretien System Design
  • Entretien Comportemental
  • Au moins une vérification de références

Nous voulons que votre expérience soit claire, respectueuse et transparente. En savoir plus sur notre processus d'embauche sur notre page expérience candidat.

Détails du poste

  • Poste en CDI
  • Stack technique : Python
  • Temps plein
  • Nantes & Paris (Politique Hybride : 2 jours de télétravail / semaine)
  • Date de début : dès que possible

Nous accueillons tout le monde

Chez Doctolib, nous nous engageons à améliorer l'accès aux soins pour tous. Cela se traduit dans notre processus de recrutement. Nous évaluons les candidats uniquement sur leurs qualifications et leur motivation, sans aucune forme de discrimination.

Plus les idées diverses sont entendues, plus notre produit améliorera réellement les soins de santé pour tous. Vous êtes invité(e) à postuler chez Doctolib, quel que soit votre genre, votre religion, votre âge, votre orientation sexuelle, votre origine ethnique ou votre handicap.

Afin de garantir l'égalité des chances, nous vous invitons à exclure les informations personnelles (par exemple, photos, âge) de vos candidatures. Si vous avez besoin d'un aménagement, veuillez nous en informer pour obtenir de l'aide pendant le processus d'embauche.

Rejoignez-nous pour construire la santé dont nous rêvons tous !

Votre confidentialité des données

Toutes les informations fournies sont traitées par Doctolib pour la gestion des candidatures. Pour plus de détails sur le traitement des données, cliquez ici : France. Veuillez contacter hr.dataprivacy(at)doctolib.com pour toute question ou pour exercer vos droits.