- Accueil
- Travail à Domicile
- Senior Data Engineer - Feature Platform
Senior Data Engineer - Feature Platform
Résumé du poste
Modèle de travail
À propos de Voodoo
Fondée en 2013, Voodoo est une entreprise technologique qui crée des jeux et des applications mobiles avec pour mission de divertir le monde. Avec 800 employés, 7 milliards de téléchargements et plus de 200 millions d'utilisateurs actifs, Voodoo est le 3ème éditeur mobile mondial en termes de téléchargements, après Google et Meta. Notre portefeuille comprend des jeux à succès comme Mob Control et Block Jam, ainsi que des applications populaires telles que BeReal et Wizz.
L'équipe
L'équipe Ingénierie & Data construit des produits et plateformes technologiques innovants pour soutenir la croissance impressionnante de leurs jeux et applications grand public, ce qui permet à Voodoo de rester à la pointe de l'industrie du jeu mobile.
Le Voodoo Ad-Network est un groupe de produits autonome d'environ 60 professionnels très motivés avec une mission ambitieuse : construire des services de régie publicitaire de premier plan. Notre objectif principal est de tirer parti de l'écosystème massif de données propriétaires de Voodoo pour optimiser et faire évoluer la monétisation. Nous sommes en phase de croissance rapide, nous nous développons dans de nouvelles entreprises telles que l'ouverture à l'inventaire externe, la pénétration du marché des annonceurs externes et la conduite de la monétisation des réseaux sociaux suite à notre récente acquisition de BeReal. Pour soutenir cette trajectoire incroyable et les premiers résultats prometteurs, nous élargissons notre équipe.
L'équipe Feature Platform est le moteur d'infrastructure fondamental qui permet nos capacités de recommandation publicitaire par ML. Inspirés par les principaux magasins de fonctionnalités de l'industrie, nous construisons et maintenons la couche de données unifiée pour nos fonctionnalités d'apprentissage automatique. Notre mission est d'accélérer le cycle de vie du ML en fournissant une architecture unifiée, évolutive et hautement disponible pour le calcul, le stockage et la diffusion de fonctionnalités par lots, en temps réel et à la demande.
Au-delà de la simple construction de l'infrastructure, nous sommes une équipe très proactive qui explore continuellement de nouveaux signaux de données et des opportunités d'ingénierie de fonctionnalités pour repousser les limites de nos performances de ciblage.
Ce poste est un poste hybride, basé à Helsinki, Paris ou Strasbourg.
Le rôle
Nous recherchons un Ingénieur Data Senior pour rejoindre notre équipe Feature Platform. Vous rejoindrez une équipe dédiée d'ingénieurs Data et ML axée sur la garantie de la cohérence entre la formation hors ligne et l'inférence en ligne, l'élimination du biais entraînement-service, et la permettre à nos Data Scientists de déployer de manière transparente et rapide la prochaine génération de modèles performants.
Dans ce rôle d'Ingénieur Data Senior, votre champ d'action s'étend bien au-delà de l'ingénierie de données classique. Vous serez responsable de la gestion des composants hors ligne et en ligne de notre architecture d'apprentissage automatique. Cela signifie faire le pont entre le traitement de données à grande échelle (gestion des travaux par lots lourds et des mises à jour de fonctionnalités en temps réel de moins d'une seconde) et les services en ligne à forte charge qui doivent traiter et renvoyer des fonctionnalités pour l'inférence avec une faible latence stricte.
- Propriété architecturale : Prenez en charge de bout en bout des projets très visibles, de l'idéation initiale à la mise en production. Cela comprend la définition des fonctionnalités, l'estimation des délais, la conception de l'architecture et la comparaison des technologies de nouvelle génération.
- Innovation proactive en matière de données : Allez au-delà de la mise en œuvre passive en collaborant activement tout au long du cycle de vie des données. Vous comprendrez en profondeur le domaine d'application de la Data Science pour découvrir des opportunités de fonctionnalités à fort impact, tout en collaborant étroitement avec les équipes d'ingénierie de données en amont pour comprendre les mécanismes d'ingestion (jusqu'aux plateformes SDK et d'enchères) afin de débloquer et d'intégrer de nouveaux signaux de données.
- Infrastructure ML & Feature Platform : Collaborez étroitement avec les Data Scientists et les ML Engineers pour concevoir, faire évoluer et optimiser les composants principaux couvrant à la fois la formation hors ligne et l'inférence en ligne, y compris notre Feature Store (prenant en charge le calcul par lots, en flux continu et à la demande à faible latence) et les moteurs de génération de jeux de données d'entraînement à la demande.
- Ingénierie des pipelines : Construisez, maintenez et optimisez des pipelines de données critiques couvrant à la fois le traitement par lots étendu et les flux en temps réel continus (garantissant des mises à jour de fonctionnalités en moins d'une seconde) pour vous adapter aux besoins commerciaux et d'apprentissage automatique en constante évolution.
- Services en ligne haute performance : Construisez et maintenez activement les applications backend à forte charge qui alimentent le service de nos modèles ML, en vous assurant qu'elles peuvent traiter et renvoyer des fonctionnalités avec une faible latence et une haute disponibilité sous une forte charge.
- Évolutivité et performance : Travaillez en étroite collaboration avec nos équipes d'infrastructure pour garantir la fiabilité, la sécurité et l'immense évolutivité requises pour un écosystème de régie publicitaire.
- Collaboration agile : Épanouissez-vous dans un environnement agile au rythme rapide avec des processus de prise de décision rapides. Vous collaborerez quotidiennement avec les développeurs backend, les data scientists et les chefs de produit.
- Mentorat et culture d'équipe : Vous contribuerez activement à notre culture d'ingénierie, partagerez vos connaissances et vous assurerez que chaque membre de l'équipe se sente à l'aise, soutenu et habilité à progresser dans son rôle.
Profil
Nous recherchons un Ingénieur Data Senior qui comprend en profondeur le cycle de vie des données et les défis spécifiques liés à la mise en production de modèles d'apprentissage automatique à grande échelle.
- Plus de 6 ans d'expérience avérée en tant qu'Ingénieur Data, Ingénieur ML, Ingénieur Backend ou un rôle étroitement lié dans un environnement à grande échelle.
- Maîtrise du Big Data et du Streaming : Expérience pratique approfondie du travail avec Flink ou Spark à grande échelle. Expertise approfondie de Flink (ou de plateformes de streaming stateful similaires) car vous serez un contributeur clé dans l'extension de notre architecture de streaming en temps réel.
- Maîtrise du codage : Expertise avancée en Python pour des pipelines ETL robustes et des SDK/DSL de définition de fonctionnalités personnalisés.
- Expérience ou volonté forte de travailler avec Golang pour la construction d'applications backend performantes et à faible latence, ainsi qu'une familiarité avec Java est très appréciée pour nos charges de travail de streaming Flink.
- Architecture de données : Compréhension approfondie des principes de conception modernes de Data Lakehouse, des formats de table ouverts (comme Iceberg), des techniques d'optimisation et de la modélisation des données.
- Cloud & DevOps : Solide expérience pratique avec une plateforme cloud majeure (AWS, GCP, Azure, etc.), bien que AWS soit notre environnement préféré. La familiarité avec DBT pour la transformation des pipelines de données est un plus.
- Conscience de la production ML : Vous avez une solide compréhension des défis uniques liés à l'exécution de modèles ML en production, y compris le travail avec des Feature Stores, l'atténuation du biais entraînement-service et la surveillance des modèles.
- Conception de systèmes : Vous êtes très familier avec les sujets entourant l'évolutivité des systèmes, la haute disponibilité/fiabilité, la conception d'API à faible latence et les meilleures pratiques de sécurité.
Notre Stack
- Langages : Python (ETL & SDKs), Golang (Services en ligne haute performance), Java (Flink)
- Traitement et orchestration : Spark, Flink (Streaming en temps réel), Airflow, DBT
- Stockage et infrastructure : Apache Iceberg, Amazon Web Services (AWS), Kubernetes, Terraform
Avantages
- Salaire compétitif basé sur l'expérience
- Bon Swile (panier repas)
- Gymlib (couvert à 100% par Voodoo)
- Couverture santé premium avec SideCare, 100% prise en charge pour vous et votre famille
- Activités bien-être dans nos bureaux parisiens
- Vendredis en télétravail