Software Engineer, Data Infrastructure & Acquisition - Toulouse, France

Résumé du poste

Toulouse
Data Engineer

Modèle de travail

Entièrement remote
Mondial
il y a 1 semaine
Description du poste

Speechify

Speechify a pour mission de s'assurer que la lecture ne soit jamais une barrière à l'apprentissage.

Plus de 50 millions de personnes utilisent les produits de synthèse vocale de Speechify pour transformer tout ce qu'elles lisent - PDFs, livres, Google Docs, articles de presse, sites web - en audio, afin de pouvoir lire plus vite, lire davantage et se souvenir de plus. Les produits de synthèse vocale de Speechify incluent son application iOS, son application Android, son application Mac, son extension Chrome et son application Web. Google a récemment nommé Speechify Extension Chrome de l'année et Apple a nommé Speechify lauréat de son Design Award 2025 pour l'inclusivité.

Aujourd'hui, près de 200 personnes dans le monde travaillent sur Speechify dans un environnement 100% distribué - Speechify n'a pas de bureau. Il s'agit notamment d'ingénieurs frontend et backend, de chercheurs en IA, et d'autres personnes issues d'Amazon, Microsoft et Google, de programmes de doctorat de premier plan comme Stanford, de startups à forte croissance comme Stripe, Vercel, Bolt, et de nombreux fondateurs de leurs propres entreprises.

Aperçu

Nous cherchons à recruter pour notre équipe IA, spécialisée dans les données, chez Speechify. Ce poste est responsable de tous les aspects de la collecte de données pour soutenir nos opérations d'entraînement de modèles. Nous sommes capables de construire des ensembles de données de haute qualité à l'échelle du pétaoctet et à faible coût grâce à une intégration étroite du travail d'infrastructure, d'ingénierie et de recherche. Nous recherchons un ingénieur logiciel qualifié pour nous rejoindre.

Ce que vous ferez

  • Être débrouillard pour trouver de nouvelles sources de données audio et les intégrer dans notre pipeline d'ingestion.
  • Opérer et étendre l'infrastructure cloud pour notre pipeline d'ingestion, actuellement exécuté sur GCP et géré avec Terraform.
  • Collaborer étroitement avec nos scientifiques pour repousser les limites du coût/débit/qualité, en fournissant des données plus riches à plus grande échelle et à moindre coût pour alimenter nos modèles de nouvelle génération.
  • Collaborer avec les autres membres de l'équipe IA et la direction de Speechify pour définir la feuille de route des ensembles de données de l'équipe IA afin d'alimenter les produits grand public et d'entreprise de nouvelle génération de Speechify.

Un candidat idéal devrait avoir

  • Diplôme BS/MS/PhD en informatique ou dans un domaine connexe.
  • 5 ans d'expérience industrielle en développement logiciel.
  • Maîtrise des scripts bash/Python dans des environnements Linux.
  • Maîtrise de Docker et des concepts d'Infrastructure-as-Code et expérience professionnelle avec au moins un fournisseur Cloud majeur (nous utilisons GCP).
  • Expérience avec les web crawlers, les workflows de traitement de données à grande échelle est un plus.
  • Capacité à gérer plusieurs tâches et à s'adapter aux changements de priorités.
  • Solides compétences en communication, à l'écrit comme à l'oral.

Ce que nous offrons

  • Un environnement en croissance rapide où vous pouvez contribuer à façonner l'entreprise et le produit.
  • Une équipe à l'esprit entrepreneurial qui soutient le risque, l'intuition et le dynamisme.
  • Une approche de gestion "hands-off" pour que vous puissiez vous concentrer et faire de votre mieux.
  • Une opportunité d'avoir un impact majeur dans une industrie en transformation.
  • Salaires compétitifs, une atmosphère conviviale et détendue, et un engagement à construire une excellente culture asynchrone.
  • Opportunité de travailler sur un produit qui change la vie de millions de personnes.
  • Construire des produits qui ont un impact direct et soutiennent les personnes ayant des différences d'apprentissage comme la dyslexie, le TDAH, les troubles de la vision, les commotions cérébrales, l'autisme, et plus encore.
  • Travailler dans l'un des secteurs technologiques à la croissance la plus rapide, à l'intersection de l'intelligence artificielle et de l'audio.

Pensez-vous correspondre à ce poste ?

Dites-nous en plus sur vous et pourquoi vous êtes intéressé par le poste lorsque vous postulez. Et n'oubliez pas d'inclure des liens vers votre portfolio et votre LinkedIn.

Vous ne cherchez pas mais connaissez quelqu'un qui ferait un excellent candidat ?

Recommandez-le !

Speechify s'engage à un lieu de travail diversifié et inclusif.

Speechify ne fait aucune discrimination fondée sur la race, l'origine nationale, le sexe, l'identité de genre, l'orientation sexuelle, le statut d'ancien combattant protégé, le handicap, l'âge ou tout autre statut légalement protégé.