Description du poste
En tant que Data Scientist en CDI, tu rejoins Diagonall pour transformer des données brutes en décisions et produits mesurables chez nos clients. Tu interviens sur des missions à fort enjeu où la data doit devenir actionnable : segmentation, prévision, scoring, optimisation, détection d’anomalies, mesure d’impact, et de plus en plus, data x IA générative.
Tu travailleras dans un environnement orienté delivery : comprendre vite, modéliser juste, prouver par des métriques, puis industrialiser proprement. Tu collabores avec les AI engineers, data engineers et équipes métiers pour construire des solutions qui tiennent en production, pas des POC jetables.
Diagonall est un cabinet de conseil, formation et ingénierie IA. On conçoit des solutions sur mesure avec une gouvernance stricte : vos données, vos règles, votre SI.
Ta mission
Cadrage et compréhension métier
- Traduire un besoin business en problème data clair (objectif, cible, contraintes, KPI)
- Définir une stratégie de mesure et d’expérimentation (baseline, tests, causalité quand pertinent)
- Identifier les données nécessaires, les gaps, et les risques (qualité, biais, fuite de données)
Analyse et modélisation
- Explorer, préparer et enrichir les données (feature engineering)
- Concevoir des modèles adaptés et les évaluer correctement
- Construire des approches robustes et interprétables quand nécessaire
- Documenter les choix, limites, et résultats
Mise en production et run
- Packager les modèles et pipelines pour la prod (API, batch, streaming selon cas)
- Mettre en place le monitoring (dérive, performance, qualité de données)
- Assurer la maintenabilité : tests, versioning, reproductibilité, documentation
Collaboration et delivery
- Travailler avec les data engineers sur l’ingestion, la qualité et l’outillage
- Collaborer avec les AI engineers sur les sujets hybrides (LLM + data, évaluation, RAG + analytics)
- Participer aux ateliers client, démos, et itérations rapides orientées décision
Ce qu'on recherche
Indispensable
- Excellentes bases en stats, ML et évaluation (métriques, validation, biais, fuite)
- Très bon niveau en Python et SQL
- Culture production : reproductibilité, packaging, tests, monitoring
- Capacité à expliquer clairement un modèle et ses limites à des non techniques
- Autonomie, rigueur, et sens du rendu
Ce qui fera la différence
- Expérience de déploiement et monitoring de modèles en conditions réelles
- Familiarité avec des outils et workflows modernes (MLflow ou équivalent, data validation, feature store)
- Confort sur une stack cloud/data (GCP, AWS ou Azure, dbt, Airflow ou équivalent)
- Expérience sur cas d’usage business : churn, LTV, fraude, prévision, optimisation
- Intérêt fort pour data x IA générative et l’évaluation de systèmes LLM
Ce poste n’est pas pour toi si
- Tu veux uniquement faire de l’exploration sans contrainte de prod
- Tu n’aimes pas le rythme delivery et les interactions client
- Tu n’es pas à l’aise avec la responsabilité sur un résultat mesurable
- Tu as du mal à trancher, prioriser, et itérer vite
Conditions et évolution
- CDI à temps plein
- Projets variés et exigeants, au contact direct des équipes métiers et décideurs
- Progression rapide : ownership croissant, référentises, montée en séniorité
- Standards élevés sur la qualité, la clarté, et l’impact
Pour candidater
Envoie
- Une Lettre de motivation
- Ton CV ou LinkedIn
- 1 ou 2 exemples de projets data dont tu es fier (Git, notebook, case study ou description concise)
- Optionnel mais puissant : une courte note expliquant un modèle que tu as déployé ou amélioré, avec comment tu l’as évalué et monitoré