Questions d'entretien en data science : à quoi s'attendre et comment se préparer
Intention de recherche : Data scientists et analystes qui sont solides techniquement mais ne savent pas comment gérer les rounds business et comportementaux.
À quoi ressemble un cycle d'entretien en data science
Les questions d'entretien en data science varient plus que dans la plupart des rôles car le poste lui-même varie. Avant de préparer, clarifiez le type de rôle DS que vous visez :
- DS produit/appliqué : Accent fort sur les métriques, les tests A/B, SQL et le sens produit
- DS adjacent au ML engineering : Feature engineering, déploiement de modèles, design d'expériences
- DS recherche : Statistiques, théorie du ML, conception d'algorithmes
La plupart des cycles comprennent 4–5 rounds : un écran technique (statistiques + probabilité), SQL/code, cas produit/business, fondamentaux ML et comportemental. Connaître la composition vous permet de répartir correctement votre temps de préparation.
Questions d'entretien data science : les rounds techniques
Statistiques et probabilité
Ces questions testent votre intuition statistique, pas votre capacité à mémoriser des formules.
Types de questions courants :
- Expliquer les p-valeurs et les intervalles de confiance sans jargon
- Concevoir un test A/B pour un changement produit spécifique
- Quelle est la différence entre les erreurs de Type I et de Type II et quand chacune importe-t-elle davantage ?
La clé : Connectez toujours les concepts statistiques aux décisions business. « Un seuil de significativité plus bas réduit les erreurs de Type I — moins de faux positifs — ce qui compte quand le coût d'agir sur un faux signal est élevé, comme lancer une fonctionnalité qui dégrade la rétention. »
SQL et code
Pour les rôles DS produit, SQL est souvent l'écran technique principal. Attendez-vous à :
- Fonctions de fenêtre (RANK, LAG, LEAD)
- Requêtes d'analyse de cohortes
- Auto-jointures et CTE
- Agrégations avec conditions (CASE WHEN)
Pour les rôles ML-adjacent, le code Python est courant : implémentez une étape de descente de gradient, écrivez une fonction k-means de zéro ou manipulez un DataFrame pandas.
Fondamentaux ML
Les recruteurs testent si vous comprenez l'intuition derrière les modèles, pas seulement comment appeler sklearn.fit().
Questions pour lesquelles être prêt :
- Expliquez-moi comment fonctionne le gradient boosting
- Quand utiliseriez-vous la régression logistique plutôt qu'un random forest ?
- Votre modèle a une haute précision mais le métier n'est pas satisfait — qu'est-ce qui pourrait clocher ?
- Comment gérez-vous le déséquilibre de classes ?
- Expliquez la régularisation et quand L1 vs. L2 est approprié
Le piège : trop expliquer les mathématiques. Ils veulent : « L1 produit des modèles creux en poussant les poids à zéro — mieux quand vous suspectez que peu de features comptent. L2 répartit le poids plus uniformément — mieux quand la plupart des features contribuent quelque chose. »
Questions produit et cas business
C'est là que les candidats techniquement solides trébuchent souvent. Le recruteur ne teste pas vos compétences SQL ici — il teste votre jugement business.
Questions de définition de métriques
« Comment mesureriez-vous le succès d'une nouvelle fonctionnalité de recommandation ? »
Ne nommez pas seulement une métrique. Structurez votre réponse :
- Quel comportement essayons-nous de stimuler ? (sessions plus longues, plus d'achats)
- Quelle est la métrique principale ? (taux de clics sur les recommandations)
- Quelles sont les métriques de garde-fou ? (ne pas optimiser le CTR au détriment de la qualité de session)
- Quelles contre-métriques protègent contre la manipulation ? (si le CTR monte mais la conversion baisse, nous trompons les utilisateurs)
Questions de design d'expérience
« Comment exécuteriez-vous un test A/B pour un changement dans le flux de paiement ? »
Couvrez : unité de randomisation (utilisateur vs. session), répartition contrôle/traitement, effet minimum détectable, durée du test, méthode d'analyse et comment vous géreriez le biais d'effet de nouveauté.
Questions comportementales : là où les candidats DS laissent des points sur la table
La plupart des candidats DS consacrent 90% de leur préparation aux questions techniques et arrivent insuffisamment préparés pour les rounds comportementaux. C'est une erreur — aux niveaux senior, les rounds comportementaux sont des rounds d'élimination, pas des formalités.
La question comportementale centrale pour les data scientists est une variante de :
« Parlez-moi d'une fois où votre analyse a influencé une décision business. »
Réponse faible : « J'ai construit un modèle de prédiction du churn et nous l'avons utilisé pour cibler les utilisateurs à risque. »
Réponse forte : « Notre équipe de rétention dépensait 40% de son budget de contact sur des utilisateurs qui n'étaient pas réellement à risque — juste peu actifs. J'ai construit un modèle de churn qui identifiait les vrais signaux d'intention d'annuler vs. la dormance naturelle. Nous avons segmenté la liste de contact avec le modèle. En un trimestre, nous avons obtenu les mêmes résultats de rétention avec 35% de coût de contact en moins. La précision du modèle était plus importante que le recall ici car nous étions contraints par le budget, pas par la portée. »
La différence : la réponse forte quantifie l'impact business, explique le jugement de compromis et connecte la décision technique aux contraintes business.
La checklist des 48 heures avant l'entretien
- Révisez les 10 casse-têtes de probabilité les plus courants (problème de Monty Hall, lancers de pièce, problème des anniversaires)
- Relisez votre CV et préparez-vous à approfondir chaque projet listé
- Préparez 2–3 histoires comportementales avec un impact business quantifié
- Révisez les fonctions de fenêtre SQL — elles apparaissent dans presque tous les écrans DS
- Connaissez par cœur la checklist de base du design d'expérience
Pratiquez maintenant
La préparation technique est nécessaire mais pas suffisante. Les rounds business et comportementaux sont là où les entretiens se perdent — et ils nécessitent des répétitions en live.