Perguntas de entrevista de Data Science: O que esperar e como se preparar
Intenção de busca: Cientistas de dados e analistas que são fortes no lado técnico mas não têm certeza de como lidar com os rounds de negócios e comportamentais.
Como uma rodada de entrevistas de Data Science funciona
Perguntas de entrevistas de data science variam mais do que na maioria dos cargos porque a função em si varia. Antes de se preparar, esclareça que tipo de cargo de DS você está buscando:
- DS de produto/aplicada: Foco em métricas, testes A/B, SQL e product sense
- DS próxima a ML engineering: Feature engineering, deployment de modelos, design de experimentos
- DS de pesquisa: Estatística, teoria de ML, design de algoritmos
A maioria dos loops inclui 4–5 rounds: uma triagem técnica (estatística + probabilidade), SQL/coding, caso de produto/negócio, fundamentos de ML e comportamental. Conhecer o mix permite alocar o tempo de preparação adequadamente.
Perguntas de entrevista de Data Science: Os rounds técnicos
Estatística e probabilidade
Essas perguntas testam sua intuição estatística, não sua capacidade de lembrar fórmulas.
Tipos de perguntas comuns:
- Explique p-valores e intervalos de confiança sem jargão
- Projete um teste A/B para uma mudança específica de produto
- Qual é a diferença entre erros do Tipo I e Tipo II e quando cada um importa mais?
A chave: Sempre conecte conceitos estatísticos a decisões de negócio. "Um nível de significância mais baixo reduz erros do Tipo I — menos falsos positivos — o que importa quando o custo de agir sobre um sinal falso é alto, como lançar uma feature que degrada a retenção."
SQL e coding
Para cargos de DS de produto, SQL é frequentemente a triagem técnica principal. Espere:
- Window functions (RANK, LAG, LEAD)
- Queries de análise de coortes
- Self-joins e CTEs
- Agregações com condições (CASE WHEN)
Para cargos próximos a ML, coding em Python é comum: implementar um passo de gradient descent, escrever uma função k-means do zero ou manipular um DataFrame pandas.
Fundamentos de ML
Os entrevistadores testam se você entende a intuição por trás dos modelos, não apenas como chamar sklearn.fit().
Perguntas para estar preparado:
- Explique como gradient boosting funciona
- Quando você usaria regressão logística em vez de random forest?
- Seu modelo tem alta acurácia mas o negócio não está satisfeito — o que pode estar errado?
- Como você lida com desequilíbrio de classes?
- Explique regularização e quando L1 vs. L2 é apropriado
A armadilha: explicar demais a matemática. Eles querem: "L1 produz modelos esparsos ao levar pesos a zero — melhor quando você suspeita que apenas poucas features importam. L2 distribui os pesos mais uniformemente — melhor quando a maioria das features contribui com algo."
Perguntas de produto e estudo de caso de negócio
É aqui que candidatos de DS tecnicamente fortes frequentemente tropeçam. O entrevistador não está testando suas habilidades de SQL aqui — está testando seu julgamento de negócio.
Perguntas de definição de métricas
"Como você mediria o sucesso de uma nova feature de recomendação?"
Não apenas nomeie uma métrica. Estruture-a:
- Que comportamento estamos tentando impulsionar? (sessões mais longas, mais compras)
- Qual é a métrica primária? (taxa de cliques nas recomendações)
- Quais são as métricas guardrail? (não deixar otimizar CTR à custa da qualidade da sessão)
- Quais contrametricas protegem contra gaming? (se CTR sobe mas conversão cai, estamos enganando usuários)
Perguntas de design de experimento
"Como você executaria um teste A/B para uma mudança no fluxo de checkout?"
Cubra: unidade de randomização (usuário vs. sessão), divisão controle/tratamento, efeito mínimo detectável, duração do teste, método de análise e como você lidaria com o viés de efeito novidade.
Perguntas comportamentais: Onde candidatos de DS deixam pontos na mesa
A maioria dos candidatos de DS gasta 90% de sua preparação em perguntas técnicas e aparece despreparada para rounds comportamentais. Isso é um erro — em níveis sêniores, rounds comportamentais são rounds eliminatórios, não formalidades.
A pergunta comportamental central para cientistas de dados é alguma variação de:
"Me conte sobre uma época em que sua análise influenciou uma decisão de negócio."
Resposta fraca: "Construí um modelo de previsão de churn e o usamos para atingir usuários em risco."
Resposta forte: "Nossa equipe de retenção estava gastando 40% de seu orçamento de outreach em usuários que não estavam realmente em risco — apenas com baixa atividade. Construí um modelo de churn que identificava sinais reais de intenção de cancelamento vs. dormência natural. Segmentamos a lista de outreach usando o modelo. Em um trimestre, vimos os mesmos resultados de retenção com 35% menos custo de outreach. A precisão do modelo era mais importante do que o recall aqui porque éramos restritos por orçamento, não por alcance."
A diferença: a resposta forte quantifica o impacto nos negócios, explica o julgamento de trade-off e conecta a decisão técnica às restrições de negócio.
A checklist de 48 horas pré-entrevista
- Revise os 10 problemas de probabilidade mais comuns (Monty Hall, lançamentos de moeda, problema do aniversário)
- Releia seu currículo e esteja pronto para aprofundar em cada projeto listado
- Prepare 2–3 histórias comportamentais com impacto de negócio quantificado
- Revise window functions de SQL — aparecem em quase toda triagem de DS
- Conheça a checklist básica de design de experimentos de cor
Pratique agora
Preparação técnica é necessária mas não suficiente. Os rounds de negócios e comportamentais são onde as entrevistas são perdidas — e eles exigem repetições ao vivo.