Skip to article
Technical Interviews5 min

Perguntas de entrevista de Data Science: O que esperar e como se preparar

O que esperar nos rounds de entrevista de data science e como se preparar — de estatística e ML a estudos de caso e perguntas comportamentais sobre impacto nos negócios.

Perguntas de entrevista de Data Science: O que esperar e como se preparar

Intenção de busca: Cientistas de dados e analistas que são fortes no lado técnico mas não têm certeza de como lidar com os rounds de negócios e comportamentais.


Como uma rodada de entrevistas de Data Science funciona

Perguntas de entrevistas de data science variam mais do que na maioria dos cargos porque a função em si varia. Antes de se preparar, esclareça que tipo de cargo de DS você está buscando:

  • DS de produto/aplicada: Foco em métricas, testes A/B, SQL e product sense
  • DS próxima a ML engineering: Feature engineering, deployment de modelos, design de experimentos
  • DS de pesquisa: Estatística, teoria de ML, design de algoritmos

A maioria dos loops inclui 4–5 rounds: uma triagem técnica (estatística + probabilidade), SQL/coding, caso de produto/negócio, fundamentos de ML e comportamental. Conhecer o mix permite alocar o tempo de preparação adequadamente.


Perguntas de entrevista de Data Science: Os rounds técnicos

Estatística e probabilidade

Essas perguntas testam sua intuição estatística, não sua capacidade de lembrar fórmulas.

Tipos de perguntas comuns:

  • Explique p-valores e intervalos de confiança sem jargão
  • Projete um teste A/B para uma mudança específica de produto
  • Qual é a diferença entre erros do Tipo I e Tipo II e quando cada um importa mais?

A chave: Sempre conecte conceitos estatísticos a decisões de negócio. "Um nível de significância mais baixo reduz erros do Tipo I — menos falsos positivos — o que importa quando o custo de agir sobre um sinal falso é alto, como lançar uma feature que degrada a retenção."

SQL e coding

Para cargos de DS de produto, SQL é frequentemente a triagem técnica principal. Espere:

  • Window functions (RANK, LAG, LEAD)
  • Queries de análise de coortes
  • Self-joins e CTEs
  • Agregações com condições (CASE WHEN)

Para cargos próximos a ML, coding em Python é comum: implementar um passo de gradient descent, escrever uma função k-means do zero ou manipular um DataFrame pandas.

Fundamentos de ML

Os entrevistadores testam se você entende a intuição por trás dos modelos, não apenas como chamar sklearn.fit().

Perguntas para estar preparado:

  • Explique como gradient boosting funciona
  • Quando você usaria regressão logística em vez de random forest?
  • Seu modelo tem alta acurácia mas o negócio não está satisfeito — o que pode estar errado?
  • Como você lida com desequilíbrio de classes?
  • Explique regularização e quando L1 vs. L2 é apropriado

A armadilha: explicar demais a matemática. Eles querem: "L1 produz modelos esparsos ao levar pesos a zero — melhor quando você suspeita que apenas poucas features importam. L2 distribui os pesos mais uniformemente — melhor quando a maioria das features contribui com algo."


Perguntas de produto e estudo de caso de negócio

É aqui que candidatos de DS tecnicamente fortes frequentemente tropeçam. O entrevistador não está testando suas habilidades de SQL aqui — está testando seu julgamento de negócio.

Perguntas de definição de métricas

"Como você mediria o sucesso de uma nova feature de recomendação?"

Não apenas nomeie uma métrica. Estruture-a:

  1. Que comportamento estamos tentando impulsionar? (sessões mais longas, mais compras)
  2. Qual é a métrica primária? (taxa de cliques nas recomendações)
  3. Quais são as métricas guardrail? (não deixar otimizar CTR à custa da qualidade da sessão)
  4. Quais contrametricas protegem contra gaming? (se CTR sobe mas conversão cai, estamos enganando usuários)

Perguntas de design de experimento

"Como você executaria um teste A/B para uma mudança no fluxo de checkout?"

Cubra: unidade de randomização (usuário vs. sessão), divisão controle/tratamento, efeito mínimo detectável, duração do teste, método de análise e como você lidaria com o viés de efeito novidade.


Perguntas comportamentais: Onde candidatos de DS deixam pontos na mesa

A maioria dos candidatos de DS gasta 90% de sua preparação em perguntas técnicas e aparece despreparada para rounds comportamentais. Isso é um erro — em níveis sêniores, rounds comportamentais são rounds eliminatórios, não formalidades.

A pergunta comportamental central para cientistas de dados é alguma variação de:

"Me conte sobre uma época em que sua análise influenciou uma decisão de negócio."

Resposta fraca: "Construí um modelo de previsão de churn e o usamos para atingir usuários em risco."

Resposta forte: "Nossa equipe de retenção estava gastando 40% de seu orçamento de outreach em usuários que não estavam realmente em risco — apenas com baixa atividade. Construí um modelo de churn que identificava sinais reais de intenção de cancelamento vs. dormência natural. Segmentamos a lista de outreach usando o modelo. Em um trimestre, vimos os mesmos resultados de retenção com 35% menos custo de outreach. A precisão do modelo era mais importante do que o recall aqui porque éramos restritos por orçamento, não por alcance."

A diferença: a resposta forte quantifica o impacto nos negócios, explica o julgamento de trade-off e conecta a decisão técnica às restrições de negócio.


A checklist de 48 horas pré-entrevista

  • Revise os 10 problemas de probabilidade mais comuns (Monty Hall, lançamentos de moeda, problema do aniversário)
  • Releia seu currículo e esteja pronto para aprofundar em cada projeto listado
  • Prepare 2–3 histórias comportamentais com impacto de negócio quantificado
  • Revise window functions de SQL — aparecem em quase toda triagem de DS
  • Conheça a checklist básica de design de experimentos de cor

Pratique agora

Preparação técnica é necessária mas não suficiente. Os rounds de negócios e comportamentais são onde as entrevistas são perdidas — e eles exigem repetições ao vivo.

Experimente uma sessão gratuita no Interview Sparring →