Blog Carrera profesional Cómo preparar la entrevista técnica de data analyst: preguntas de SQL y Python

Cómo preparar la entrevista técnica de data analyst: preguntas de SQL y Python

  • ¿Qué preguntas de SQL te pueden hacer y cómo responderlas bien?
  • ¿Qué nivel de Python exigen realmente las empresas en las pruebas técnicas?
entrevista técnica data analyst

Si estás buscando trabajo como analista de datos, tarde o temprano llegarás a la entrevista técnica. Es el momento donde las empresas comprueban que sabes hacer lo que pone en tu CV, y donde muchos candidatos se quedan fuera por falta de preparación específica.

En este artículo encontrarás las preguntas más frecuentes de SQL y Python que aparecen en entrevistas técnicas para data analyst, con ejemplos reales y consejos para responderlas correctamente.

Por qué la entrevista técnica de data analyst asusta (y cómo perderle el miedo)

La entrevista técnica de data analyst combina dos tipos de pruebas: preguntas conceptuales sobre herramientas y metodología, y ejercicios prácticos donde tienes que escribir código o resolver un caso de datos en tiempo real.

La buena noticia es que los temas que aparecen son predecibles. Las empresas buscan que domines SQL para extraer y transformar datos, Python para análisis básico y visualización, y que sepas interpretar y comunicar resultados. Por eso, si preparas bien estos tres bloques, tienes una ventaja enorme sobre el resto de candidatos.

Preguntas de SQL más frecuentes en la entrevista técnica

SQL es el lenguaje que más se evalúa en entrevistas para analista de datos. Las preguntas van desde lo básico hasta lo moderadamente avanzado, y casi siempre incluyen JOINs, GROUP BY y funciones de ventana.

Preguntas básicas de SQL

¿Cuál es la diferencia entre WHERE y HAVING?

WHERE filtra filas antes de agrupar los datos. HAVING filtra grupos después de aplicar GROUP BY. Además, un error muy común es usar WHERE con funciones de agregación como COUNT() o SUM(), lo que genera un error de sintaxis.

-- Correcto: filtrar grupos con HAVING
SELECT departamento, COUNT(*) AS empleados
FROM empleados
GROUP BY departamento
HAVING COUNT(*) > 5;

¿Qué tipos de JOIN existen y cuándo se usa cada uno?

  • INNER JOIN: devuelve solo las filas que tienen coincidencia en ambas tablas.
  • LEFT JOIN: devuelve todas las filas de la tabla izquierda, con NULL donde no hay coincidencia.
  • RIGHT JOIN: lo contrario del LEFT JOIN.
  • FULL OUTER JOIN: devuelve todas las filas de ambas tablas.

En análisis de datos, el LEFT JOIN es el más habitual cuando quieres mantener todos los registros de tu tabla principal aunque no tengan correspondencia en la tabla relacionada.

Preguntas intermedias de SQL

¿Qué es una subconsulta y cuándo la usarías?

Una subconsulta es una consulta dentro de otra consulta. Se usa cuando necesitas filtrar por un resultado calculado previamente. Por ejemplo, para obtener los clientes con ventas superiores a la media:

SELECT cliente_id, SUM(importe) AS total
FROM ventas
GROUP BY cliente_id
HAVING SUM(importe) > (
    SELECT AVG(total_por_cliente)
    FROM (
        SELECT cliente_id, SUM(importe) AS total_por_cliente
        FROM ventas
        GROUP BY cliente_id
    ) t
);

¿Qué son las window functions y para qué sirven?

Las window functions permiten hacer cálculos sobre un conjunto de filas relacionadas sin colapsar el resultado en una sola fila, a diferencia de GROUP BY. Son muy útiles para rankings, acumulados y comparaciones entre filas. En cambio, GROUP BY siempre reduce el número de filas del resultado.

-- Ranking de ventas por comercial
SELECT comercial, ventas,
       RANK() OVER (ORDER BY ventas DESC) AS ranking
FROM resultados_mensuales;

Preguntas de Python más frecuentes en la entrevista técnica

Python en entrevistas de data analyst se evalúa principalmente a través de pandas y, en menor medida, de visualización. No te piden construir modelos de machine learning: te piden que limpies, transformes y analices datos.

Preguntas básicas de Python para datos

¿Cómo limpias valores nulos en un DataFrame de pandas?

import pandas as pd

df = pd.read_csv("ventas.csv")

# Ver cuántos nulos hay por columna
df.isnull().sum()

# Eliminar filas con nulos
df_clean = df.dropna()

# Rellenar nulos con la media
df['precio'] = df['precio'].fillna(df['precio'].mean())

¿Cómo filtras filas en pandas?

# Filtrar ventas superiores a 1.000 euros
ventas_altas = df[df['importe'] > 1000]

# Filtrar por múltiples condiciones
filtrado = df[(df['categoria'] == 'electrónica') & (df['importe'] > 500)]

Preguntas intermedias de Python

¿Qué es groupby en pandas y para qué sirve?

groupby() es el equivalente en pandas del GROUP BY de SQL. Permite agrupar datos por una o varias columnas y aplicar funciones de agregación. Por ejemplo, para calcular ventas totales por categoría:

resumen = df.groupby('categoria')['importe'].agg(['sum', 'mean', 'count'])
print(resumen)

¿Cómo harías un merge entre dos DataFrames?

# Equivalente al JOIN de SQL
resultado = pd.merge(df_ventas, df_clientes, on='cliente_id', how='left')

Cómo estructurar tus respuestas durante la prueba técnica

Más allá de saber el código, las empresas evalúan cómo piensas. Por eso, una respuesta bien estructurada marca la diferencia entre un candidato junior y uno que inspira confianza. Usa este esquema al responder:

  1. Explica qué hace la herramienta o concepto en una frase.
  2. Da un ejemplo concreto del mundo real o de un proyecto tuyo.
  3. Menciona alternativas o casos de uso si los hay.

Por ejemplo, si te preguntan «¿para qué sirve una CTE en SQL?», una respuesta sólida sería: «Una CTE es una subconsulta temporal que mejora la legibilidad del código. La uso cuando una consulta se vuelve muy anidada o necesito reutilizar el mismo resultado varias veces en la misma query.»

Los errores más comunes en entrevistas técnicas de data analyst

  • Memorizar sin entender: saber la sintaxis de RANK() de memoria no sirve si no puedes explicar cuándo usarla.
  • No pensar en voz alta: los entrevistadores valoran tu proceso de razonamiento. Explica cada paso.
  • Ignorar la calidad de los datos: si te dan un dataset, lo primero es explorar si hay nulos, duplicados o valores extremos.
  • No hacer preguntas: preguntar «¿los datos tienen fechas?» o «¿quieres el resultado por semana o por mes?» demuestra criterio analítico real.

Plan de preparación en 2 semanas

  1. Días 1-4: repasa SQL desde JOINs básicos hasta GROUP BY, subconsultas y window functions.
  2. Días 5-8: practica pandas: carga de datos, limpieza de nulos, filtros, groupby y merge.
  3. Días 9-11: haz al menos 3 ejercicios de cada tema en plataformas como StrataScratch o HackerRank.
  4. Días 12-14: simula una entrevista completa con un caso de negocio real: elige un dataset, responde preguntas y explica los resultados en voz alta.

Conclusión

La entrevista técnica de data analyst no es un examen de memoria: es una demostración de cómo piensas con datos. Si dominas SQL a nivel intermedio y pandas para análisis básico, tienes todo lo necesario para superar la mayoría de pruebas técnicas. Practica con casos reales, explica tu razonamiento y llega preparado.

¿Quieres dominar SQL y Python para conseguir trabajo como data analyst?

En el Data Analyst Bootcamp de Datademia aprendes SQL, Python y visualización de datos con proyectos reales, el mismo tipo de ejercicios que piden las empresas en sus entrevistas técnicas.

Muchos alumnos ya han completado el programa y trabajan como analistas de datos.


Descubre el Data Analyst Bootcamp


Data Analyst Bootcamp de Datademia

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Impulsa tu carrera con nuestras formaciones premium
mda - máster en datos y analítica
Máster en Datos y Analítica

Conviértete en un experto en datos. Aprende analisis de datos, negocios, ciencia de datos e ingeniería de datos.

9 meses
4.6
analista de datos
Data Analyst Bootcamp

Conviértete en un experto en análisis de datos. Aprende todo lo que necesitas saber para para trabajar como analista de datos.

3 meses
4.6
cientifico de datos
Data Science Bootcamp

Especialízate en ciencia de datos y modelos predictivos. Aprende todo lo que necesitas saber para trabajar como científico de datos.

3 meses
4.6