¿Cuáles son algunas consultas SQL que un estadístico debería poder responder / escribir durante una entrevista técnica para un rol orientado a las estadísticas?

La columna vertebral de SQL y estructuras / lenguajes de datos similares son los sistemas de gestión de bases de datos relacionales. Es más importante comprender las relaciones de columna en términos como 1to1, 1toMany o cartesiano. Al pensar en estos términos, no hay mucha diferencia entre una base de datos y una hoja de cálculo de Excel que utiliza las funciones index / vlookup para conectar datos en varias hojas.

La mayoría de las entrevistas para puestos de desarrolladores que no son de base de datos no pasarán de unirse a 2 o 3 tablas genéricas. Conocer las diferentes combinaciones será útil (sintaxis izquierda, derecha, completa, cruzada) siempre es importante.


crear tabla sales_wID como
seleccione b.id, a.phone_number, email_address
de ventas a izquierda unirse cust b
en la página en a.id = b.id

Arriba hay una unión de tabla genérica entre una tabla de transacción de ventas y una tabla maestra de identificación de cliente. (1 a muchos)

crear tabla sales_aggr_wID como
seleccione ID, suma (ingreso_neto)
de sales_wID
agrupar por ID

El código anterior tomaría la relación 1toMany y transformaría el resultado en una fila por ID y resumiría net_income

actualizar sales_aggr_wID
establecer net_income_NY = 1
donde existe (seleccione 1
donde cust.ID = sales_aggr_wID.ID y cust.state = ‘NY’)

Este tipo de consulta es una que he encontrado realmente poderosa. La palabra clave exist / not exist permite que las columnas se traten más como vectores, lo que va más allá de la premisa normal de SQL.

La suposición de la pregunta está fuera de lugar. Si bien es bueno saber SQL, el estadístico entrevistado puede haber trabajado mucho con otros formatos de datos. Por ejemplo, datos espaciales en netCDF; imágenes del cerebro en .nii; archivos csv; mongoDB; jpegs; SAS; Matlab La lista es tan larga como variada.

En lugar de evaluar una tecnología, pregúnteles (o si usted es el entrevistado que se prepara) un ejemplo de dónde usaron algunos datos que tenían una estructura inusual: qué era y qué hicieron con ella.

Cuanto más sepas, mejor es. Debe saber cómo seleccionar una determinada columna o ciertas filas que tienen un valor determinado como atributo. Debe saber cómo ordenar y agrupar.

Si la base de datos tiene claves foráneas (por lo que es compleja), entonces debe saber cómo unirse (unión izquierda, unión derecha).

Al final, también debe saber cómo escribir los resultados de una consulta en un archivo tsv o csv.
Un buen libro que puedes probar para esto también es “Head first on SQL”. Usan MySQL en este libro.

More Interesting

¿Por qué las empresas tecnológicas hacen preguntas sobre algoritmos difíciles en la entrevista técnica?

Recientemente fallé la pantalla de mi teléfono Google y me siento devastado. Fallar significa que nunca tuve una oportunidad en primer lugar. ¿Debería molestarme en intentarlo nuevamente en un año?

¿Qué tan importante es la codificación rápida en una entrevista técnica?

Si me estoy preparando para una entrevista tecnológica, ¿cuál sería el mayor beneficio: HackerRank, LeetCode o InterviewBit? ¿Qué distingue estos tres sitios?

¿Cuáles son las buenas preguntas de la entrevista técnica de Google?

Cómo obtener una entrevista técnica de bootcamp de codificación

¿Para qué debo estar preparado en una entrevista técnica de codificación?

¿Puedo pedir más tiempo para resolver una pregunta de algoritmo en la entrevista técnica?

¿Cómo podemos permutar una cadena de modo que todas las ventanas de tamaño 'k' tengan caracteres únicos?

¿Cómo diseñarías un software como Microsoft Excel? Básicamente, el entrevistador quería saber cómo almacenaría las células y la relación entre las células. Por ejemplo, deje que haya 4 celdas, A1, B1, C1 y D1. Deje que los valores de las celdas se sigan

¿Cuáles son los tutoriales que proporcionan la comprensión profunda de los conceptos básicos de Java?

¿Cómo podemos encontrar la mediana de la matriz ordenada por filas y columnas de M * N en el tiempo O (max (M, N))?

¿De dónde obtienen la mayoría de los entrevistadores sus preguntas de entrevistas técnicas de informática?

¿Qué preparación especial hay que hacer para las entrevistas de empresas como Google, Amazon y Facebook?

¿Cómo podemos cubrir un área MxN con un costo mínimo, a partir de un conjunto de mosaicos que tienen diferentes dimensiones y diferentes costos?