Mi trabajo como científico de datos ha estado construyendo una aplicación basada en datos para mi empresa. Obtenemos información de ventas de los clientes sobre sus productos, y de ese intento e inferimos la demanda. Casi todos los datos que tengo se almacenan en tablas SQL (MySQL y Redshift), por lo que trato a SQL como el almacén de datos del que necesito canalizar.
En cuanto a las habilidades específicas de SQL:
Una comprensión básica de cómo se estructuran las tablas SQL:
- ¿Cuáles son algunas buenas maneras de comenzar una carrera como científico de datos?
- ¿Cómo se beneficiaría un científico de datos de aprender React?
- ¿Qué hace a un buen científico?
- ¿Cuáles son algunos buenos libros introductorios sobre ciencia de datos para científicos sociales?
- Como científico de datos en una empresa más grande, ¿es más valioso sentarse con el equipo de productos o con un equipo de científicos de datos?
Especialmente claves primarias, claves secundarias e índices intercalados. Si está haciendo algo que consulta desde SQL repetidamente (por ejemplo, un producto que analiza los últimos 30 días de X, que se ejecuta como un cronjob cada día), es posible que desee discutir con cualquier ingeniero de datos qué tipo de requisitos su propio código / producto tiene. Tener que hacer escaneos completos de tablas porque una tabla no está correctamente codificada es una pena. Probablemente usará la palabra clave EXPLAIN a medida que avanza.
Manejo de fechas y horarios:
A menudo se ocupará de eventos con etiqueta de tiempo, y es posible que deba convertir a / desde UTC, eliminar tiempos solo para obtener una fecha (Postgres TRUNC, enviar mis marcas de tiempo de MySQL a la fecha, etc.) o seleccionar un cierto rango de fechas.
Comprensión de PRAGMA y comandos administrativos:
A veces, para que los datos se ajusten correctamente, debe comprender el esquema de la tabla. Si puede consultarlo, su vida será más fácil. Además, saber cómo hacer un poco de control del trabajo (¿tiene una consulta que está atando todo pero asociada con un programa bloqueado?