Sí, pero debe esperar resultados diferentes.
En mi humilde opinión, la cantidad de habilidades informáticas que conoces es la diferencia entre un muy buen científico de datos y un muy buen analista de datos ( estadístico).
Los científicos e ingenieros de datos hacen cosas diferentes
- ¿Cuáles son algunos errores comunes que cometen las personas cuando buscan trabajo?
- ¿Cuál es la estrategia correcta para estudiar algoritmos y prepararse para codificar entrevistas simultáneamente?
- ¿Cuáles son las preguntas de entrevista más frecuentes para Hadoop?
- Cómo decirle al entrevistador que el trabajo anterior era malo
- ¿Es importante la velocidad de escritura en una entrevista de ingeniería de software?
Para que un científico de datos tenga éxito, necesita poder ejecutar el flujo de trabajo completo de un científico de datos. Debe obtener sus datos (de las bases de datos), debe poder explorar , visualizar y transformar sus datos de manera rápida y flexible (escribiendo scripts y funciones). Debe poder modelar los datos (construyendo modelos simples o complejos, ingeniería de características, métricas de rendimiento informático).
Por lo tanto, los científicos de datos deben codificar para hacer bien su trabajo. Pero no se debe esperar que pasen necesariamente una entrevista estándar de ingeniería de software con gran éxito. Eso es detectar las habilidades equivocadas. Los DS no necesitan poder escribir código de producción optimizado de manera súper eficiente; es por eso que tienen ingenieros (a veces esas personas son ingenieros de aprendizaje automático , vea: ¿Cuál es la diferencia entre el Científico de datos y el Ingeniero de aprendizaje automático? Y ¿Cuál es la diferencia entre un ingeniero de aprendizaje automático y científico de datos en Quora?).
Los científicos de datos solo necesitan poder obtenerlos. Mierda. hecho.
(lo que requiere aprovechar programas informáticos escritos personalizados).
La mayor parte del código que escribe como DS es solo para usted; nadie más puede verlo. En esos escenarios, deberíamos estar optimizando la velocidad de ejecución y el éxito personal (en cualquier forma que sea), no minimizando la deuda tecnológica a largo plazo de la organización o construyendo implementaciones súper elegantes que nunca se romperán.
Del gran artículo Los ingenieros no deberían escribir ETL por Jeff Magnusson:
Una consecuencia de empoderar a los científicos de datos para asumir tal amplitud de pila es que es poco probable que produzcan código y soluciones que sean tan técnicamente eficientes como las de un ingeniero. Estamos sacrificando la eficiencia técnica por la velocidad y la autonomía. Es importante reconocer esto como un intercambio deliberado.
Para que DS sea efectivo, necesitan poder escribir código, pero por diferentes razones que por qué los ingenieros de software necesitan poder escribir código. Por lo tanto, recomiendo probarlos de manera diferente, o al menos esperar resultados diferentes.