No sé cómo calificar los niveles de competencia, pero espero que un científico de datos de nivel medio a superior sea un programador muy competente. Sin embargo, hay varias capas a mi expectativa. También defiendo que los analistas de datos de hoy en día deberían desarrollar experiencia en la codificación, por lo que los arrojaré a la mezcla para explicarlos.
Digamos que contrato a un analista de datos junior. Su trabajo será crear paneles en alguna plataforma de terceros que se conecte a nuestras bases de datos. Esto solo implica que se utilizarán algunos SQL y secuencias de comandos en algún momento.
Más temprano que tarde, él / ella estará haciendo análisis de datos, incluso si son simples descriptivos. En mi equipo, estos análisis se revisan internamente antes de ser enviados a usuarios comerciales. Puede haber nuevas preguntas (las denominamos seguimientos) en el proceso de revisión o por decisión de los usuarios comerciales. Para responder rápidamente a estos, el análisis debe estar codificado.
- ¿Cuál es la mejor manera de ingresar al desarrollo web después de aprender una cantidad moderada?
- ¿Cómo es posible estar más involucrado en el trabajo en equipo siendo un estudiante de ciencias de la computación?
- Cómo apreciar la importancia de la 'física computacional'
- ¿Qué grado se necesita para convertirse en un programador de computadoras? ¿La ingeniería estará bien?
- ¿Sería difícil obtener financiación y respeto si no fuera un programador, pero se le ocurrió una gran idea de software?
Para proyectos de ciencia de datos, la codificación es fundamental. La gran mayoría es prototipo y código de análisis exploratorio. Aunque tenemos estándares de codificación para el código R, no lo hago cumplir particularmente para los prototipos, pero sí para el análisis de datos y los productos de datos de nivel de producción.
A medida que un científico de datos se vuelve más autónomo (es decir, puestos intermedios y superiores) debe garantizar la calidad del código. En este momento, el dominio de la codificación es una prioridad. Utilizo un tiempo considerable para transmitir las mejores prácticas a los miembros de mi equipo yendo tan lejos como para establecer metas personales para ellos en términos de calidad de programación.
Todo esto para decir que considero que la codificación es extremadamente importante pero en diferentes niveles. Algunos códigos deben estar tan bien diseñados como sea posible. Otros se pueden tirar. Pero cada persona que trabaja conmigo crece en el dominio de la codificación porque quiero que todos construyan productos de datos (científicos de datos o no) y quiero que seamos lo más eficientes posible y una de las formas más rápidas es a través del código.
¡Espero que esto ayude!