Lo siento, pero el artículo está equivocado en la primera oración dos veces: (1) la ciencia no crea conocimiento, descubre conocimiento, y (2) lo hace usando el método científico, que es básicamente una espiral ascendente de observación, abstracción, experimentación y generalización.
Además, construir consultas SQL o NoSQL no es lo que debería estar haciendo un científico de datos. Para eso solían estar entrenados un ingeniero de software y un DBA, y los científicos de datos solían pedirles datos.
Un científico de datos es alguien que aplica metodología científica a la tarea de extraer conocimiento estadísticamente significativo de los datos.
- Actualmente soy un ingeniero de control de calidad que aspira a convertirse en científico de datos. ¿Qué tan práctico es hacer la transición?
- Cómo convertirse en un científico de datos del desarrollador de software
- ¿En qué se diferencia la informática de la ciencia de datos?
- ¿Está bien seguir una carrera de consultor de Big Data para convertirse en un científico de datos en el futuro?
- ¿Qué certificación SQL es mejor para un analista / científico de datos?
Desafortunadamente, hoy en día estamos bajo una enorme presión para producir información a partir de los datos, y los problemas varían con el dominio; así que simplemente no podemos esperar a que los ingenieros de software y los DBA creen herramientas para que podamos obtener datos previamente limpiados y correctamente agregados. Se convierte en nuestra responsabilidad, y pasamos el 60% de nuestro tiempo construyendo herramientas específicas de la tarea, el 20% usando, afinando y depurando las herramientas, y el 20% restante analizando los datos y presentando las ideas. En otras palabras, hoy el 80% del trabajo de un científico de datos es ingeniería y gestión de datos.
https://projecteuclid.org/euclid…