“Un científico de datos es alguien que es mejor en estadística que cualquier ingeniero de software y mejor en ingeniería de software que cualquier estadístico”.
En cualquier día, se puede requerir que un científico de datos:
- Realizar investigaciones no dirigidas y formular preguntas abiertas a la industria
- Extrae grandes volúmenes de datos de múltiples fuentes internas y externas.
- Emplee sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar datos para su uso en modelos predictivos y prescriptivos.
- Limpie y pode a fondo los datos para descartar información irrelevante
- Explore y examine datos desde una variedad de ángulos para determinar las debilidades, tendencias y / u oportunidades ocultas.
- Diseñe soluciones basadas en datos para los desafíos más apremiantes.
- Inventar nuevos algoritmos para resolver problemas y crear nuevas herramientas para automatizar el trabajo.
- Comunique predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos
- Recomendar cambios rentables en los procedimientos y estrategias existentes.
- Obtener los datos de varias fuentes de datos, casi siempre en formatos que no son convenientes para el análisis que debe hacerse. Entonces, los científicos de datos terminan codificando varios tipos de scripts o programas para reformatear los datos en los formatos que necesitan.
- Necesidad de interactuar con bases de datos. A menudo, los datos que necesitan se encuentran en algún tipo de base de datos, y los resultados de sus análisis se pueden almacenar en otras bases de datos o almacenes de datos. Además, a menudo mantienen archivos y agregaciones en otras bases de datos.
- Haciendo varios tipos de análisis estadísticos. Esto puede involucrar secuencias de comandos en R, SAS o Matlab, así como código en lenguajes de programación más comunes, pero a menudo más rápidos, si necesitan realizar análisis pesados. Gran parte del tiempo, los científicos de datos están ajustando estos scripts y analizando su salida.
- Los científicos de datos orientados al marketing pueden pasar una buena cantidad de tiempo escribiendo informes sobre los resultados de sus análisis para que puedan ser utilizados para “ajustar” las campañas de marketing.
- Los científicos de datos que trabajan para empresas que realizan análisis “en tiempo real” o de “transmisión” pasan mucho tiempo iterando y ajustando modelos parametrizados que son utilizados por algún tipo de motor de puntuación que se ejecuta en los datos en vivo y pueden tomar decisiones automatizadas basadas en su puntuación. (Si están haciendo esto, a menudo se los considera “desarrolladores” ya que sus modelos son parte del entorno de producción).
- Los científicos de datos también pueden ajustar los parámetros utilizados en simulaciones grandes.
- Muchos científicos de datos terminan haciendo todo lo anterior, y más …
Un aspecto poco apreciado del trabajo de la ciencia de datos es la cantidad de conocimiento de dominio empresarial que los científicos de datos necesitan para ser realmente efectivos. Como suelen ser “personas inteligentes”, tienden a aprenderlo rápidamente, pero para un nuevo científico de datos, esta es a menudo la parte más empinada de la curva de aprendizaje en una nueva compañía.
- ¿Cuál es la hoja de ruta para aprender Java como analista de datos?
- ¿Qué curso de carrera profesional de ciencias de datos debo tomar para la transición profesional?
- Papel del científico de datos después de la escuela de posgrado: ¿es mejor probar una empresa pequeña o grande?
- ¿Quién es un científico de datos?
- ¿Cómo aprender adecuadamente sobre big data y cursos para convertirse en un científico de datos? Por encima de eso, qué idiomas son imprescindibles para convertirse en un científico de datos profesional
Data Scientist: el trabajo más sexy del siglo XXI