¿Qué tipo de análisis hace el científico de datos en tiempo real?

“Un científico de datos es alguien que es mejor en estadística que cualquier ingeniero de software y mejor en ingeniería de software que cualquier estadístico”.

En cualquier día, se puede requerir que un científico de datos:

  • Realizar investigaciones no dirigidas y formular preguntas abiertas a la industria
  • Extrae grandes volúmenes de datos de múltiples fuentes internas y externas.
  • Emplee sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar datos para su uso en modelos predictivos y prescriptivos.
  • Limpie y pode a fondo los datos para descartar información irrelevante
  • Explore y examine datos desde una variedad de ángulos para determinar las debilidades, tendencias y / u oportunidades ocultas.
  • Diseñe soluciones basadas en datos para los desafíos más apremiantes.
  • Inventar nuevos algoritmos para resolver problemas y crear nuevas herramientas para automatizar el trabajo.
  • Comunique predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos
  • Recomendar cambios rentables en los procedimientos y estrategias existentes.
  • Obtener los datos de varias fuentes de datos, casi siempre en formatos que no son convenientes para el análisis que debe hacerse. Entonces, los científicos de datos terminan codificando varios tipos de scripts o programas para reformatear los datos en los formatos que necesitan.
  • Necesidad de interactuar con bases de datos. A menudo, los datos que necesitan se encuentran en algún tipo de base de datos, y los resultados de sus análisis se pueden almacenar en otras bases de datos o almacenes de datos. Además, a menudo mantienen archivos y agregaciones en otras bases de datos.
  • Haciendo varios tipos de análisis estadísticos. Esto puede involucrar secuencias de comandos en R, SAS o Matlab, así como código en lenguajes de programación más comunes, pero a menudo más rápidos, si necesitan realizar análisis pesados. Gran parte del tiempo, los científicos de datos están ajustando estos scripts y analizando su salida.
  • Los científicos de datos orientados al marketing pueden pasar una buena cantidad de tiempo escribiendo informes sobre los resultados de sus análisis para que puedan ser utilizados para “ajustar” las campañas de marketing.
  • Los científicos de datos que trabajan para empresas que realizan análisis “en tiempo real” o de “transmisión” pasan mucho tiempo iterando y ajustando modelos parametrizados que son utilizados por algún tipo de motor de puntuación que se ejecuta en los datos en vivo y pueden tomar decisiones automatizadas basadas en su puntuación. (Si están haciendo esto, a menudo se los considera “desarrolladores” ya que sus modelos son parte del entorno de producción).
  • Los científicos de datos también pueden ajustar los parámetros utilizados en simulaciones grandes.
  • Muchos científicos de datos terminan haciendo todo lo anterior, y más …

Un aspecto poco apreciado del trabajo de la ciencia de datos es la cantidad de conocimiento de dominio empresarial que los científicos de datos necesitan para ser realmente efectivos. Como suelen ser “personas inteligentes”, tienden a aprenderlo rápidamente, pero para un nuevo científico de datos, esta es a menudo la parte más empinada de la curva de aprendizaje en una nueva compañía.

Data Scientist: el trabajo más sexy del siglo XXI

More Interesting

¿Es necesario Hadoop para los científicos de datos?

Como Data Scientist en ejercicio, ¿consideraría contratar a alguien que haya completado la especialización "Data Science" en Coursera en un puesto de Data Scientist de nivel básico?

Quiero ingresar a un programa de maestría en ciencia de datos. ¿Podría aprender matemáticas discretas darme una ventaja competitiva?

¿Puedo ser el mejor científico de datos sin matemáticas?

¿Deberían las personas importantes en matemáticas o estadísticas aprender sistemas distribuidos o diseño de bases de datos para ser un buen científico de datos?

Como científico de datos o consultor de análisis, ¿cómo explica su trabajo a los padres mayores que nunca habían usado computadoras?

¿Sería ventajoso saber muchas matemáticas para convertirse en un minero de datos?

¿Cómo debería prepararse un más nuevo para ser publicado como científico de datos en India?

¿Cuáles son las cosas más interesantes en las que un científico de datos puede trabajar?

¿Dónde debería comenzar a convertirme en científico de datos? Actualmente, estoy más fresco sin experiencia laboral, pero he trabajado con Scikit-learn, Numpy y Pandas.

¿Qué hacen los científicos de datos en Google?

¿Qué clases debo tomar en el MIT si quiero convertirme en un científico de datos?

¿Sería una buena idea unirse a un campo de entrenamiento de ciencia de datos después de recibir una maestría en ciencia de datos?

¿Debería quedarme en India y apurarme para comenzar mi empresa o ir a Silicon Valley para trabajar como científico de datos?

¿Cómo puede alguien sin experiencia previa construir un buen currículum como científico de datos?