¿Qué puede hacer un científico de datos si cada vez se automatizan más cosas (especialmente desde que se adoptó la caja de herramientas analíticas automatizadas)?

La creación de un modelo predictivo a menudo comienza recolectando datos de múltiples fuentes y descubriendo cómo transformar esos datos en observaciones relevantes. Luego crea el modelo y lo evalúa. A continuación, a menudo hay una ronda para determinar qué características del modelo son demasiado difíciles o demasiado costosas para mantener en producción con la latencia requerida, seguido de un refactorizador. Por último, debe descubrir cómo encajar este modelo en producción de tal manera que realmente haga lo que se supone que debe hacer.

Y esto omite la parte más importante … identificar la oportunidad y comenzar con el caso de negocios. Incluso si la creación de modelos predictivos excelentes estuviera completamente automatizada en base a un lago de datos masivo, todavía pasará mucho tiempo antes de que las máquinas puedan refactorizar automáticamente el flujo de su sitio para usar el modelo, mucho menos identificar, cuantificar y priorizar oportunidades comerciales consistentes con Los objetivos estratégicos actuales de una empresa.

En ese punto, la pregunta más importante podría ser: ¿qué van a hacer los CEO?

Creo que DS se centraría en la exactitud de los supuestos, interpretaría, desarrollaría, validaría e implementaría soluciones, ejecutaría escenarios, etc.

En general, dedica más tiempo a las estadísticas y las matemáticas, si entendí tu pregunta correctamente.

Actualización: El siguiente enlace se enfoca en formas de “explicar” los modelos ML:

Introducción a las explicaciones agnósticas modelo interpretables locales (LIME)

Curiosamente, mi respuesta sería la opuesta a la de Drago. Si cada vez más de mis análisis se automatizaran, pasaría mucho más tiempo en el lado comercial, explicando los resultados o actuando sobre ellos.

Mi experiencia ha sido que algunas personas se sienten cómodas integrando los resultados analíticos en su toma de decisiones, mientras que otras tienen más problemas para decidir cómo comparar los resultados con la incertidumbre y la intuición. Podrías darle a esas personas una herramienta que hace todo, pero no sería hablar un idioma que entiendan y, por lo tanto, no se actuaría sobre los resultados.

Lo que me emociona es tomar decisiones comerciales inteligentes. Yo uso estadísticas para hacerlo. Actualmente, las estadísticas involucradas son bastante difíciles y requieren mucho tiempo, pero la automatización lentamente lo hace más fácil.

La belleza de la automatización es que facilita las cosas. Sin embargo, desde la perspectiva comercial, creo que lo primero que debe hacer un científico de datos aquí es analizar de manera crítica sus métodos de investigación y luego diferenciar todos los intentos correlativos de la causa y los efectos.

Cuando pueda hacer esto, mejorará sus habilidades para resolver problemas y podrá tomar “decisiones comerciales mejores e inteligentes” a través de sus interpretaciones.

Todo ello. La programación se interpone en el camino de las matemáticas y la comunicación de resultados y consume mucho tiempo. Puede dedicar más tiempo a comprender las suposiciones de datos y los métodos de recopilación (puede hacer maravillas para auditar esto en una empresa), desarrollar nuevos algoritmos / investigaciones en el campo, aprender nuevas áreas de las matemáticas y escribir hallazgos para fines técnicos y no técnicos. gente de la empresa.

La ciencia de datos NO es programación. Repita, la ciencia de datos NO está programando.

More Interesting

¿Cómo es el papel de un científico de datos en Facebook?

Al principio, ¿es más importante aprender técnicas de visualización de datos o aprender la teoría / matemática detrás de las técnicas de análisis?

¿Cómo es ser un científico de datos? ¿Dónde trabajas y qué haces (en tu trabajo)?

¿Cuáles son las bibliotecas de Python que usan los científicos de datos?

Además de Kaggle, ¿qué otras opciones hay para hacer un perfil científico de datos?

¿Cuántos algoritmos de aprendizaje automático, y a qué profundidad, debo saber para entrevistar con confianza para un puesto de científico de datos de nivel de entrada?

¿Puede el curso de aprendizaje automático ayudarme a convertirme en científico de datos?

¿Es fácil para un ingeniero mecánico convertirse en analista de datos / científico de datos?

¿Las preguntas de la entrevista de Google destinadas a evaluar las habilidades de 'resolución de problemas' son realmente efectivas para separar a los candidatos buenos de los malos?

¿Por qué quieres convertirte en analista de datos?

¿Qué debo saber si quiero convertirme en científico de datos?

¿Cómo obtengo un trabajo como desarrollador R / científico de datos como recién graduado mientras solicito el trabajo desde el extranjero?

¿Se paga más a los científicos de datos que a los ingenieros de datos?

¿Cuál es la parte más frustrante del trabajo de un científico de datos?

¿Cuál es el mejor curso para el científico de datos en Pune?