¿Qué funciones de un científico de datos o ingeniero de aprendizaje automático tienen mayor probabilidad de ser automatizadas en un futuro cercano?

Me gustaría pensar que seguiremos viendo que las tareas mecánicas se automatizan. Cada vez que un científico de datos copia y pega código repetitivo o fragmentos de guiones, un ángel pierde sus alas. O muere un gatito. Tienes la idea.

Pero sospecho que está preguntando sobre la automatización de las funciones cognitivas superiores de los científicos de datos y los ingenieros de aprendizaje automático. ¿Alguna vez llegaremos al punto en que los sistemas supervisados ​​de aprendizaje automático sean solo un recuadro negro en el que arroje datos etiquetados y produzca automáticamente un modelo? Ciertamente estamos trabajando para alcanzar esa aspiración, y es posible que nos acerquemos lo suficiente como para que mucha menos gente pueda hacer mucho trabajo.

Pero hay aspectos de la ciencia de datos y el aprendizaje automático que serán difíciles de automatizar:

  • Elegir la función objetivo correcta. Incluso un sistema de aprendizaje automático perfecto puede, en el mejor de los casos, optimizar lo que le dices que optimice.
  • Elegir datos de entrenamiento representativos, especialmente cuando los datos pueden cambiar inesperadamente con el tiempo.
  • Evitar situaciones en las que los sistemas de aprendizaje automático entregan profecías que se cumplen por sí mismas (véase “Incómodo con los datos”).

No tengo dudas de que los avances en el aprendizaje automático y la ciencia de datos mejorarán nuestra productividad, permitiéndonos crear más valor con menos humanos. En ese sentido, los científicos de datos no son diferentes a cualquier otra persona sujeta a los cambios provocados por las mejoras en tecnología y automatización.

Pero no veo cómo podemos automatizar parte de la toma de decisiones en la parte superior de la pila. Pero tal vez nuestros nuevos señores de la IA simplemente no están compartiendo sus secretos.

Por lo que he visto en las competiciones de Auto-ML, supongo que la adaptación y el ensamblaje del modelo. Una vez que haya establecido lo que está tratando de hacer (clasificar o retroceder) y la métrica de rendimiento (MAD, MSE, etc.), determinar cuál de la miríada de modelos funcionará mejor a menudo implica prueba y error o conocimiento de experiencia pasada o literatura. Ser capaz de encontrar modelos que funcionen bien bajo validación cruzada y pruebas entre estos es una buena tarea para la automatización.

Aquí hay una implementación para Python (desafortunadamente, solo funciona en el sistema operativo Linux)

More Interesting

¿Cómo puede un científico de datos conseguir un trabajo en el sector gubernamental en la India?

¿Qué tan difícil es convertirse en un científico de datos a través de cursos de autoeducación / en línea si tiene un título universitario en ingeniería mecánica?

¿Cuánto es importante saber sobre IR, PNL y modelado de temas para convertirse en un buen científico de datos? ¿Cuán relevantes son estos para la ciencia de datos?

¿Puedo convertirme en un científico de datos haciendo Ingeniería en Ciencias de la Información?

Además de los sistemas de recomendación, ¿cuáles son los productos finales típicos que los científicos de datos podrían ofrecer?

¿Cuál es el futuro del big data y la informática en los próximos 10 años? Para las personas que trabajan como científicos de datos o desarrolladores de software, ¿qué pasaría con sus carreras?

Al elegir entre convertirse en un científico de datos y un ingeniero de software, ¿cuál tiene el mejor futuro?

¿Cuál es la demanda de científicos de datos?

¿Un título en informática urbana ayuda a encontrar trabajo en ciudades inteligentes?

¿Cuáles son los mayores desafíos para convertirse en un científico de datos?

¿Puede un estudiante de segundo año de cse convertirse en científico de datos tan pronto como complete su b.tec?

¿Qué tipo de revistas suelen leer los científicos de datos?

¿Cómo debo prepararme para programar preguntas en una entrevista de ciencia de datos?

¿Cuáles son ejemplos asombrosos de científicos de datos autodidactas?

Además del aprendizaje automático, ¿cuáles son las otras cosas que debo aprender para convertirme en un científico de datos / PNL?