Si las máquinas se vuelven más inteligentes, ¿qué pasaría con los científicos de datos y los ingenieros de aprendizaje automático en el futuro (dentro de 20 años)?

La aplicación de algoritmos existentes , en forma de marcos que solo necesitan un montón de parámetros, se simplificará enormemente en los años más cercanos. Los primeros pasos importantes son MS Azure, Google Cloud, Amazon ML: ya son capaces de producir los modelos más simples basados solo en sus datos y no en su experiencia como científico de datos.

Lo que está parcialmente resuelto y se hará en varios años:

Reducción de dimensionalidad
Transformación de características para la mayoría de los tipos: toma de decisiones automatizada sobre la conversión de una variable discreta en un grupo de binarios, la división de una variable continua, etc.
Optimizando hiperparámetros
Análisis de dependencia: al menos, será extremadamente simplificado
Aprendizaje de representaciones de texto e imágenes.
Sistemas de recomendación
Visualización: es una parte difícil, muchas personas inteligentes trabajan en él, pero muy pocas lo hacen bien. En la mayoría de los casos, los informes de rendimiento y la analítica empresarial automatizada irán acompañados de gráficos generados automáticamente, pero los humanos seguirán haciendo todo lo bueno. Crear gráficos circulares es una cosa, pero las demostraciones interactivas animadas en 3D son un mundo completamente nuevo.

Todo eso se hará mediante la implementación de tuberías que se ajustarán a su tarea tomando una descripción del problema en forma de algunas configuraciones:

¿Qué es una variable objetivo?
¿Qué rangos de su variable se consideran buenos o malos?
Qué tan robusto debe ser el modelo (estándar de error, por ejemplo)
Función de error
Objetivos de rendimiento: si se puede construir un modelo en la nube, pero no puede permitirse el lujo de una máquina para su despliegue, puede haber una compensación entre la precisión y la velocidad

Eso es todo acerca de ML “tradicional”, porque el aprendizaje profundo ahora no es tan simple y la demanda no es tan amplia como se podría imaginar. Es por eso que la profesión de ingeniero de ML no desaparecerá: las máquinas se vuelven más inteligentes, pero alguien necesita seguir construyendo máquinas nuevas. No toman decisiones clave y ciertamente no entienden nada acerca de los productos de datos. Por lo tanto, su científico de datos típico como especie se transformará en un arquitecto que transformará su problema en las especificaciones de datos, requisitos de tubería y detalles de implementación.

El papel del ingeniero de aprendizaje automático será más importante, ya que habrá grandes problemas de ingeniería relacionados con la construcción de sistemas distribuidos para:

Virtualización: piense que EC2 apunta a ejecutar cientos de modelos en paralelo
Marcos escalables: algunas empresas solo necesitan un par de regresiones lineales, algunas empresas necesitan un sistema en línea que conste de miles de árboles potenciados.
Entrega continua: las startups orientadas a datos tendrán un flujo de información cambiante y los modelos deben estar actualizados en todo momento. Piense en “Temas de tendencia” en Quora: un servicio más grande como este en un sitio de noticias importante tendrá que emplear un poderoso algoritmo de aprendizaje en línea. También está conectado a su feed, para que reciba no solo sus cosas recomendadas, sino también noticias emergentes
Herramientas de monitoreo del desempeño: las personas no creerán en estos servicios a ciegas, querrán saber sobre sus opciones. Mostrar los resultados del backtesting es importante

En el futuro, el aprendizaje automático u otras tecnologías relacionadas con la IA serán una parte integral del trabajo del ingeniero de software. Los programadores de sistemas y los desarrolladores web probablemente estarán libres de eso, pero otros tendrán que ponerse al día.

Dicho esto, la habilidad central que posee un buen científico de datos: la capacidad de comprender el problema detrás del CSV, no es algo que pueda importar como paquete de Python. Las personas que ahora se llaman científicos de datos existieron hace siglos, pero eran conocidos como “expertos mundiales en lo que está pasando”. Incluso las máquinas más inteligentes solo nos brindan formas más rápidas y sofisticadas de equivocarnos, por lo que la profesión en sí misma no va a ninguna parte.

¿Cómo es ser un científico de datos en BCG?

¿Por qué se paga mejor a los actuarios que a los científicos de datos?

¿Cuáles son algunas calificaciones o certificados que puede obtener un analista de datos / científico de datos?

¿Cómo es obtener una licenciatura en Ciencia de Datos en la Universidad de San Francisco?

¿Hay empresas que ofrezcan trabajos de formación remunerados en ciencia de datos?

Cómo convertirse en un científico de datos en dos años sin una maestría o doctorado

La verdadera pregunta es de qué tipo de ‘inteligente’ estamos hablando. Si puede responder esta pregunta, obtendrá respuestas para el resto de las preguntas.

Recientemente, AlphaGo se convirtió en el primer programa en vencer a un jugador profesional en el juego Go. Este es un logro innovador, pero la inteligencia de AlphaGo se limita al juego Go.

Para competir con los científicos de datos, la IA debe ser más inteligente no solo en una tarea en particular, sino en una multitud de cosas que los humanos hacen sin esfuerzo. Tiene que comprender los requisitos comerciales y crear soluciones, lo que requiere inteligencia a nivel humano que las máquinas actuales no poseen. Cuando las máquinas se vuelven tan inteligentes, reemplazarían muchos otros trabajos que requieren menos inteligencia y pensamiento, antes de comenzar a reemplazar a los científicos de datos.

Pero, francamente, nadie puede predecir el estado de la IA en el año 2036. Depende de los avances en la investigación de la IA en los próximos 20 años. A mayor número de avances, más inteligentes serán las futuras máquinas.

Si las máquinas pueden adquirir ‘Inteligencia General Artificial’ (AGI) en algún momento en el futuro, eso sería una gran amenaza para la humanidad, no porque pueda eliminar a la humanidad (no lo hará), sino porque entonces podría hacer cualquier trabajo que un humano podría hacerlo, mucho más rápido y probablemente mejor que nosotros, haciéndonos parecer inútiles e inútiles.

La IA actual tiene un largo camino para alcanzar la inteligencia a nivel humano. ¡Hasta entonces los humanos no necesitan preocuparse!

Richard Mahuze

Hola:

En mi opinión, todavía se requerirán expertos en Data Scientist y ML dentro de 20 años. Las principales razones de mi creencia se enumeran a continuación:

La IA no significa que todo lo que las máquinas harán, sino que la IA se puede representar mejor como “Inteligencia Aumentada” , es decir, Man + Machine para resolver los problemas comerciales mejor y más rápido
Incluso con los avances que hemos logrado en ML a lo largo de los años, en ciertos casos hay problemas que un estudiante de segundo grado puede resolver más rápido que una máquina. Por ejemplo, identificar a una persona mirando la cara de la persona.
Cualquier problema o pregunta que requiera un contexto social tomará más tiempo para que una máquina lo resuelva.
Particularmente con respecto a la analítica de texto, hay dos desafíos principales. Primero es la “ambigüedad”. Esto significa que la misma palabra puede significar muchas cosas. El segundo es “Variabilidad”. Indicando lo mismo se puede decir de muchas maneras diferentes.
La experiencia en ontología y dominio es absolutamente fundamental para que cualquier algoritmo de ML / AI tenga un alto nivel de precisión. En términos generales, los algoritmos de ML / AI desarrollados para una industria pueden no ser directamente adaptables para otra industria.

Espero que esto ayude.

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

Richard Mahuze

No creo que el trabajo de científico de datos e ingeniero de aprendizaje automático no esté aquí en 20 años o más, porque los dos perfiles tienen múltiples habilidades (Big Data, estadística, habilidades de programación, …), algunas tareas normalmente serán automatizado, pero algunos otros nunca serán automatizados.

Me gusta la respuesta de Michiel Van Herwegen y sus 3 razones.

También me gustaría compartir con ustedes este artículo sobre ” Científicos de datos automatizados y desempleados para 2025? ”(255 votantes)

El 51% de los votantes espera que esto suceda en 10 años o menos ; vea los resultados a continuación. Al mismo tiempo, aproximadamente una cuarta parte espera que esto suceda en más de 50 años o nunca.

Ref. Imagen: ¿Científicos de datos automatizados y desempleados para 2025?

Me gustan estos dos comentarios :

Katharina Morik , análisis de nivel experto
La respuesta a la pregunta depende de la definición de “análisis a nivel de expertos”. Más y más subtareas se han puesto a disposición para el procesamiento automático. Sin embargo, el nivel experto está exactamente por encima. Por lo tanto, el análisis a nivel de expertos se vuelve cada vez más exigente hasta que cubre toda la ciencia y la filosofía. En este punto final, dudo que los robots u otras máquinas puedan operar sin ningún nivel experto superior. Pero. Admito que esto es simplemente una suposición.

Thomas W Dinsmore , Automatizando la ciencia de datos
Es justo decir que algunas tareas de ciencia de datos están automatizadas hoy y otras nunca lo estarán. Las palabras clave, por supuesto, son “nivel experto”

Buen artículo para leer:

La ciencia de datos todavía está al rojo vivo, pero nada dura para siempre

Abdelbarre Chafik

Esta pregunta implica que hacemos una predicción sin ningún dato para modelar. Los humanos son terribles para hacer predicciones, es por eso que estamos creando y usando algoritmos más y más inteligentes para eso … siempre que tengamos datos.

Entonces la respuesta a esa pregunta es imposible. Es imposible si se le pide una perspectiva de 1 año, y mucho menos 20 años.

Sin embargo, hay algunas cosas que sí sabemos.

Los ingenieros de aprendizaje automático y los científicos de datos son una versión especializada multidisciplinaria de programadores y estadísticos. Tanto los programadores como los estadísticos existen por mucho más de 20 años y existirán por mucho más que eso. Se dice que durante más de 20 años corren el riesgo de desaparecer. Ambos todavía están aquí y siguen fuertes. Como dije, los humanos son terribles para predecir cosas.
La innovación técnica tiende a reemplazar el trabajo barato no especializado y el trabajo peligroso especializado. Las máquinas más inteligentes afectarán esos trabajos primero. Piensa en conducir autos y drones militares. Los trabajos basados en la innovación tienden a florecer bajo nuevos nombres, técnicas y campos. La programación sobresale en esto como ninguna otra. En este momento … ¡también los estadísticos!
Parece que la mayoría de las personas no pueden decidir qué son las máquinas más inteligentes. Algunos nos advierten que las máquinas serán demasiado inteligentes en el futuro, mientras se quejan de que las máquinas no son lo suficientemente inteligentes en el presente. Para mí, esta es una pista importante sobre cuán complejo es este problema.
Los profesionales de alto rendimiento se distinguen no por hacer todo sino por hacer lo que agrega valor. Las máquinas que son tan inteligentes serían una bendición para los mejores profesionales de alto rendimiento en cualquier campo, incluidos los científicos de datos y los ingenieros de aprendizaje automático. Me encantaría hablar con una máquina y decirle cuál es mi razonamiento y dejar que haga el trabajo combinatorio. Aportaría mucho más valor a mi organización.

Les puedo garantizar que en 1996, hace exactamente 20 años, nadie tenía la menor idea de dónde estaríamos ahora. Cualquiera que hiciera predicciones en ese entonces probablemente estaba equivocado. De acuerdo con todos los sistemas que integré en ese momento y que se suponía que serían para siempre, supongo que no sabemos dónde estaremos en meses, y mucho menos 20 años.

Me encantó escribir esto!

Roman Trusov

No estaría demasiado preocupado por tres razones.

Primero, cada vez que veas Amazing Breakthrough ™ en la prensa popular, casi definitivamente no se pone en un contexto apropiado. Ese contexto es:

Por lo general, es una tubería de aprendizaje automático diseñada para hacer una cosa realmente muy buena.
Configurar una buena tubería de principio a fin en realidad no es trivial y requiere mucho esfuerzo y experiencia.
Por lo general, se enmarca en términos mágicos, como una computadora soñando. Pero si tiene algún conocimiento sobre el aprendizaje automático, es fácil diseccionar esas noticias en términos menos mágicos.
Por último, cada vez que se burla de un nuevo logro, ¿te has preguntado cuál era el mejor anterior? Es muy probable que el mejor anterior fuera casi tan bueno.
Las tareas que generan mayor cantidad de prensas suelen estar en áreas de datos donde:

Es fácil obtener grandes volúmenes de datos, al menos para algunas empresas.
Hay poco contexto externo. (quiero decir, para identificar un animal en una imagen, una palabra en una grabación de texto …, todos los datos relevantes están contenidos en la imagen o grabación)

El segundo punto continúa en el contexto. Somos muy buenos en cosas contextuales. Usted trabaja en una empresa, una gran cantidad de conocimiento implícito y explícito se acumula de forma espontánea en su cabeza. Como resultado, si tiene trabajo que hacer, es probable que conozca muchos detalles ingeniosos como:

A quien involucrar
Donde puede obtener algunos de los datos
Muchas cosas específicas de la industria que pueden aparecer en los datos y que son muy importantes o muy triviales, pero de cualquier manera son muy engañosas para un algoritmo.

Cuidar todas esas cosas es mucho trabajo, por lo tanto, a menudo se afirma que la limpieza de datos es del 70/80/90 por ciento del trabajo. Se podría argumentar que todo esto también se automatizará de alguna manera. Pero si veo lo que cuenta hoy como herramientas de limpieza de datos, esperaré antes de apostar por eso.

Como último punto, tenga en cuenta que incluso si podemos automatizar gran parte del trabajo de hoy, eso podría significar que podemos hacer algunas de las cosas que ahora se descartan debido a la falta de tiempo.

Por supuesto, 20 años es mucho, mucho tiempo, por lo que podría estar completamente equivocado en ese período de tiempo.

Ricardo Vladimiro

Buena pregunta.

Supongo que aunque parezca que estas oportunidades de empleo escasearán, creo que afectaría a otros trabajos más y antes que estos.

Las computadoras darían mucho diagnóstico. Por lo tanto, la necesidad de médicos y especialmente de otras personas de atención médica puede ser menos necesaria.
La gente haría sus propios impuestos con softwares mucho mejores y sistemas Q / A automatizados y, por lo tanto, las personas que preparan los impuestos pueden tener dificultades para conseguir trabajo.
Mucha gente puede obtener asesoramiento legal básico de los sistemas legales de preguntas y respuestas en lugar de gastar en abogados.
Habrá policías predictivas y, aunque dudo que haya un RoboCop, los requisitos de los oficiales de policía se reducirán con enfoques más basados en datos.
No necesitaría ingenieros de software que realicen pruebas de código en diferentes plataformas y sistemas. Los sistemas automatizados podrían realizarlos o incluso predecir mejor si el código funcionará en una plataforma diferente.
Incluso las niñeras pueden perder sus trabajos con roboNannies que pueden cuidar al bebé.

Puedo seguir con esta lista. Pero, creo que la ciencia de datos y la inclinación de la máquina serían muy generalizadas en todos los sectores. Y no veo que los científicos de datos y los ingenieros de aprendizaje automático estén sin trabajo en un futuro próximo. Por el contrario, cuanto más bajo sea el trabajo en general y requiera menos habilidades, la posibilidad de que ese trabajo desaparezca es más probable.

Roman Trusov

Solo sería útil como individuo. Expresar la individualidad es lo que lo diferenciará de las expresiones individuales de la IA. Así que sueña en grande, piensa diferente. Sus propias ideas lo separarán como individuo, incluso si ese individuo es una IA avanzada tan capaz como usted o más. Las expresiones son todo lo que tenemos. Solo mira nuestro ADN

Abdelbarre Chafik

More Interesting

¿Qué se requiere para ser un científico de datos en India?

¿Por qué los científicos creen que tienen razón?

¿Qué tan probable es que los trabajos de los científicos de datos se saturen demasiado en los próximos años?

¿Qué es más difícil para el científico de datos promedio, las matemáticas involucradas o la programación requerida? ¿Qué proporción del trabajo de un científico de datos se gasta en matemáticas versus programación?

Empleos y carreras en ciencia de datos: ¿Sería beneficioso ser un científico de datos con antecedentes médicos (para aquellos que ya tienen MD), o sería innecesario?

Cómo lidiar con la advertencia, 'ADVERTENCIA: la corrección no ha podido mejorar la probabilidad de registro' en la regresión logística a través de SAS

¿Puedo convertirme en analista de datos después de convertirme en CPA?

Además de los logros académicos, ¿qué otras cosas debo destacar / hacer / escribir / decir para obtener una beca completa para una maestría en ciencias de datos / análisis en Europa?

¿Cuál es la hoja de ruta para aprender Java como analista de datos?

Cómo conseguir un trabajo de ciencia de datos en Python en India