Si se trata de personas que realmente ni siquiera entienden los conceptos básicos de la selección de funciones, el sesgo de muestreo, etc. Me arriesgaría a suponer que no cubrían ningún aprendizaje automático en sus grados. El aprendizaje automático no es necesariamente parte de un título en ciencias de la computación y la mayoría de los ingenieros de software no saben mucho al respecto, especialmente aquellos que no obtuvieron sus títulos en los últimos años desde que ML e IA se han vuelto populares.
En mi opinión, lo que tiene la culpa de esto es el esfuerzo concertado para “democratizar el aprendizaje automático”. Busque ese término en Google y encontrará una gran cantidad de herramientas y bibliotecas de aprendizaje automático como Tensorflow de Google, IBM Watson, etc.
Estas bibliotecas han hecho posible que una gran cantidad de desarrolladores de software incursionen en el aprendizaje automático sin capacitación. He escrito sobre estos tipos antes. Agregan una referencia de tensorflow a sus 11 líneas de código python copiadas del desbordamiento de pila y creen que eso los convierte en ingenieros de aprendizaje automático. Estos tipos creen que las bibliotecas de ML son similares a los lenguajes de programación de alto nivel que abstraen con éxito los engorrosos detalles de la implementación que se encuentran en los lenguajes de nivel inferior. Intenta decirle a uno de estos tipos que no puedes usar una biblioteca sin una comprensión más amplia del tema y te preguntarán si haces toda tu codificación escribiendo unos y ceros en el bloc de notas. Simplemente no saben lo que no saben.
- ¿Cómo podemos usar la ciencia de datos para ayudar a los países del tercer mundo?
- ¿Cuáles son algunos problemas comunes con los conjuntos de datos reales con los que los científicos de datos tienen que lidiar?
- ¿Cuál sería mejor, un MIDS de Berkeley o un MBA en ciencia de datos y análisis de Santa Clara?
- Cómo convertirse en un científico de laboratorio de investigación sin una maestría
- ¿Qué idiomas debo saber para convertirme en científico de datos?
En mi curso de maestría en ciencias de la computación, completado recientemente, tuve la oportunidad de aprender aspectos del aprendizaje automático tanto de la escuela de informática como de la escuela de estadística. Las mayores diferencias que encontré fueron que el departamento de informática esperaba que yo pudiera codificar algoritmos ML desde cero sin referencias a las bibliotecas, mientras que la escuela de estadística estaba de acuerdo con hacer referencia a las bibliotecas en R. La presentación de cursos de la escuela de informática tomó principalmente el forma de proyectos de software (los conceptos estadísticos más amplios también se cubrieron en los exámenes), mientras que las presentaciones de la escuela de estadística tomaron la forma de informes, no les importó el código R utilizado para generar el detalle de los informes.
Ambos enfoques incluyeron el aprendizaje de las estadísticas básicas, incluidas las pruebas A / B, las pruebas t, cómo evitar el sobreajuste y la falta de ajuste, la selección de características, etc. Sin embargo, sin tener que entender completamente cómo implementar los algoritmos desde cero, la escuela de estadística permitió más tiempo para considerar las implicaciones estadísticas de lo que estábamos haciendo. Entonces puedo ver cómo alguien saldría de la escuela de estadística después de haber pasado más tiempo practicando los temas estadísticos que los graduados en informática. El enfoque de la informática prepara mejor al estudiante para convertirse en un investigador de aprendizaje automático, mientras que el enfoque de la escuela de estadística está más en sintonía con las tareas cotidianas de un científico de datos.