¿Cuáles son algunos consejos para un científico principiante en ML / datos que se siente abrumado?

Creo que tener tantos recursos disponibles puede ser a veces una bendición y una maldición. Es genial que tengamos tantas herramientas y fuentes de información para elegir, pero para aprovecharla al máximo, y nuestro tiempo, es realmente importante “elegir” y mantener la “concentración”.

No quiero decir que muchos recursos son “redundantes”, ya que “redundante” tiene un tono algo negativo. Sin embargo, hay muchos libros, herramientas y cursos diferentes que cubren esencialmente lo mismo, aunque el alcance y el estilo pueden ser un poco diferentes.

Entonces, en lugar de agregar todo lo que encontramos a nuestras listas de lectura, diría que tiene más sentido ser absolutamente claro acerca de las metas personales primero (“¿Qué habilidades necesito aprender para resolver el problema X?” ¿Realmente aprender esta nueva herramienta brillante X en lugar de Y? “). Dado que hay tanto material por ahí, es necesario ser un poco más selectivo al elegir el material de aprendizaje y explorar diferentes herramientas. Por supuesto, a veces parece que nos estamos perdiendo algo, pero creo que acostumbrarse a este sentimiento realmente ayuda a mantenerse enfocado y a progresar constantemente.

Por ejemplo, creo que un libro de “introducción al aprendizaje automático” realmente debería ser suficiente, no tiene sentido leer múltiples “introducciones a ML”, a menos que realmente sienta que el recurso en particular no era comprensible o suficiente.

Como explicaron Cathy O’Neil y Rachel Schutt, no hay un científico de datos “perfecto”: simplemente no hay tiempo suficiente para aprender todo, más bien, todos desarrollan un cierto conjunto de habilidades y son mejores en ciertas áreas:

(De: Cathy O’Neil y Rachel Schutt. “Doing Data Science”).

Creo que no saberlo todo no es necesariamente algo malo. Dado que (como se muestra en la figura anterior), podemos compensarnos trabajando en equipo.

  • Como científico de datos / ingeniero de aprendizaje automático, inducirá a otros a tomar muchas decisiones comerciales. Sus conclusiones deben tener sentido comercial real.
  • Comprender las dificultades de DS / ML con inferencias incorrectas. No saque conclusiones apresuradas.
  • Datos de amor Aprenda R, Python y otras herramientas de datos.
  • Cree y desarrolle su repositorio GitHub para guardar y presentar su trabajo DS / ML. Bifurca impresionantes conjuntos de datos públicos y otros valiosos repositorios.
  • Métete en Kaggle. Obtenga ideas e inspiraciones a partir de ahí.

Aquí hay un video corto con un enfoque que he encontrado útil tanto para mí como para mis amigos, familiares y aquellos con quienes trabajo:

¡Espero que obtengas algo de esto!