Cómo aprender ciencia de datos como estudiante de matemáticas

Ser una persona matemática es definitivamente una ventaja. También necesita mejorar sus habilidades en el frente de estadísticas y programación.

Como científico de datos, se espera que tome un problema comercial y lo traduzca a una pregunta de datos, cree modelos predictivos para responder la pregunta y cuente historias sobre los hallazgos.

Los estadísticos que se centran en la implementación de enfoques estadísticos de los datos, y los gerentes de datos que se centran en ejecutar equipos de ciencia de datos tienden a caer en el papel de científico de datos. Los científicos de datos son el puente entre la programación y la implementación de la ciencia de datos, la teoría de la ciencia de datos y las implicaciones comerciales de los datos.

Que aprender

Habilidades técnicas

  • Matemáticas (por ejemplo, álgebra lineal, cálculo y teoría de grafos)
  • Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
  • Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)
  • Habilidades de ingeniería de software (por ejemplo, computación distribuida, algoritmos y estructuras de datos)
  • Minería de datos
  • Limpieza de datos y munging

Esta lista siempre está sujeta a cambios. Como sugiere Anmol Rajpurohit, “las habilidades genéricas de programación son mucho más importantes que ser expertos en un lenguaje de programación en particular”.

Habilidades para los negocios

  • Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
  • Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.
  • Curiosidad intelectual: explorar nuevos territorios y encontrar formas creativas e inusuales para resolver problemas.
  • Conocimiento de la industria: Comprender la forma en que funciona la industria elegida y cómo se recopilan, analizan y utilizan los datos.

¿Cómo aprender?

Aprende la teoría:

Si pensamos en habilidades específicas para aprender en los primeros dos años de la universidad, hay dos categorías principales:

  • Los fundamentos de las matemáticas, incluido el cálculo multivariable y el álgebra lineal, así como los cursos básicos basados ​​en pruebas.
  • Aprendiendo a modelar el mundo con ecuaciones diferenciales y estadísticas.

En términos de estadísticas, muchos cursos tienden a ser un poco más aplicados, aunque, por supuesto, te animo a que profundices en la teoría.

Encuentra problemas interesantes:

Una vez que tenga la teoría baja, encuentre problemas interesantes para resolver.

Recomiendo ir a las personas que personalmente consideras interesantes y preguntarles sobre los desafíos en los que están pensando.

No es necesario, ni creo que sea aconsejable, pensar en ti mismo puramente como un “físico”, un “químico” o un “estadístico”, eso solo limita los problemas a los que nos exponemos.

Implemente las habilidades y haga el trabajo:

Para implementar sus habilidades teóricas y prácticas, encuentre un proyecto que requiera que construya modelos teóricos o basados ​​en datos (hacer ambos será mejor cualquier día).

Puede comenzar a aprender programación de computadoras en varios niveles de sofisticación, y le recomiendo que aprenda al menos la programación básica temprano. Si está interesado en la ciencia de datos en particular, vaya más en las estadísticas y la programación. Pero, de nuevo, la forma de mejorar la pieza de implementación es practicar la implementación. A medida que realiza más trabajos de programación, es posible que descubra que desea más fundamentos teóricos del Paso 1; regrese al inicio del marco y continúe mejorando.

Resuelva problemas que surjan en lugar de buscar problemas que se ajusten a su herramienta:

Nuestro valor como académico, empresario y / o líder proviene de encontrar soluciones creativas a los problemas que surgen sin preocuparse por la forma de la solución.

Claro, es bueno tener una gran bolsa de herramientas: estadísticas, simulaciones, ecuaciones diferenciales, conocimiento de problemas en múltiples disciplinas. ¡Pero descubrirá rápidamente que los problemas del mundo real no son a menudo clavos que se prestan a golpear con el martillo que se le da en el aula! Tienen complejidades y advertencias, datos faltantes, múltiples caminos de acercamiento.

Tendrá que lidiar con el difícil desafío de la toma de decisiones bajo varias restricciones: tendrá que usar su conocimiento y las herramientas actuales para construir otros hasta que se llegue a una solución, y esa es la habilidad crítica para aprender.

Calificación

Las calificaciones académicas pueden ser más importantes de lo que imaginas. Como señala Burtch Works, “es increíblemente raro que alguien sin un grado cuantitativo avanzado tenga las habilidades técnicas necesarias para ser un científico de datos”.

En su informe de salario de ciencia de datos, Burtch Works determinó que el 88% de los científicos de datos tienen una maestría y el 46% tiene un doctorado. La mayoría de estos títulos son en materias rigurosas cuantitativas, técnicas o científicas, incluyendo matemática y estadística (32%), informática (19%) e ingeniería (16%).

Dicho esto, las empresas están desesperadas por candidatos con habilidades en el mundo real. Su conocimiento técnico puede superar los requisitos de grado preferido.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes construyeron proyectos sobre el conjunto de datos REAL y las declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

  • Programa – http://www.greyatom.com/full-sta…
  • Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

Hay muchos cursos (MOOC o tradicionales) disponibles en todo el mundo, pero muchos olvidan que un Data Scientist debe ser bueno en CS / IT y ciencias duras, pero también en aplicaciones comerciales y ética y derecho. Esto último se olvida con demasiada frecuencia en los planes de estudio, pero es un desafío enorme.

Visítenos en el Data ScienceTech Institute, con nuestros programas de maestría más intensivos de 1,600 horas, en asociación con personas como SAS France y KDnuggets (Gregory I. Piatetsky-Shapiro)
Y debido a que nos preocupamos por la RSE, también ofrecemos una variedad de becas, que cubren del 50 al 100% de las tasas de matrícula. 😉

Hay algunos enlaces muy útiles en el tema de ciencia de datos Preguntas frecuentes: ¿Cuál es el tema de ciencia de datos preguntas frecuentes? lo que le dará una idea básica de qué es Data Science, algunas de las áreas que puede explorar y algunos excelentes recursos para aprender las herramientas y técnicas del oficio.

Te recomiendo que refuerces tus conocimientos, especialmente en probabilidad, estadística, álgebra lineal y cálculo. Puede aprender a programar en Python con bastante facilidad utilizando los numerosos cursos gratuitos y, por lo general, de alta calidad disponibles en línea. Una vez que se sienta cómodo con la programación y las estadísticas, puede sumergirse en R.

A medida que continúe aprendiendo, trate de identificar sus áreas de interés. Podrá encontrar su camino fácilmente una vez que comience este viaje. Buena suerte.