No. Hay dos formas de convertirse en un científico de datos sin ningún Master / PhD:
- Comience lo antes posible mientras sea estudiante de pregrado. (Esto es lo que hice)
- Aprende mientras estás en un trabajo.
Intentaré compartir algunas de mis experiencias mientras era estudiante de pregrado.
2do año de ingeniería
- ¿Cómo puede un más nuevo conseguir el trabajo en una empresa de Big Data?
- ¿Qué tan fácil es para un bioestadista con una maestría en Estadística Médica que trabaja en la academia convertirse en un científico de datos en el mundo corporativo?
- ¿Cómo pueden los aspirantes a científicos de datos aprovechar mejor los recursos de Kaggle?
- ¿Qué puedo hacer para ser un buen científico?
- ¿Qué hace un científico de datos?
Entonces, mi primer encuentro con la ciencia de datos fue después de mis exámenes finales del segundo año cuando hice una pasantía en Tata Consultancy Services (TCS), Mumbai como pasante analista de datos (ni siquiera ciencia de datos). Gracias a mi conexión, que me ayudó a conseguir un buen proyecto que implicaba trabajar en SAS. En esos 2 meses, aprendí 5 cosas: SAS, tablas dinámicas en Excel, modelos de regresión, me di cuenta de que me encantan los números y el hecho de que no quiero trabajar en el sector indio de TI / Tecnología.
3er año de ingeniería
Para seguir adelante con mi amor, comencé el Curso John Hopkins sobre Coursera on R Programming en mi tercer año y, mientras lo hacía, envié un correo electrónico a toneladas de CEO de startups con sede en EE. UU. Que les solicitaban trabajo no remunerado desde su hogar / pasantía. Uno de ellos estuvo de acuerdo y durante un mes estuve haciendo limpieza de datos, visualización de datos y análisis de regresión en R para una startup de IoT con sede en Nueva York.
No había tocado el aprendizaje automático hasta entonces.
Después de mi tercer año, envié un correo electrónico a casi 1200 profesores en 10 países para una pasantía de verano en ciencia de datos y finalmente fui a UC Berkeley, California después de mis exámenes finales de tercer año para trabajar con el profesor Bernt Wahl, visualizando los anillos de Saturno usando geometría fractal y programación. Allí, tomé algunos cursos cortos también sobre Estadística y Programación avanzada de R que me hicieron leer este gran libro sobre Estadística de David Freedman (definitivamente recomiendo este libro a cualquiera que esté comenzando).
Esos 2.5 meses en California realmente me abrieron los ojos, ya que me di cuenta de que lo que había hecho hasta entonces no valía nada y el verdadero negocio es el aprendizaje automático (uno de los proyectos en Berkeley fue predecir las trayectorias de los huracanes utilizando los datos de 1850-2010. Había usado regresión lineal en ese entonces y ese fue mi primer proyecto de aprendizaje automático). Después de regresar a la India, comencé el curso de Andrew Ng sobre aprendizaje automático y trabajé para Teach For India como pasante de ciencia de datos durante mis vacaciones de invierno del último año de ingeniería.
4to año de ingeniería
Aunque el requisito de esa pasantía era tener un título de maestría / doctorado, el entrevistador me preguntó muchas cosas sobre el algoritmo de regresión y para entonces supongo que todos los proyectos que había realizado estaban en regresión de una manera u otra. Afortunadamente, mi gerente en Teach For India tenía una Maestría en Estadística de la Universidad de Columbia y sus conceptos en aprendizaje automático eran sólidos como una roca. No podría haber pedido más (puede ser un poco más de estipendio :-)) como pasante. De todos modos, mi proyecto era automatizar el proceso de evaluación de más de 15000 aplicaciones para su famoso programa de becas y, por lo tanto, reducir los costos operativos y el tiempo involucrado. Aprendí muchos algoritmos en esos 2 meses desde diferentes algoritmos de agrupamiento como K-Means hasta algoritmos de clasificación como KNN. Además, me ensucié las manos con un poco de PNL básico con el que pudimos evaluar ensayos de 500 a 1000 palabras de miles de solicitantes con una precisión decente en menos de un minuto. Este fue el momento en que supe con certeza que quería trabajar como científico de datos después de mi graduación.
Después de la graduación
Para entonces, tenía claro que no aprendería nada nuevo si fuera a un curso de maestría en los Estados Unidos. Podría haber trabajado en India, pero casi no hay buenos roles de aprendizaje automático en India e incluso si lo hay, mis posibilidades eran casi cero, ya que era de una universidad con calificación promedio, lo que significa que mis correos electrónicos / aplicaciones ni siquiera se abrirán .
Mientras todo esto sucedía, había crecido una especie de pasión por crear una startup tecnológica que me hizo solicitar este programa acelerador de startups en Londres, Entrepreneur First (construí más de 100 empresas con una valoración de más de $ 750 por ahora). Fue perfecto para mí, ya que podía usar mis habilidades para construir un producto / inicio de aprendizaje automático. Pero solo había un problema: Visa. Afortunadamente, el gobierno del Reino Unido ha comenzado un nuevo esquema de Visa llamado Visa de talento excepcional para personas con conjuntos específicos de habilidades y adivina qué, la ciencia de datos fue una de ellas. Después de 2 meses de procedimiento que incluía el envío de currículum, carta de presentación, toneladas de cartas de recomendación / respaldo, mis repositorios de Github, diagramas de arquitectura de proyectos y muchas otras cosas, pude obtener esta visa que me permite trabajar / estudiar / dirigir una empresa durante aproximadamente 6 años en el Reino Unido (esas pasantías tenían sentido ahora).
Después de trabajar en una idea de inicio en Londres durante 9 meses, se nos acabó el financiamiento inicial y no pudimos recaudar más (estábamos usando el aprendizaje automático para predecir quién venderá su propiedad residencial próximamente en el Reino Unido). A continuación, solicité trabajos de ciencia de datos en las principales startups del Reino Unido y obtuve el empleo en Trainline, que es la aplicación / sitio web de viajes en tren más grande del Reino Unido. Me encanta mi tiempo aquí mientras trabajo a diario en más de mil millones de puntos de datos y uso tecnologías como Spark, EMR. Acabamos de lanzar una nueva función que predice los precios de los boletos de tren utilizando literalmente miles de millones de puntos de datos y ayuda a nuestros usuarios a elegir mejor su viaje.
El aprendizaje automático se está moviendo muy rápido y uno necesita seguir ese ritmo. (Es fácil cuando estás haciendo un doctorado). Entonces, mi equipo y yo pasamos parte de nuestro tiempo diariamente, aprendiendo nuevos temas como el aprendizaje profundo.
Todos en mi equipo aquí en Trainline tienen un MS / PhD de las mejores universidades como UCL, LSE, UBC y es un privilegio trabajar con esas personas a medida que aprendes algo nuevo y sorprendente, cada vez que hablas con ellos. Pero respondiendo a esta pregunta, sí, puede convertirse en un científico de datos sin un MS / PhD.
PD: es posible que hayas notado que he usado la palabra ‘afortunadamente’ varias veces. Así es la vida. 🙂