Ninguno de los títulos de ingeniería ofrece por completo las habilidades que necesita un científico de datos. Ni siquiera la informática. Soy un graduado de matemáticas y me mudé a la ciencia de datos justo después de la graduación, en 2014.
Entonces, ¿cómo me metí en eso? Antes de entrar en eso, déjame responder la pregunta:
¿Por qué las empresas buscan estudiantes de CS?
- ¿Cuál es una configuración de sistema típica para científicos de datos?
- ¿Qué tan realista es la transición de una carrera de QA a una de científico de datos a los 36 años?
- Me gusta entrar en informática con un M.Sc. en ingenieria electrica. ¿Puedo hacer esto por mi cuenta, sin ir a un programa de informática?
- ¿Por dónde empiezo si quiero que me llamen científico de datos dentro de un año?
- ¿Necesito una computadora bastante poderosa para analizar grandes conjuntos de datos si tengo la intención de establecer un negocio de consultoría como científico de datos y experto en Tableau? ¿Sería suficiente una MacBook Air o similar?
Cualquier día de la semana encontraría que un Científico de Datos sería:
-Extracción de datos de varias fuentes usando R, Python , (los lenguajes de programación más utilizados) y herramientas como Minero rápido, etc.
– Limpiar / segmentar los datos obtenidos de diferentes fuentes ejecutando varios fragmentos de código en lenguajes de programación como R, Python, etc.
– Construya un modelo predictivo utilizando estadísticas como Regresión de línea, Regresión logística, Inferencia bayesiana, etc con R / Python.
-Presentar los datos recién obtenidos de manera significativa a las partes interesadas utilizando herramientas como Tableau, Qlikview, ggplot, etc.
-Implementar algoritmos de Machine Learning (escrito en R / Python) para optimizar los resultados, lo que básicamente significa descubrir el forma matemática de la solución de un problema empresarial
Como puede imaginar, la mayoría de las tareas anteriores requieren que un Científico de Datos codifique en un lenguaje de programación, razón por la cual las compañías prefieren contratar graduados en Informática. Si sabe cómo codificar, se pueden enseñar fácilmente otras cosas como el modelado estadístico .
Para mí, era bueno en matemáticas, necesitaba trabajar en mis habilidades de codificación y estadísticas.
Así que primero aprendí R y escribí códigos para fórmulas matemáticas básicas como (a + b) ^ 2, y me moví para escribir códigos para múltiples variables. Después de más de seis meses, sentí que podía escribir códigos R cómodamente.
Cuando completé la graduación, encontré una pasantía en una start-up de análisis a través de Internshala, donde trabajé como pasante de ciencia de datos (por un estipendio mensual de Rs. 2000) trabajando junto a un científico de datos y aprendí a usar Rapid Miner.
En los últimos dos años, también aprendí Python y trabajé en herramientas como Tableau, Apache Spark y más. Y ahora estoy enfocado en aprender algoritmos de aprendizaje profundo.
Entonces, ¿cómo puede convertirse en un científico de datos?
Como no eres un estudiante de cs, el mejor enfoque a seguir sería:
- Aprenda lenguajes de programación como R, Python , SAS y técnicas estadísticas.
- Desarrolle su experiencia encontrando soluciones a los problemas.
- ¡Consigue un trabajo!
¿Cómo te enteraste de esto?
- Utilice los recursos en línea : Udemy, Udacity y Simplilearn ofrecen una multitud de cursos sobre lenguajes de programación como R, Python. Use estos cursos para aprender a codificar y construir modelos estadísticos.
Sin embargo, lo único que vale la pena señalar aquí es que debería hacer varios cursos. Por ejemplo, se le requeriría hacer cursos separados para comprender estadísticas, construir modelos predictivos con R o Python , y más. Esto tomaría seis meses o más dependiendo de qué tan rápido aprenda.
Hay más sitios web especializados, como Analytics Vidhya y Jigsaw Academy, que atienden específicamente a la comunidad de ciencia de datos. Estos sitios web son más adecuados para las personas que ya están en la ciencia de datos y desean dominar una habilidad específica.
Las dos plataformas anteriores pueden no ser ideales para principiantes.
Un punto que vale la pena señalar aquí es que ninguna de las plataformas anteriores ofrece asistencia laboral a los candidatos.
3. Use Kaggle: use esta plataforma para trabajar en algunos problemas reales. Resolver desafíos en Kaggle te ayudaría a usar R / python y acelerar tus posibilidades de conseguir un trabajo rápido.
3. Intente realizar una pasantía: realice una pasantía como pasante de Data Science, esto aumentaría su credibilidad para el puesto de Data Scientist, ya que las empresas valoran la experiencia más que el grado.
4. Solicitar un trabajo.
Eso es.
También puede probar diferentes campos de entrenamiento de ciencia de datos gratuitos (simplemente busque en Google), nuevamente, si es un principiante puro, es posible que tenga problemas para comprenderlo.
Mientras estoy en esto, también recomendaría que pruebes edwisor. A diferencia de otras plataformas mencionadas anteriormente, puede aprender R, python, estadísticas y aprendizaje automático, en un solo curso y trabajar en un proyecto de la industria desde cero, que luego son evaluados por profesionales de la industria para validar sus habilidades.
Además, edwisor también ofrece asistencia laboral a sus candidatos.
¡Te deseo todo lo mejor para tu futuro!
Cheerio