Cómo convertirse en un científico de datos después de tener una licenciatura en Ciencias de la Computación en la India

Estas son las habilidades más buscadas que los empleadores buscan para los puestos de Data Scientist, según el análisis realizado en las ofertas de trabajo (ordenadas por importancia):

  • Big Data
  • Pitón
  • Hadoop
  • R
  • Aprendizaje automático
  • Análisis de los datos
  • Minería de datos
  • SQL
  • Estadística

Comenzaría a aprender estas habilidades y tecnologías para obtener una ventaja competitiva en las entrevistas de trabajo.
Hay muchos recursos en línea, como artículos relevantes, videos y cursos en línea para adquirir estas habilidades.

Aquí hay algunos recursos recomendados para comenzar:

  • Tutorial de Big Data – Tutorial de Apache Hadoop
  • Fundamentos de Big Data y Hadoop

Puede ver más información relevante sobre las habilidades requeridas y encontrar recursos relevantes para cada habilidad aquí.

Algunas excelentes respuestas aquí y las saludo en su mayoría PERO, si puedes hacer algo épico y demostrar tu valía con esto: MSR 2015 Mining Challenge

Yo diría que estarías bien, estoy trabajando en eso ahora, pero no te estoy diciendo mi salsa secreta 😉 PD. Posts.xml es una pesadilla sangrienta.

Si de hecho!

Una formación en TI es esencial para el trabajo más un conjunto de habilidades que necesitará para el trabajo.

Suponiendo que está en el último año de su B.Tech (peor de los casos), esto es todo lo que debe aprender antes de desmayarse y solicitar una posición más fresca.

PASO 1 : aumente sus habilidades matemáticas, especialmente el cálculo y las estadísticas de múltiples variables, así como el aprendizaje automático.

  1. Álgebra Lineal (MIT OCW)
  2. Pista de Matemáticas (Academia Khan)
  3. Estadísticas -Udacity / Introducción abierta
  4. Aprendizaje automático (Stanford Online / Coursera (John Hopkins))

PASO 2 – Aumente sus conocimientos de informática y habilidades de programación

  1. CS50x – EDX
  2. Elija su idioma: recomendaría elegir dos y aumentar sus habilidades con ellos en lugar de hacerlo todo: R / SAS o Python / SPSS (Esta es solo una combinación recomendada R y SAS no son lo mismo \ U0001f61b)
  3. Aprende el idioma \ U0001f602 \ U0001f602 (Academia de códigos y Datacamp (R)

PASO 3 – Aprenda bases de datos (este es un paso muy esencial) Debe aprender –

  1. MongoDb
  2. Cassandra
  3. MySql
  4. Apache CouchDb
  5. PostGreSql

PASO 4 – Aprenda munging de datos y visualización de datos

  1. Aprender a usar herramientas como Datawrangler.
  2. Herramientas de aprendizaje como ggvis.
  3. Informes de datos a través de: Tableau, Spitfire, etc.

PASO 5 – Sube de nivel con Big Data

  1. Aprenda y comprenda análisis de big data.
  2. Aprende MapReduce, Hadoop y Apache Spark.

PASO 6 – Práctica y experiencia

  1. Participa en competiciones de Kaggle
  2. Pasante en empresas
  3. Conozca a otros científicos de datos

Únase a un laboratorio o grupo de investigación que tenga muchos requisitos de procesamiento de datos. La mayoría de ellos tienen.

Estudie Estadísticas, R, Aprendizaje automático, ecosistema de Big Data Hadoop, Python cualquier herramienta de visualización.

Puede estudiar en Udemy, Coursera, etc. o muchas instituciones ahora disponibles que enseñan estos cursos como Insofe, Aegis, etc.

El problema al saltarse la EM es que estás compitiendo contra personas que no se saltaron la EM, y eso te pone en desventaja (incluso si eres igual a los otros candidatos, la contratación segura va al candidato con mayores credenciales).

La forma más sencilla de evitar esto es obtener una pasantía y luego hacer un gran trabajo mientras estás allí. En ese punto, eres una cantidad conocida.

Entiendo el impulso de trabajar en Github (o incluso tratar de publicar resultados). El problema es que es difícil evaluar esas credenciales y es fácil limitar la lista de solicitantes por su grado.

Si eres tan apasionado por el campo, realmente deberías seguir adelante y hacer al menos la EM.

More Interesting

¿Cuáles son los conceptos estadísticos básicos para los científicos de datos?

¿Por qué ser un científico de datos es el trabajo más sexy del siglo XXI?

¿Qué tan seguro es un trabajo como científico de datos?

¿Cuáles son los diferentes programas de pasantías a los que se debe asistir para ser un científico de datos?

¿Cuánto tiempo lleva convertirse en científico de datos?

¿Qué trabajo hace un científico de datos el 80% de su tiempo? Para ser más específicos, ¿cuál es la tarea más importante que se espera de un científico de datos?

¿Es posible para mí hacer una carrera como científico de datos en India?

Científicos de datos: ¿trabaja en un equipo DS centralizado o en un equipo multifuncional? ¿Cuál es más efectivo para el negocio? ¿Para el crecimiento de tu carrera?

¿Cuáles son algunos proyectos geniales que los científicos de datos que aspiran pueden hacer para impresionar a los empleadores potenciales?

¿Es una mala gestión tener un científico de datos con un título avanzado para realizar análisis e informes?

¿Debería quedarme en India y apurarme para comenzar mi empresa o ir a Silicon Valley para trabajar como científico de datos?

¿En qué se diferencia la informática de la ciencia de datos?

¿Puede un postgrado de MBA (marketing) y licenciatura de un instituto principal aprender a convertirse en un científico de datos?

¿Es preferible o bueno tener certificaciones en análisis predictivo y aprendizaje automático para que un científico de datos permanezca en la competencia?

¿Cómo es ser un científico de datos en un banco de inversión?