¿Qué hiciste como estudiante para prepararte para convertirte en un científico de datos?

La mayor parte de mi experiencia universitaria no estaba dirigida específicamente a convertirme en científico de datos. Sobre todo seguí mis intereses académicos (que en cierto modo estaban en la intersección de las estadísticas y la informática), y luego terminé como científico de datos, ya que me di cuenta de que era una excelente manera de continuar mi interés en esos campos.

Aquí hay algunas cosas que hice en la universidad que me prepararon para convertirme en científico de datos:

  • Tome clases desafiantes en estadística y ciencias de la computación . Puede ver la carga de mi curso en ¿Qué clases tomó William Chen mientras estaba en la Universidad de Harvard? Las clases que recomendaría incluyen un año completo de estadísticas introductorias y ciencias de la computación para obtener los conceptos básicos, y luego tantas clases como sea posible que involucren el análisis de datos con código (modelado, aprendizaje automático, clases de análisis de datos). Puede ver recomendaciones específicas en ¿Qué clases debo tomar si quiero ser un científico de datos?
  • Buscar y realizar oportunidades de pasantías relacionadas con los intereses de la ciencia de datos: estos fueron extremadamente valiosos para mí, especialmente porque me expusieron a la ciencia de datos como una carrera en lugar de solo un interés académico. Echa un vistazo a ¿Qué empresas tienen pasantías en ciencia de datos para estudiantes universitarios?
  • Juega en Kaggle : Kaggle siempre es un gran lugar para comenzar, especialmente en las competiciones Playground y Getting Started. Los foros y los guiones para esas competiciones generalmente tienen un montón de excelentes recursos. Ocasionalmente, hay una competencia en efectivo que también es buena para principiantes, aunque generalmente las competencias en efectivo son demasiado difíciles para alguien que recién comienza.
  • Participe en la comunidad local de ciencia de datos : asistí a algunos eventos de hackathon organizados por hack / reduce cuando era estudiante universitario. Para las personas de todo el área de Boston, consulte hack / reduce (@hackreduce) | Twitter y Mass Big Data (@MassBigData) para noticias sobre lo que está sucediendo. Por lo general, siempre hay grupos de Meetup sobre ciencia de datos en su área.

Por extraño que parezca, no me di cuenta de que iba a convertirme en un científico de datos porque el campo no existía en ese momento, pero mi camino fue el de estudiar biología y bioestadística.

De este campo, aprendí:

  • el mundo es muy heterogéneo
  • hay raras excepciones
  • para acumular muchos hechos dispares.
  • las categorías pueden desglosarse y cambiar a medida que se adquiere nueva información
  • siempre hay nueva información
  • siempre hay incógnitas
  • para buscar componentes (como los 20 aminoácidos básicos) y disfrutar de su diversidad
  • mirar la colección fanatasticamente diversa de proteínas que se componen de los 20 aminoácidos básicos. Algunas proteínas son venenos, mientras que otras son estructurales, y otras actúan como catalizadores (enzimas). Increíblemente complejo
  • El mundo real está lleno de tonos de gris.
  • Para apreciar cuán desordenadas pueden compararse las mediciones de la vida real con sistemas relativamente simples como la física.
  • sospechar de los datos, ya que el ruido puede parecer señal y la señal puede parecer ruido
  • “Todos los modelos están equivocados, pero algunos son útiles” (George Box).
  • La evolución muestra que no importa cuán improbable sea un evento, con suficientes pruebas, el evento será casi una certeza.

También aprendí a jugar backgammon, de mi novia en ese momento. Esto me enseñó la probabilidad, especialmente no hay protección contra los dados perversos. Con el cubo de duplicación, también aprendí las expectativas (combinación de probabilidad y la cantidad de dinero que se está arriesgando).

More Interesting

¿Cuál es la diferencia entre trabajar en Walmart y Walmart Labs desde la perspectiva de un científico de datos?

¿Debería un científico de datos ser capaz de producir software?

¿Cómo sería útil aprender SAP para mi carrera de Analytics?

¿Puedo ser científico si estudio una licenciatura en química?

¿Cuál debería ser el camino para ser un científico de datos?

Actualmente soy un ingeniero de control de calidad que aspira a convertirse en científico de datos. ¿Qué tan práctico es hacer la transición?

¿Convertirse en un científico de datos es una tarea difícil?

¿Cuáles son las diferencias en el trabajo realizado por un analista de datos y un científico de datos en Netflix?

¿Cuánto puedes ganar como científico de datos trabajando en Berlín?

¿Sería una buena idea unirse a un campo de entrenamiento de ciencia de datos después de recibir una maestría en ciencia de datos?

¿Hay que obtener un doctorado en ciencia de datos para seguir una carrera como científico de datos? ¿Qué pasa si uno solo tiene una maestría en ciencia de datos?

¿Crees que la maestría es importante si quieres trabajar como científico de datos más relacionado con el aprendizaje automático que con los aspectos comerciales?

Como aspirante a científico de datos, ¿qué debo aprender después de pasar por estadísticas descriptivas e inferenciales?

¿Cuál es el primer libro que comienza para comenzar mi viaje en el camino de convertirme en un científico de datos?

Actualmente estoy trabajando en el campo de los informes, pero quiero entrar en el campo de los científicos de datos. ¿Cuánto alcance ofrece el campo del científico de datos?