¿Puedo convertirme en un científico de datos con una licenciatura en CS?

Nunca se trata de “tengo un ____ grado, ¿puedo hacer ____?”

Los grados en realidad no significan mucho: los grados generalmente muestran que tienes HABILIDADES para realizar un determinado trabajo. Hay muchas personas que tienen excelentes títulos sin las habilidades necesarias y personas sin títulos que estudian por sí mismas y están suficientemente preparadas.

Le sugiero que analice estas 7 cosas y vea cuánto sabe de cada una, y practique las que le parezcan desconocidas. Estas fueron las 7 cosas más comunes que vi cuando entrevisté en grandes empresas (Facebook, Intel, Square, eBay, etc.) para puestos relacionados con la ciencia de datos.

Lenguajes de programación básicos : debe conocer un lenguaje de programación estadística, como R o Python (junto con las bibliotecas Numpy y Pandas), y un lenguaje de consulta de bases de datos como SQL

Estadísticas : debe poder explicar frases como hipótesis nula, valor P, estimadores de máxima verosimilitud e intervalos de confianza. Las estadísticas son importantes para analizar datos y seleccionar las cifras más importantes de un gran conjunto de datos. Esto es crítico en el proceso de toma de decisiones y para diseñar experimentos.

Aprendizaje automático : debe poder explicar los vecinos K más cercanos, los bosques aleatorios y los métodos de conjunto. Estas técnicas generalmente se implementan en R o Python. Estos algoritmos muestran a los empleadores que usted está expuesto a cómo la ciencia de datos puede usarse de maneras más prácticas.

Disposición de datos : debe poder limpiar los datos. Esto básicamente significa entender que “California” y “CA” son lo mismo: no puede existir un número negativo en un conjunto de datos que describa la población. Se trata de identificar datos corruptos (o impuros) y corregirlos / eliminarlos.

Visualización de datos : el científico de datos es inútil por sí solo. Necesitan comunicar sus hallazgos a los gerentes de producto para asegurarse de que esos datos se manifiesten en aplicaciones reales. Por lo tanto, la familiaridad con las herramientas de visualización de datos como ggplot es muy importante (para que pueda MOSTRAR datos, no solo hablar de ellos)

Ingeniería de software : debe conocer algoritmos y estructuras de datos, ya que a menudo son necesarios para crear algoritmos eficientes para el aprendizaje automático.

Gestión del producto : este es definitivamente discutible, pero aquellos que entienden el producto son los que sabrán qué métricas son las más importantes. Hay toneladas de números que uno puede probar A / B, por lo que el científico de datos orientado al producto elegirá las métricas correctas para experimentar.

¡Absolutamente puedes! Los graduados de CS realmente pueden obtener buenos resultados en ciencia de datos. Los graduados de CS tienen ventajas competitivas en estructuras de datos, programación, bases de datos y algoritmos. Pero aquí están las diferencias fundamentales que debes entender.

  1. Necesitas tener conocimiento específico del dominio para ser un científico de datos; lo que significa es que necesitas tener exposición en conjuntos de datos que puedas comprender y traer las correlaciones de los puntos de datos. Literalmente, su experiencia lo ayudará a cerrar esta brecha de habilidades. Si trabaja en la industria financiera, comprenderá mucho acerca de las finanzas. Si trabaja en atención médica, debe comprender los conjuntos de datos de atención médica. Pero hay algunos conjuntos de habilidades que siempre serán transferibles de una industria a otra. Por ejemplo, los modelos analíticos predictivos tienen atributos similares en muchas industrias.
  2. Los graduados de CS tienen menos comprensión de las estadísticas. Entonces, pase más tiempo en estadísticas y minería de datos. Tome cursos sobre estadística descriptiva, regresiones, análisis de datos de tiempo, análisis espacial, etc.
  3. Finalmente, debe motivarse para aprender nuevos algoritmos específicos para los dominios y ser un trabajador independiente.

Buena suerte.

Por supuesto .

Tiene muchas ventajas innegables sobre muchas personas:

  • Como ha escrito esta pregunta en Quora, tiene una conexión (o la posibilidad de conectarse) a Internet . Por lo tanto, una fuente inagotable de conocimiento.
  • Tiene una licenciatura, por lo tanto, ha demostrado capacidades intelectuales , dedicación y capacidad de planificación .
  • Sabes (quizás en cierta medida) cómo programar .

¡Entonces ya estás en un buen camino !

Lo que te puede faltar:

  • Habilidades estadísticas
  • Una formación matemática en general.
  • Experiencia en el campo
  • Habilidades de comunicación y presentación .

Todo lo anterior podría ser aprendido. Elige algo y comienza a aprender hoy.

¡La mejor de las suertes!

Para obtener más consejos, puede encontrar útiles estas respuestas:

  • La respuesta de Yassine Alouini a ¿Qué estadísticas debo saber para hacer ciencia de datos?
  • La respuesta de Yassine Alouini a ¿Qué materias matemáticas se necesitan para un científico de datos?
  • La respuesta de Yassine Alouini a ¿Cómo puede un estudiante de Data Scientist desarrollar experiencia en el dominio?

Como de costumbre, sígueme para obtener más información: http://quora.com/profile/Yassine

Si tienes una licenciatura, estoy seguro de que puedes hacer lo que quieras. Es solo que necesita tener conocimiento, pocos proyectos y tener experiencia laboral sería una ventaja. Conceptos estadísticos, matemáticos, de programación, orientados a objetos: estos son los cimientos para convertirse en un científico de datos. Luego, el siguiente paso es adquirir el conocimiento de los conceptos de aprendizaje automático. Entonces, sí, no necesariamente necesitas un título avanzado para convertirte en un científico de datos. Tener uno es solo una cereza en la cima! ¡Buena suerte!

La pregunta que hizo parece que tiene motivación para ser un científico de datos. Un científico de datos es una persona que posee las habilidades para analizar los datos tanto objetiva como subjetivamente y puede derivar patrones útiles de los datos. Lo que se enseña en CS se relaciona básicamente con las computadoras y la programación, pero para ser un científico de datos se necesitan conocimientos de matemática aplicada y estadísticas junto con suficiente versatilidad en la programación. Entonces, en su licenciatura, puede tomar CS con una especialización en estadística o matemática aplicada para que pueda desarrollar una noción bien formada sobre ciencia de datos.