¿Qué habilidades necesito para ser un científico de datos por el que lucharán las grandes compañías tecnológicas?

Le sugiero que analice estas 7 cosas y vea cuánto sabe de cada una, y practique las que le parezcan desconocidas. Estas fueron las 7 cosas más comunes que vi cuando entrevisté en grandes empresas (Facebook, Intel, Square, eBay, etc.) para puestos relacionados con la ciencia de datos.

Lenguajes de programación básicos : debe conocer un lenguaje de programación estadística, como R o Python (junto con las bibliotecas Numpy y Pandas), y un lenguaje de consulta de bases de datos como SQL

Estadísticas : debe poder explicar frases como hipótesis nula, valor P, estimadores de máxima verosimilitud e intervalos de confianza. Las estadísticas son importantes para analizar datos y seleccionar las cifras más importantes de un gran conjunto de datos. Esto es crítico en el proceso de toma de decisiones y para diseñar experimentos.

Aprendizaje automático : debe poder explicar los vecinos K más cercanos, los bosques aleatorios y los métodos de conjunto. Estas técnicas generalmente se implementan en R o Python. Estos algoritmos muestran a los empleadores que usted está expuesto a cómo la ciencia de datos puede usarse de maneras más prácticas.

Disposición de datos : debe poder limpiar los datos. Esto básicamente significa entender que “California” y “CA” son lo mismo: no puede existir un número negativo en un conjunto de datos que describa la población. Se trata de identificar datos corruptos (o impuros) y corregirlos / eliminarlos.

Visualización de datos : el científico de datos es inútil por sí solo. Necesitan comunicar sus hallazgos a los gerentes de producto para asegurarse de que esos datos se manifiesten en aplicaciones reales. Por lo tanto, la familiaridad con las herramientas de visualización de datos como ggplot es muy importante (para que pueda MOSTRAR datos, no solo hablar de ellos)

Ingeniería de software : debe conocer algoritmos y estructuras de datos, ya que a menudo son necesarios para crear algoritmos eficientes para el aprendizaje automático. Conozca los casos de uso y el tiempo de ejecución de estas estructuras de datos: colas, matrices, listas, pilas, árboles, etc.

Gestión del producto : este es definitivamente discutible, pero aquellos que entienden el producto son los que sabrán qué métricas son las más importantes. Hay toneladas de números que uno puede probar A / B, por lo que el científico de datos orientado al producto elegirá las métricas correctas para experimentar. Sepa lo que significan estos términos: Pruebas de usabilidad, tramas alámbricas, tasas de retención y conversión, análisis de tráfico, comentarios de los clientes, registros internos, pruebas A / B.

En cada campo, mencioné algunas palabras de moda que debería conocer. Hay toneladas de sitios web que podría usar, por lo que le recomiendo usar estas 7 sucursales como una hoja de ruta para guiarse.

¡Bienvenido a Data Science!

Perspectivas analíticas, pensamiento y sentido comercial.

Creatividad.

Buenas habilidades técnicas (p. ej., programación, desarrollo de algoritmos, cierta competencia técnica como Spark / SQL).

No lucharán por ti, pero tendrás demanda.

More Interesting

¿Recomendaría un científico de datos de nivel básico para mudarse a Austin, TX?

¿Los científicos de datos son 'parásitos de investigación'?

¿Qué debo hacer para cambiar de un ingeniero de big data a un científico de datos?

¿Qué universidades ofrecen una maestría en ciencia de datos o análisis?

¿Alguien puede ser un buen científico / ingeniero de datos si está más orientado a los resultados que al proceso?

Como científico de datos, ¿te importa si estás ayudando a los malos? ¿O simplemente haces tus trucos, coges tu sueldo y no piensas en ello?

¿Cómo se ve el perfil (currículum y carta de presentación) de un ingeniero de datos o científico de datos en Facebook?

¿Cuáles son las oportunidades in situ para los empleados de LatentView como científicos de datos?

¿Los doctores técnicos hacen buenos científicos de datos?

¿Fue difícil cambiar la carrera de mecánico a científico de datos?

¿Qué debo estudiar por mi cuenta para convertirme en científico de datos?

¿Cómo obtengo un trabajo como desarrollador R / científico de datos como recién graduado mientras solicito el trabajo desde el extranjero?

¿Qué piensan los científicos de datos experimentados sobre 'El proceso de ciencia de datos' descrito en Harvard CS 109 (2013) (ver imagen)?

¿Puede un graduado de finanzas computacionales con habilidades de codificación convertirse en un científico de datos?

Como recién graduado, tuve la oportunidad de trabajar en un proyecto de Big Data, mi función actual es la de probador, pero estoy interesado en el desarrollo. ¿Qué tengo que hacer?