¿Pueden un experto en programación y un campeón estadístico juntos desempeñar un papel de científico de datos?

No es necesario El problema son tus suposiciones.

Primera suposición: un científico de datos es un programador y un estadístico. Esto es muy limitado. Un científico de datos comprende muy bien el contexto de su trabajo. En un entorno corporativo, debe comprender el negocio, así como la alta dirección y tan bajo como los contribuyentes individuales. También puede ser un programador y estadístico brillante y ser bastante malo para comunicarse con otras personas, a su nivel. También hay muchos rasgos personales que no encajan en la descripción mínima.

Segunda suposición: un científico de datos es un papel solitario. La ciencia de datos es un esfuerzo de equipo. Algunos son mejores programadores, otros son mejores estadísticos, otros son expertos en negocios, otros comunicadores, otros adoran las cosas complejas de aprendizaje automático. Cuando reúnes todo eso, tienes exactamente lo que estás defendiendo: un equipo. Esta es (o debería ser) la realidad, no una ilusión.

Mi equipo, por ejemplo: un matemático que es más que capaz de usar varios lenguajes de programación y se enfoca en un área de producto específica. Un investigador bien versado en estadística, capaz de codificar a nivel de reproducibilidad. Yo, experiencia en ingeniería y gestión, capaz de estadísticas y muy versado en codificación y nuestro negocio. Nos complementamos para formar un equipo muy sólido y ninguno de nosotros es un experto en programación y un campeón estadístico. Juntos hacemos ciencia de datos.

Por definición, un científico de datos es alguien que conoce suficientes estadísticas pero no es un estadístico y conoce suficiente codificación pero es un programador.

A veces esto no es suficiente. Especialmente en las grandes empresas es necesario contar con especialistas en estadística y codificadores o ingenieros de ingeniería para tener una masa crítica.

Trabajo como científico de datos en un entorno multidisciplinario. Entonces, al menos, nuestra empresa está llena de personas externas (para afirmar que todos necesitamos tener todas las habilidades). Principalmente hago estadísticas y pienso en el contexto (los diagnósticos: ¿qué necesitamos medir para responder preguntas pertinentes que sean significativas y útiles para nuestros clientes?)
Tenemos personas que hacen mucha programación e implementación, y otros se centran más en la visualización, integración de sistemas, ventas, …

No necesita tener personas que sean buenas en “todo”, necesita personas que sean buenas en lo que hacen y puedan trabajar juntas. Como tal, obtendrá excelentes resultados que son mejores que la suma de las partes

More Interesting

¿Cuál es el papel de un científico de datos en robótica?

Cómo obtener un puesto de Data Scientist con un doctorado en Ingeniería Química

¿Qué piensan los científicos de datos sobre el uso de la raíz de C ++, en comparación con R o Python? Me preocupa el rendimiento y la flexibilidad.

Cómo convertirse en un científico de datos en India

¿Es 'Data Science' un término meme o una palabra de moda?

Como científico de datos, ¿recuerda todo lo que estaba en sus libros de texto? ¿Utiliza la técnica más óptima para procesar datos la mayor parte del tiempo?

¿Es Data Science o Analytics una buena carrera para estudiantes / pensadores visuales?

¿Qué habilidades necesita aprender un científico de datos para poner en producción modelos de aprendizaje automático?

¿Alguna vez ha trabajado en una startup fallida como científico de datos?

Como ingeniero de datos / científico de datos, ¿qué tan importante es tener un conocimiento profundo de algoritmos y estructuras de datos? ¿No son las funciones de ingeniería de software e ingeniería de datos / ciencia diferentes por una razón y corresponden a diferentes conjuntos de habilidades?

Quiero cambiar mi carrera a científico de datos. Soy ingeniero quimico. ¿Qué tengo que hacer?

¿Cómo es ser un científico de datos en Airbnb?

¿Qué es mejor, la nube o los científicos de datos?

¿Cómo es ser un científico de datos en Dropbox?

¿Por qué es Apache Spark popular entre los científicos de datos?