Absolutamente. Una de las habilidades principales que distingue a un estadístico de un científico de datos es la programación. Descubrí que la programación / ciencias de la computación aumentan increíblemente la capacidad de hacer estadísticas, por lo que la combinación de ambas áreas de habilidades es extremadamente valiosa. Algo que los científicos de datos pueden hacer con sus habilidades de programación:
- Utilice herramientas más especializadas para manipular datos, como Pandas para la manipulación de datos habitual, o Spark para la manipulación de datos personalizados a gran escala con operaciones complejas.
- Cree tuberías que ejecuten tareas automáticamente, mueva los datos al lugar correcto y alimente cosas como análisis de experimentos y tuberías de tablero.
- Automatizar el trabajo repetitivo.
Para los lenguajes preferidos, los dos más importantes son Python (lenguaje de programación) y R (lenguaje de programación). R vs Python se ha discutido interminablemente dentro de la comunidad de ciencia de datos, consulte ¿Cuál es mejor para el análisis de datos: R o Python? ¿R sigue siendo un mejor lenguaje de análisis de datos que Python? ¿Alguien más ha usado Python con Pandas, en gran medida, en proyectos de análisis de datos? para más discusión
- Cómo obtener un puesto de Data Scientist con un doctorado en Ingeniería Química
- ¿Los científicos de datos son buenos gerentes de producto?
- ¿Cuáles son algunas sugerencias para un curso de certificación en Big Data?
- Cómo demostrarle a un empleador que soy un científico de datos valioso
- ¿Alguien puede explicar sobre el trabajo del científico de datos?