Hemos separado a los profesionales de datos en cuatro categorías: Arquitecto, Ingeniero, Analista, Científico . Esto se desarrolló para ayudar a las empresas a contratar profesionales de datos en función de sus necesidades y para que los profesionales conozcan las habilidades que se demandan.
Aquí están nuestras tablas y un resumen. Puede encontrar la investigación de Elizabeth Mazenko aquí: https://www.betterbuys.com/bi/comparing-data-science-roles/
- ¿Qué tan bien el salario de un científico de datos rastrea el impacto social?
- ¿Qué puede hacer un científico de datos en el campo de la medicina?
- ¿Es posible hacer un cambio de carrera a analista de datos?
- Científicos de datos: ¿trabaja en un equipo DS centralizado o en un equipo multifuncional? ¿Cuál es más efectivo para el negocio? ¿Para el crecimiento de tu carrera?
- ¿Cuántos de ustedes aspiran a convertirse en científicos? Quiero algunas sugerencias tuyas.
Arquitecto de datos: un arquitecto de datos es la persona a la que recurrir para la gestión de datos, especialmente cuando se trata de cualquier cantidad de fuentes de datos dispares. Con un amplio conocimiento de cómo funcionan las bases de datos, así como de cómo los datos adquiridos se relacionan con las operaciones del negocio, el Arquitecto de datos, idealmente, puede especular cómo los cambios afectarán el uso de datos de la compañía, y luego manipular la arquitectura de datos para compensarlos. .
- Responsabilidades: almacenamiento de datos, ETL, desarrollo de arquitectura, modelado
- Lenguajes: Hive, SQL, Pig, Spark, XML
Ingeniero de datos : este rol está estrechamente relacionado con el Arquitecto de datos. El ingeniero de datos también trabaja en el lado de la administración de datos, lo que hace que algunas personas piensen que los títulos son intercambiables. Sin embargo, un ingeniero de datos, que generalmente tiene una sólida formación en ingeniería de software, crea, prueba y mantiene la arquitectura de datos.
- Responsabilidades: ETL, instalación de soluciones de almacenamiento de datos, modelado de datos, arquitectura y desarrollo de datos, pruebas de arquitectura de bases de datos
- Lenguajes: R, Python, SAS, MatLab, SQL, NOSQL, Pig, Hadoop, Java, C / C ++, Ruby Perl
Analista de datos: el analista de datos trabaja para interpretar los datos para obtener información procesable para la empresa. Con una sólida formación en estadísticas y la capacidad de convertir datos de una forma cruda a un formato diferente (mezcla de datos), el analista de datos recopila, procesa y aplica algoritmos estadísticos a datos estructurados.
- Responsabilidades: recopilación y procesamiento de datos, programación, aprendizaje automático, munging de datos, visualización de datos, aplicación de análisis estadístico
- Lenguajes: R, Python, SQL, NOSQL, HTML, Java Script, C / C ++
Científico de datos: la misión de un científico de datos es similar a la de un analista de datos: encontrar ideas procesables que sean clave para el crecimiento y la toma de decisiones de una empresa. Sin embargo, se necesita un rol de Científico de datos cuando el volumen y la velocidad de los datos de una empresa exceden un cierto nivel que requiere habilidades más sólidas para clasificar a través de un mar de datos no estructurados (big data) para identificar preguntas y extraer información crítica. Luego, la persona limpia los datos para un análisis adecuado y crea nuevos algoritmos para ejecutar consultas que relacionan datos de fuentes dispares.
Además de estas habilidades, un Data Scientist también necesita habilidades sólidas de narración y visualización para compartir ideas con sus pares en toda la empresa.
- Responsabilidades: limpieza y procesamiento de datos, modelado predictivo, aprendizaje automático, identificación de preguntas, consultas, aplicación de análisis estadístico, correlación de datos dispares, narración de historias y visualización
- Lenguajes: R, Python, SAS, Hive, MatLab, SQL, Pig, Spark, Hadoop