Por lo general, las habilidades de datos se dividen en dos grandes categorías:
1. Habilidades de ingeniería : configuración de sistemas de bases de datos, redacción de consultas, integración con aplicaciones, etc.
2. Habilidades de análisis : puede abarcar desde estadísticas matemáticas, estadísticas aplicadas multivariadas, álgebra matricial, minería de datos, aprendizaje automático, etc.
- ¿Por qué se paga mejor a los actuarios que a los científicos de datos?
- ¿Qué consejo le darías a un aspirante a científico de datos?
- ¿Puedo ingresar a la ciencia de datos después de un largo período de experiencia sin TI?
- ¿Cómo te desarrollas como profesional cuando eres el único en tu campo en tu empresa?
- ¿Cuál es un buen trabajo de nivel de entrada para un aspirante a científico de datos sin experiencia en el campo y con un título en contabilidad?
Muchos ingenieros y arquitectos de datos tienen las mismas habilidades (# 1) pero diferentes perfiles de trabajo. “Científico de datos” y “Analistas de datos” tienen la misma misión en una organización, pero generalmente tienen diferentes habilidades (razones a continuación). Tenga en cuenta que algunas organizaciones usan ambos términos: científicos y analistas indistintamente, lo que puede aumentar la confusión. Veremos cómo se inventaron los cuatro perfiles de trabajo y cómo * la mayoría * de las personas lo usan.
Arquitecto de datos
Las grandes empresas generan una gran cantidad de datos de varias fuentes diferentes (agrupadas en dos)
1. Fuentes internas: sistemas existentes (CRM, HRMS, Web Analytics, etc.)
2. Fuentes externas: alimentación del mercado de valores, etc.
Un Arquitecto de datos es alguien que puede comprender todas las fuentes de datos y elaborar un plan para integrar, centralizar y mantener todos los datos. Debe poder comprender cómo se relacionan los datos con las operaciones actuales y los efectos que cualquier cambio futuro en el proceso tendrá sobre el uso de los datos en la organización. Necesita poder tener una visión de extremo a extremo y ver cómo un diseño lógico se traducirá en una o más Bases de datos físicas, y cómo los Datos fluirán a través de las etapas sucesivas involucradas.
Esto puede incluir cosas como diseñar bases de datos relacionales, desarrollar estrategias para la adquisición de datos, recuperación de archivos e implementación de una base de datos, limpiar y mantener la base de datos eliminando y eliminando datos antiguos, etc.
Ingeniero de datos
Los ingenieros de datos son ingenieros de núcleo duro que conocen los aspectos internos de los softwares de bases de datos. Compila e instala sistemas de bases de datos, escribe consultas complejas, las escala a múltiples máquinas, asegura copias de seguridad y establece sistemas de recuperación ante desastres. Por lo general, tiene un profundo conocimiento y experiencia en uno o más softwares de bases de datos diferentes (SQL / NoSQL).
Analista de datos
Las tareas principales de un analista de datos son la compilación y el análisis de información numérica. Por lo general, tienen una licenciatura en ciencias de la computación y negocios. Obtienen información analítica de todos los datos que puede tener una organización (software de base de datos o simplemente hojas de Excel) que tiene sentido para la organización y los compila en informes decentes para que otras personas no técnicas puedan comprender y decidir su curso de acción.
Un analista generalmente trabaja para obtener información analítica de los datos y este perfil de trabajo no incluye trabajar con estadísticas (generalmente) y no tiene nada que ver con “BigData” en particular.
Una organización mediana decente puede tener muchos analistas. Por ejemplo, un analista de ventas puede observar todas las ventas en el último trimestre y determinar una estrategia de ventas adecuada (dónde vender y a quién vender para maximizar las ganancias). Luego comunicará el informe al liderazgo.
Científico de datos
“Data Scientist” es un fenómeno muy reciente y generalmente se asocia con BigData. La misión general de un científico es la misma que la de un analista, pero una vez que el volumen y la velocidad de los datos cruzan un cierto nivel, se requieren habilidades realmente sofisticadas para obtener esos conocimientos.
Un “científico de datos” generalmente tiene muchas habilidades superpuestas: ingeniería de bases de datos, manejo de sistemas BigData como Hadoop OR Netezza, conocimiento de Python / R y conocimiento de estadísticas / minería de datos.
Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente (CRM, etc.), un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede resolver un problema comercial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.
Más información sobre el científico de datos – La respuesta de Arun Prasath – La respuesta de Arun Prasath a ¿Qué es un científico de datos?