¿Cuál es la diferencia entre un arquitecto de datos, un analista de datos, un ingeniero de datos y un científico de datos?

Por lo general, las habilidades de datos se dividen en dos grandes categorías:

1. Habilidades de ingeniería : configuración de sistemas de bases de datos, redacción de consultas, integración con aplicaciones, etc.

2. Habilidades de análisis : puede abarcar desde estadísticas matemáticas, estadísticas aplicadas multivariadas, álgebra matricial, minería de datos, aprendizaje automático, etc.

Muchos ingenieros y arquitectos de datos tienen las mismas habilidades (# 1) pero diferentes perfiles de trabajo. “Científico de datos” y “Analistas de datos” tienen la misma misión en una organización, pero generalmente tienen diferentes habilidades (razones a continuación). Tenga en cuenta que algunas organizaciones usan ambos términos: científicos y analistas indistintamente, lo que puede aumentar la confusión. Veremos cómo se inventaron los cuatro perfiles de trabajo y cómo * la mayoría * de las personas lo usan.


Arquitecto de datos

Las grandes empresas generan una gran cantidad de datos de varias fuentes diferentes (agrupadas en dos)

1. Fuentes internas: sistemas existentes (CRM, HRMS, Web Analytics, etc.)
2. Fuentes externas: alimentación del mercado de valores, etc.

Un Arquitecto de datos es alguien que puede comprender todas las fuentes de datos y elaborar un plan para integrar, centralizar y mantener todos los datos. Debe poder comprender cómo se relacionan los datos con las operaciones actuales y los efectos que cualquier cambio futuro en el proceso tendrá sobre el uso de los datos en la organización. Necesita poder tener una visión de extremo a extremo y ver cómo un diseño lógico se traducirá en una o más Bases de datos físicas, y cómo los Datos fluirán a través de las etapas sucesivas involucradas.

Esto puede incluir cosas como diseñar bases de datos relacionales, desarrollar estrategias para la adquisición de datos, recuperación de archivos e implementación de una base de datos, limpiar y mantener la base de datos eliminando y eliminando datos antiguos, etc.


Ingeniero de datos

Los ingenieros de datos son ingenieros de núcleo duro que conocen los aspectos internos de los softwares de bases de datos. Compila e instala sistemas de bases de datos, escribe consultas complejas, las escala a múltiples máquinas, asegura copias de seguridad y establece sistemas de recuperación ante desastres. Por lo general, tiene un profundo conocimiento y experiencia en uno o más softwares de bases de datos diferentes (SQL / NoSQL).


Analista de datos

Las tareas principales de un analista de datos son la compilación y el análisis de información numérica. Por lo general, tienen una licenciatura en ciencias de la computación y negocios. Obtienen información analítica de todos los datos que puede tener una organización (software de base de datos o simplemente hojas de Excel) que tiene sentido para la organización y los compila en informes decentes para que otras personas no técnicas puedan comprender y decidir su curso de acción.

Un analista generalmente trabaja para obtener información analítica de los datos y este perfil de trabajo no incluye trabajar con estadísticas (generalmente) y no tiene nada que ver con “BigData” en particular.

Una organización mediana decente puede tener muchos analistas. Por ejemplo, un analista de ventas puede observar todas las ventas en el último trimestre y determinar una estrategia de ventas adecuada (dónde vender y a quién vender para maximizar las ganancias). Luego comunicará el informe al liderazgo.


Científico de datos

“Data Scientist” es un fenómeno muy reciente y generalmente se asocia con BigData. La misión general de un científico es la misma que la de un analista, pero una vez que el volumen y la velocidad de los datos cruzan un cierto nivel, se requieren habilidades realmente sofisticadas para obtener esos conocimientos.

Un “científico de datos” generalmente tiene muchas habilidades superpuestas: ingeniería de bases de datos, manejo de sistemas BigData como Hadoop OR Netezza, conocimiento de Python / R y conocimiento de estadísticas / minería de datos.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente (CRM, etc.), un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede resolver un problema comercial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

Más información sobre el científico de datos – La respuesta de Arun Prasath – La respuesta de Arun Prasath a ¿Qué es un científico de datos?

Científicos de datos

Los científicos de datos de TI son responsables de extraer datos complejos y brindar asesoramiento relacionado con los sistemas para su organización. Diseñan nuevas formas de incorporar vasta información con un enfoque en temas de tecnología de la información. Trabajan con equipos de otros profesionales de TI para administrar datos estadísticos y crear diferentes modelos basados ​​en las necesidades de su empresa. Poseen habilidades analíticas avanzadas, además de sus excepcionales habilidades de comunicación oral y escrita. Procesan información de investigación para facilitar el consumo y la transforman en planes accionables. También proporcionan valor a sus negocios a través de sus hallazgos y reflexiones reflexivas.

Analistas de datos

Un analista de datos utiliza datos para adquirir información sobre temas específicos. Esto generalmente comienza con el proceso de la encuesta, en el que los analistas de datos encuentran participantes en la encuesta y recopilan la información necesaria. Luego, los datos se interpretan y presentan en formas tales como gráficos o informes. Los analistas de datos también pueden poner sus datos de encuestas en bases de datos en línea.

Ingenieros de datos

Los términos “científico de datos” e “ingeniero de datos” a veces se usan indistintamente e involucran conjuntos de habilidades similares. Sin embargo, los roles de los científicos de datos y los ingenieros de datos son notablemente diferentes.
El trabajo principal para los científicos e ingenieros de datos es tomar grandes y pequeñas cantidades de datos y crear nuevas formas de analizar y utilizar esos datos. Los científicos de datos utilizan su experiencia (generalmente en las ciencias naturales o sociales), junto con las matemáticas, las estadísticas y la informática para analizar datos y proporcionar soluciones para problemas críticos. Los ingenieros de datos emplean habilidades similares con el propósito de recopilar, organizar y almacenar datos. En otras palabras, los ingenieros de datos proporcionan datos limpios, organizados y accesibles a los científicos de datos que los analizan para resolver problemas y crear nuevas tecnologías basadas en sus hallazgos.

Arquitecto de datos

Los arquitectos de datos son responsables del diseño, la estructura y el mantenimiento de los datos, generalmente organizados en una base de datos relacional. Un arquitecto de datos garantiza la precisión y accesibilidad de los datos relevantes para una organización o un proyecto. La gestión y organización de datos es altamente técnica y requiere habilidades avanzadas con computadoras y dominio de lenguajes informáticos orientados a datos como SQL y XML.

Referencias
Científico de datos, salario de TI
Analista de Datos Salario
Científico de datos / Ingeniero Salario
Arquitecto de datos Salario

Tal vez tome la palabra “datos” para ayudar a responder la pregunta … y sabemos que los arquitectos, analistas, ingenieros y científicos son diferentes líneas de trabajo …

Algunos diseñan, otros construyen. Algunos construyen modelos basados ​​en comportamientos / atributos observables / demostrables en el mundo físico, otros construyen modelos hipotéticos y los prueban.

Por lo tanto, es un pensamiento no tan completamente formado, pero un comienzo para 10 🙂

No he examinado las ofertas de trabajo. Estos proporcionan una muestra de los trabajos y sus expectativas en el mercado público. Estos cuatro trabajos están todos relacionados con los datos.

Una historia corta sobre datos y computadoras:

Estos datos se encuentran en décadas de desarrollo de la computadora moderna. Ha mejorado el poder de procesamiento computacional, modularizado por partes componentes en la placa base, cpu, gpu, ram, discos duros y cables de conexión.

Todo se basa en la arquitectura de la computadora y el sistema operativo lo puede utilizar. Esta interfaz permite a los usuarios realizar acciones computacionales en las aplicaciones. Lo hacen con las herramientas estándar de monitor, teclado, mouse, estéreo y micrófono.

Hoy en día, el concepto de computadora se ha desarrollado en la computadora portátil, teléfono inteligente y dispositivos digitales similares. Son iguales en concepto, pero las personas pueden usarlos en diferentes contextos.

La calidad de la arquitectura y el sistema operativo se ven agravados por el diseño y la usabilidad de las aplicaciones de software.

Esta computadora en varias formas es un componente de una red grande, que se conoce coloquialmente como internet o web.

Esta gran red requiere muchos dispositivos e infraestructura. Necesita todas las conexiones de red o transmisión inalámbrica, conmutadores de redes de área local, enrutadores entre redes de área local a redes externas, dispositivos similares a enrutadores más grandes para manejar conexiones regionales más grandes y muchas utilidades de banda ancha para proporcionar el servicio de red.

Dicho esto, una pieza crucial de la computadora en red es la tarjeta ethernet. Todos los dispositivos informáticos tienen direcciones IP únicas y direcciones MAC físicas, para identificarlos en la red interna.

Dicho todo, la industria de la tecnología informática es enorme. Solo ha preguntado acerca de cuatro trabajos que contribuyen al desarrollo y al éxito tecnológico continuo de esta industria en la economía.

El analista de datos realiza un análisis básico de los conjuntos de datos proporcionados. A veces trabajan con la base de datos de información, y otras veces con un desarrollador o administrador de bases de datos. El analista trabaja con los datos en el contexto de un estudio propuesto. Proporcionan una evaluación imparcial.

El científico de datos realiza trabajos parcialmente de análisis de datos. Están versados ​​en modelado computacional y pueden desarrollar los algoritmos para implementarlos. Proporcionan trabajo consultivo a los tomadores de decisiones.

El ingeniero de datos trabaja con sistemas de datos. Desarrollan la estructura para almacenar, extraer, administrar y desarrollar fuentes de información. En contraste, son constructores de tales sistemas.

El arquitecto de datos prevé las necesidades de datos de la organización y planifica la infraestructura. Esto abarca todas las fuentes necesarias de datos en las que trabajan el analista, científico e ingeniero. Incluye cualquier hardware, software y red para conectarlos a todos.

Esto incluye una descripción básica de los trabajos que solicitó. Hay muchos más trabajos en el entorno de datos. Como administrador y desarrollador de bases de datos, administrador de datos, ingeniero de software, desarrollador de redes, desarrollador de negocios, analista de negocios, gerente de productos, desarrollador de productos y soporte técnico de tecnología de la información.

Estos son posibles trabajos en una organización más grande, que ya ha alcanzado una masa crítica de tecnólogos de la información.

Definitivamente también agregaría el aprendizaje automático en las habilidades del Data Scientist, y probablemente en la parte superior de las habilidades requeridas. Además, el científico de datos debe ser un poco un “artista de datos” en términos de saber cómo elegir la mejor manera de visualizar y presentar los patrones descubiertos y las asociaciones de datos.

Estas páginas lo ayudarán a diferenciar estas carreras:
Arquitecto de datos (EE.UU.) Salario
Analista de datos (EE.UU.) Salario
Ingeniero de base de datos (EE.UU.) Salario
Científico de datos, salario de TI (EE. UU.)

Me gusta una infografía de dataCamp: la industria de la ciencia de datos: quién hace qué (infografía). Responde a tu pregunta muy bien.

Respuesta corta:
No hay ninguno.
Respuesta larga:
No hay ninguno, es solo que a las empresas les gusta clasificar las cosas. En todos ellos debe poder estructurar datos, operarlos, escribir consultas, integrarse con aplicaciones, obtener información útil, etc.