¿Cuál es la diferencia entre un analista de datos y un científico de datos?

Hemos separado a los profesionales de datos en cuatro categorías: Arquitecto, Ingeniero, Analista, Científico . Esto se desarrolló para ayudar a las empresas a contratar profesionales de datos en función de sus necesidades y para que los profesionales conozcan las habilidades que se demandan.

Aquí están nuestras tablas y un resumen. Puede encontrar la investigación de Elizabeth Mazenko aquí: https://www.betterbuys.com/bi/comparing-data-science-roles/

Arquitecto de datos: un arquitecto de datos es la persona a la que recurrir para la gestión de datos, especialmente cuando se trata de cualquier cantidad de fuentes de datos dispares. Con un amplio conocimiento de cómo funcionan las bases de datos, así como de cómo los datos adquiridos se relacionan con las operaciones del negocio, el Arquitecto de datos, idealmente, puede especular cómo los cambios afectarán el uso de datos de la compañía, y luego manipular la arquitectura de datos para compensarlos. .

  • Responsabilidades: almacenamiento de datos, ETL, desarrollo de arquitectura, modelado
  • Lenguajes: Hive, SQL, Pig, Spark, XML

Ingeniero de datos : este rol está estrechamente relacionado con el Arquitecto de datos. El ingeniero de datos también trabaja en el lado de la administración de datos, lo que hace que algunas personas piensen que los títulos son intercambiables. Sin embargo, un ingeniero de datos, que generalmente tiene una sólida formación en ingeniería de software, crea, prueba y mantiene la arquitectura de datos.

  • Responsabilidades: ETL, instalación de soluciones de almacenamiento de datos, modelado de datos, arquitectura y desarrollo de datos, pruebas de arquitectura de bases de datos
  • Lenguajes: R, Python, SAS, MatLab, SQL, NOSQL, Pig, Hadoop, Java, C / C ++, Ruby Perl

Analista de datos: el analista de datos trabaja para interpretar los datos para obtener información procesable para la empresa. Con una sólida formación en estadísticas y la capacidad de convertir datos de una forma cruda a un formato diferente (mezcla de datos), el analista de datos recopila, procesa y aplica algoritmos estadísticos a datos estructurados.

  • Responsabilidades: recopilación y procesamiento de datos, programación, aprendizaje automático, munging de datos, visualización de datos, aplicación de análisis estadístico
  • Lenguajes: R, Python, SQL, NOSQL, HTML, Java Script, C / C ++

Científico de datos: la misión de un científico de datos es similar a la de un analista de datos: encontrar ideas procesables que sean clave para el crecimiento y la toma de decisiones de una empresa. Sin embargo, se necesita un rol de Científico de datos cuando el volumen y la velocidad de los datos de una empresa exceden un cierto nivel que requiere habilidades más sólidas para clasificar a través de un mar de datos no estructurados (big data) para identificar preguntas y extraer información crítica. Luego, la persona limpia los datos para un análisis adecuado y crea nuevos algoritmos para ejecutar consultas que relacionan datos de fuentes dispares.

Además de estas habilidades, un Data Scientist también necesita habilidades sólidas de narración y visualización para compartir ideas con sus pares en toda la empresa.

  • Responsabilidades: limpieza y procesamiento de datos, modelado predictivo, aprendizaje automático, identificación de preguntas, consultas, aplicación de análisis estadístico, correlación de datos dispares, narración de historias y visualización
  • Lenguajes: R, Python, SAS, Hive, MatLab, SQL, Pig, Spark, Hadoop

Normalmente separamos los roles de datos en 3 posiciones distintas pero superpuestas; El analista de datos, científico de datos e ingeniero de datos.

El analista de datos generalmente realiza consultas con los nuevos datos para encontrar tendencias importantes para la organización y ayudar a preparar los datos para los científicos de datos. Los analistas de datos suelen ser muy buenos en SQL, además de conocer las métricas principales que una organización considera importantes. También pueden escribir guiones y producir imágenes intuitivas.

El Data Scientist se encarga principalmente de construir modelos utilizando el aprendizaje automático. Se espera que estos modelos engendren el software de una organización con características de producto que predicen y explican; haciendo aplicaciones adaptativas. La calidad de los modelos de un científico de datos depende directamente de qué tan bien entiendan y preparen los datos, por lo que trabajarán con el analista de datos cuando se trata de comprender y preparar los datos para construir mejores modelos.

El ingeniero de datos toma lo que se crea en el “laboratorio” y lo ayuda a ponerlo en producción. Trabajan con los científicos de datos para asegurarse de que la ingeniería que implementan maneja los modelos de aprendizaje automático correctamente (cuánto necesitan escalar los modelos, cómo se capacitan los modelos, cómo se mantienen los modelos frescos, etc.). En algunas empresas, los ingenieros de datos también trabajarán con los analistas de datos para garantizar que la ingestión y conversión de datos tenga en cuenta las métricas correctas, de las fuentes adecuadas, etc.

Los 3 roles ayudan a admitir la conversión de datos sin procesar a características implementadas dentro de los productos. Aquí hay una comparación general de algunas habilidades básicas, pero recuerde que cada individuo en un equipo variará en términos de sus fortalezas y enfoque.

La mayoría de la gente piensa que ambos son iguales, pero hay una pequeña diferencia entre Data Scientist y Data Analyst si lo ve de manera concentrada.

Así que veamos las diferencias clave entre el científico de datos y el analista de datos.

Científico de datos vs analista de datos según la definición

  • Un rol de Data Scientist es predecir el futuro basado en patrones pasados. Mientras que el analista de datos encuentra información significativa de los datos.
  • El papel del científico de datos es generar su propia pregunta. Pero el analista de datos encuentra las respuestas a otros grupos de preguntas.
  • Como los científicos de datos tienen lo que si. Pero los analistas de datos son los que hacen el análisis diario
  • El científico de datos aborda problemas comerciales. También ofrece una predicción precisa del valor del negocio una vez resuelto. Mientras que Data Analyst solo aborda problemas de negocios
  • El científico de datos utiliza el aprendizaje automático para extraer información. Pero Data Analyst utiliza una herramienta R / SAS para extraer información.
  • El papel del científico de datos es explorar y examinar la información. Explora información de muchas fuentes desconectadas. Pero Data Analyst explora y examina datos de una sola fuente.
  • La predicción de Data Scientist es muy alta. Puede ser exacto hasta el 90%. Pero, los analistas de datos no predicen. Solo resuelven la pregunta dada por el negocio.
  • A Los científicos de datos formularán preguntas. Formulan esas preguntas cuyas soluciones pueden beneficiar al negocio. Pero Data Analyst solo resuelve las preguntas dadas por las empresas.
  • Un científico de datos debe tener un sólido conocimiento en modelos estadísticos y aprendizaje automático. El analista de datos necesita un conocimiento sólido en SAS / R

Ahora mire la infografía de Data Scientist:

Ahora mire la infografía de Data Analyst:

Las responsabilidades de un científico de datos y un analista de datos también son diferentes.

Analista de datos vs Científico de datos según las responsabilidades

a) Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial. Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio.
  • Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

b) Responsabilidades del analista de datos

  • Identifique cualquier problema de calidad de datos en la adquisición de datos.
  • Resolviendo problemas de negocios. Al mapear y luego rastrear los datos.
  • Un analista de datos debe coordinarse con los ingenieros para recopilar nuevos datos.
  • Realizar análisis estadísticos de datos comerciales.
  • Documentar los tipos y la estructura de los datos comerciales.

Analista de datos versus roles de científico de datos basados ​​en conjuntos de habilidades

a) Roles de Data Scientist según sus habilidades

  • Las creatividades de datos
  • Desarrolladores de datos
  • Investigadores de datos
  • Los empresarios de datos

b) Roles de analista de datos según sus habilidades

  • Administradores de bases de datos
  • Operaciones
  • Los arquitectos de datos
  • A analistas de datos

4. Data Scientist vs Data Analyst – Salario

Las estadísticas a continuación muestran el salario de Data Scientist vs Data Analyst-

A continuación, veamos el porcentaje de solicitantes de empleo interesados ​​por Búsqueda de empleo | En efecto

Para saber más, consulte el siguiente enlace:

Diferencias entre Data Scientist y Data Analyst

He visto el término científico de datos aplicado a roles que pasaron de “tener una alta experiencia SQL” a “preparar informes Excel para ejecutivos”. Naturalmente, no estoy de acuerdo con ninguno de ellos, pero por otro lado no creo que haya una visión unificada de lo que es un científico de datos.

Desde mi punto de vista, si piensas en un espectro que va de la ingeniería a los negocios, los ingenieros de datos están en el lado de la ingeniería, los científicos de datos en el medio y los analistas de datos en el lado de los negocios. Su lenguaje y herramientas se superponen considerablemente, especialmente para el científico de datos.

Para ser honesto, un científico de datos es un analista de datos. La diferencia, según lo veo, son las herramientas y la salida. Para ilustrar mejor, usaré el ejemplo de Miniclip:

  • Un analista de datos o juegos de Miniclip es alguien que analiza nuestros juegos y los jugadores de nuestros juegos. Los analistas de juegos realizan análisis ad-hoc, realizan experimentos y están a cargo de las operaciones diarias de todos los análisis de juegos de sus juegos. Su salida viene en forma de paneles e informes. Su formación es matemática o científica. Sus herramientas son R y SQL y se involucran con big data a diario.
  • Un científico de datos de Miniclip es alguien que utiliza nuestros datos para crear productos que no serían posibles mediante herramientas estándar. Llamo a esos “productos de datos”. Son interactivos, lo que permite a los usuarios comerciales interactuar con los datos de una manera que normalmente no pueden, o automatizados, lo que a menudo significa modelos predictivos de aprendizaje automático. Las herramientas están mucho más orientadas a la ingeniería, Python y CLI son herramientas, pero R y SQL también están presentes.

Esto no significa necesariamente que los analistas de datos no creen productos de ciencia de datos. ¡Ellas hacen! Pero no es su responsabilidad principal. Lo mismo se aplica a nuestros ingenieros de datos. Nuestro ingeniero de datos principal es probablemente nuestro científico de datos más experto en el momento en que escribo esto. Del mismo modo, no significa que los científicos de datos no realicen análisis ad-hoc … de nuevo … ¡lo hacen! pero a menudo con el objetivo de apoyar el desarrollo de productos de ciencia de datos.

Científico de datos: la misión de un científico de datos es similar a la de un analista de datos: encontrar ideas procesables que sean clave para el crecimiento y la toma de decisiones de una empresa. Sin embargo, se necesita un rol de Científico de datos cuando el volumen y la velocidad de los datos de una empresa exceden un cierto nivel que requiere habilidades más sólidas para clasificar a través de un mar de datos no estructurados (big data) para identificar preguntas y extraer información crítica. Luego, la persona limpia los datos para un análisis adecuado y crea nuevos algoritmos para ejecutar consultas que relacionan datos de fuentes dispares.

Además de estas habilidades, un Data Scientist también necesita habilidades sólidas de narración y visualización para compartir ideas con sus pares en toda la empresa.

  • Responsabilidades: limpieza y procesamiento de datos, modelado predictivo, aprendizaje automático, identificación de preguntas, consultas, aplicación de análisis estadístico, correlación de datos dispares, narración de historias y visualización
  • Lenguajes: R, Python, SAS, Hive, MatLab, SQL, Pig, Spark, Hadoop

Analista de datos: el analista de datos trabaja para interpretar los datos para obtener información procesable para la empresa. Con una sólida formación en estadísticas y la capacidad de convertir datos de una forma cruda a un formato diferente (mezcla de datos), el analista de datos recopila, procesa y aplica algoritmos estadísticos a datos estructurados.

  • Responsabilidades: recopilación y procesamiento de datos, programación, aprendizaje automático, munging de datos, visualización de datos, aplicación de análisis estadístico
  • Lenguajes: R, Python, SQL, NOSQL, HTML, Java Script, C / C ++

Analista de datos versus científico de datos: comparación

  • Las habilidades de analista de datos y científico de datos se superponen, pero hay una diferencia significativa entre los dos. Tanto los roles de trabajo requieren algunos conocimientos básicos de matemáticas, comprensión de algoritmos, buenas habilidades de comunicación y conocimiento de ingeniería de software.
  • Los analistas de datos son maestros en SQL y usan expresiones regulares para cortar y cortar los datos. Con cierto nivel de curiosidad científica, los analistas de datos pueden contar una historia a partir de los datos.
  • Un científico de datos, por otro lado, posee todas las habilidades de un analista de datos con una base sólida en modelado, análisis, matemáticas, estadística e informática.
  • Lo que diferencia a un científico de datos de un analista de datos es la gran perspicacia junto con la capacidad de comunicar los hallazgos en forma de historia tanto a los líderes de TI como a las partes interesadas del negocio de tal manera que pueda influir en la forma en que una empresa se acerca desafío de negocio.

Con base en las tendencias recientes, se pueden ver las tecnologías más demandadas por estas empresas.

Existe una superposición significativa entre un analista de datos y un científico de datos, pero esto es lo que veo como las principales responsabilidades de cada uno:
Científico de datos : principalmente buscando estimar lo desconocido, por ejemplo

  • Construyendo modelos estadísticos que toman decisiones basadas en datos. Cada decisión puede ser difícil, p. Ej., Bloquear el procesamiento de una página, o blanda, p. Ej. Asignar un puntaje por la malicia de una página, que es utilizada por sistemas anteriores o humanos.
  • Realización de experimentos de causalidad que intentan atribuir la causa raíz de un fenómeno observado. Esto se puede hacer diseñando experimentos A / B o si el experimento A / B no es posible, aplique un enfoque epidemiológico al problema, por ejemplo, el modelo causal @Rubin
  • Identificar nuevos productos o características que provienen de desbloquear el valor de los datos; ser un líder de pensamiento sobre el valor de los datos. Un buen ejemplo de eso es la función de recomendaciones de productos que Amazon primero puso a disposición de una audiencia masiva.

Analista de datos : principalmente mirando los datos conocidos, es decir, históricos, desde nuevas perspectivas, por ejemplo

  • Redacción de consultas personalizadas para responder preguntas comerciales complejas.
  • Concebir e implementar nuevas métricas para capturar partes del negocio / producto previamente mal entendidas.
  • Abordar problemas de calidad de datos, como lagunas o sesgos en la adquisición de datos.
  • Trabajando con el resto de la ingeniería para instrumentar la adquisición incremental de nuevos datos.

Por supuesto, hay una superposición significativa entre los dos roles. Un científico de datos siempre necesita escribir consultas personalizadas y un analista de datos puede necesitar construir un módulo de toma de decisiones, ya sea mediante reglas simples o aplicando principios de aprendizaje automático.

En general, un analista de datos tiende a estar en un nivel inferior en comparación con un científico de datos.

1] Naturaleza y complejidad del trabajo.
Por lo general, el trabajo de un analista de datos es realizar análisis específicos sobre los datos para responder una pregunta bien definida y luego producir informes o gráficos según lo soliciten otras personas en una organización. Estas otras personas, dependiendo de la estructura de la organización, pueden ser científicos de datos, gerentes de producto o ejecutivos.

Por otro lado, un científico de datos típico trabaja con una contraparte comercial para enmarcar un problema comercial como un problema de datos. Por ejemplo, un científico de datos podría trabajar con el equipo de ventas en un problema comercial como “Mejoremos la efectividad de nuestros vendedores” y enmarquemoslo como “¿Cómo podemos identificar prospectos con alta probabilidad de conversión en función de su comportamiento anterior?” Luego, el científico de datos puede pedirle a un analista que extraiga datos de ciertas tablas, las limpie y realice análisis específicos sobre ellas. También se le puede pedir al analista que produzca informes basados ​​en los resultados del análisis. El científico de datos luego vuelve al equipo de ventas con los resultados y las recomendaciones específicas. Si no hay analistas disponibles, el científico de datos puede tener que sumergirse y hacer todo el trabajo por sí mismo.

2] Herramientas
Por lo general, los científicos de datos usan al menos un lenguaje de programación completo como Python o R. Los analistas también pueden usarlos ocasionalmente, pero generalmente están más familiarizados con herramientas como Excel, SQL y Tableau. Los científicos de datos deben estar familiarizados y tener fluidez con todo el proceso de ciencia de datos (insertar enlace), pero los analistas generalmente no realizan el análisis en profundidad, especialmente si se trata de aprendizaje automático o modelado predictivo.

Sin embargo, tenga en cuenta que algunas empresas usan el título “Analista de datos” simplemente para referirse a los científicos de datos en un nivel de entrada. En estas empresas, se puede esperar que un analista de datos desempeñe todas las responsabilidades de un científico de datos en un nivel junior.

Para obtener más información sobre las diferentes carreras profesionales en el campo de la ciencia de datos, consulte esta publicación de blog.

También hemos preparado publicaciones especiales de blog sobre una descripción típica del trabajo de analista de datos versus científico de datos:

Analista de datos Descripción del trabajo

Descripción del puesto de científico de datos


Raj Bandyopadhyay es el Director de Educación de Ciencia de Datos en Springboard . Es responsable de crear y mantener el plan de estudios de ciencias de datos de Springboard y también proporciona apoyo profesional específico para ciencias de datos para los estudiantes. Antes de esto, trabajó como científico de datos durante varios años, principalmente en el sector de ciberseguridad. Tiene una maestría / doctorado en informática de la Universidad de Rice y una licenciatura en informática de IIT Bombay.

Tanto los científicos de datos como los analistas de datos juegan un papel crucial en la ciencia de datos. Puedo enumerar algunas de las diferencias que conozco podrían ayudarlo a comprender mejor entre los científicos de datos y los analistas de datos.

Científicos de datos:

  • Los científicos de datos deben estar familiarizados con los sistemas de bases de datos. Ejemplo: Hive, MySQL, etc.
  • Es mejor también estar familiarizado con los desarrollos laborales de Java, Python, MapReduce.
  • Debe tener una comprensión clara de varias funciones analíticas: mediana, rango, etc. y cómo usarlas en conjuntos de datos.
  • Perfección en matemáticas, estadísticas, correlación, minería de datos y análisis predictivo para ayudar a hacer mejores predicciones para las decisiones comerciales.
  • Saber R es como tener una pluma en la gorra de Data Scientist
  • Conocimientos estadísticos profundos y aprendizaje automático: Mahout, Bayesian, Clustering, etc.

Analistas de datos:

  • Los analistas de datos deben estar familiarizados con el almacenamiento de datos y los conceptos de inteligencia empresarial.
  • Exposición en profundidad de SQL y análisis.
  • Fuerte comprensión de los análisis basados ​​en Hadoop (trabajos de HBase, Hive, MapReduce, Impada, Casscading, etc.)
  • Almacenamiento de datos y recuperación de habilidades y herramientas.
  • Perfecto con las herramientas y componentes de la arquitectura de datos.
  • Familiarizado con varias herramientas ETL, para transformar diferentes fuentes de datos en fuentes de datos analíticos.

En GreyAtom ponemos énfasis en el aprendizaje inmersivo que en realidad significaría:

  • Replicando posibles escenarios de trabajo
  • Aprendizaje interactivo
  • Enseñar habilidades o técnicas particulares
  • aprender = hacer trabajo real
  • Aprendizaje práctico
  • Trabajando en equipo, aprendiendo del instructor
  • Menos basado en el aula
  • Más proyecto / estudio de caso basado
  • Manejo de problemas reales, datos reales, escenarios reales, flujo de trabajo real
  • Herramientas que reflejan la industria, herramientas y estructuras alineadas a la industria.
  • Imitando una situación o escenario que enfrentan la industria / empresas
  • O llevar a cabo proyectos basados ​​en escenarios reales de trabajo.
  • Juego de roles y realización de una tarea como se hace en el lugar de trabajo.
  • Capacitación para la industria antes de ser contratado.
  • Buscando alternativas para la gestión tradicional de proyectos / escenarios / problemas
  • Fases cortas de trabajo, reevaluación frecuente, adaptación de planes.
  • Scrum sprints: evaluación colaborativa, agradable y rápida, entrega de productos en ciclos cortos, retroalimentación rápida, mejora continua,
  • Scrum sprints: creación de lugares de trabajo alegres y sostenibles
  • Los sprints ágiles mejoran la comunicación, el trabajo en equipo y la velocidad.

Full Stack Data Science Engineer es uno de los trabajos más solicitados en este momento. GreyAtom se enfoca en crear ingenieros de ciencia de datos de Full Stack y le brinda todas las herramientas, técnicas y conceptos básicos necesarios para lograr un impacto. En solo 14 semanas, aplicará la resolución de problemas y el pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si eres un apasionado de la ciencia de datos y quieres redefinir tu carrera, visítanos en el programa in situ de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos que “Aprender = hacer trabajo real”

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Las definiciones son geniales, pero lo que sucede en la industria puede diferir ligeramente; Lo que sucede a menudo es que los puestos de trabajo de la industria de datos y sus descripciones a menudo tienen títulos que suenan muy elegantes, pero que no se parecen a los roles que tiene la industria de la ciencia de datos. Del mismo modo, ponen un título con la descripción del trabajo que realmente no coincide con el conjunto de habilidades que uno esperaría ver al buscar un trabajo como ‘científico de datos’ o ‘analista de datos’.

Cuando va y mira esos roles, las descripciones de trabajo básicamente dicen lo siguiente sobre los científicos de datos:

Cuando se trata de analistas de datos, las descripciones de trabajo señalan lo siguiente:

En general, diría que los dos son muy similares y esa es también una razón por la cual algunas descripciones de trabajo los mezclan cuando buscan a una persona para ocupar un puesto en su empresa.

Y, de hecho, hay cierta superposición, pero tampoco del todo. La base de conocimiento desde la cual comenzar (matemáticas, estadísticas, aprendizaje automático), por ejemplo, es muy similar, pero principalmente ve diferencias en la forma en que los dos roles hacen uso de este conocimiento para hacer su trabajo diario: mientras que el científico de datos lo utilizará para modelar datos y hacer uso de la computación distribuida, el analista de datos utilizará principalmente el conocimiento para realizar análisis significativos en herramientas de hoja de cálculo, consultar bases de datos y visualizar los resultados con herramientas como Tableau.

El científico de datos puede y, por supuesto, también conocerá y hará uso de todas estas herramientas, pero realmente estará más ocupado con la discusión de los datos hasta un punto en el que pueda extraer información aún más significativa y predecir resultados. Verá que esto es similar, pero también más avanzado que lo que hace un analista de datos.

Si desea ver toda la infografía, asegúrese de visitar The Data Science Industry: Who Does What (Infographic).

Primero discutiremos qué es Data Scientist y Data Analytic. Luego discutiremos sus diferencias.

¿Qué es la ciencia de datos?

Data Science es un campo que abarca los relacionados con la limpieza, preparación y análisis de datos. La ciencia de datos es un término general en el que se aplican muchos métodos científicos. Por ejemplo, las matemáticas, las estadísticas y muchas otras herramientas que los científicos aplican a los conjuntos de datos. El científico aplica las herramientas para extraer conocimiento de los datos.

Es una herramienta para abordar Big Data . Y luego extraer información de él. First Data Scientist reúne conjuntos de datos de múltiples disciplinas y los compila. Después de eso, aplique aprendizaje automático , análisis predictivo y sentimental. Luego afílelo hasta un punto donde pueda derivar algo. Finalmente, extrae la información útil de la misma.

El científico de datos entiende los datos desde un punto de vista comercial. Su trabajo es dar la predicción más precisa. Se encarga de dar sus predicciones. La predicción del científico de datos es muy precisa. Impide que un empresario pierda en el futuro.

¿Qué es el análisis de datos?

La mayoría de la gente piensa que la ciencia de datos y el análisis de datos son similares. Pero hay una pequeña diferencia entre ellos. Obtendrá la diferencia si ve de forma concentrada. El análisis de datos es el nivel básico de la ciencia de datos. En los cálculos de análisis de datos realizados mediante SAS / R. En su mayoría tienen un título en negocios y ciencias de la computación.

Sus metodologías se utilizan principalmente en industrias comerciales. Para obtener decisiones empresariales más informadas por parte de investigadores y científicos. Verificar o rechazar los modelos científicos, hipótesis y teorías.

Es la ciencia de extraer ideas de fuentes de información en bruto. Revela las tendencias y las métricas. De lo contrario, los datos pueden perder en la masa de información. Utilizan la información para aumentar la eficiencia de un sistema empresarial.

Para verificar y refutar las teorías o modelos existentes, se utiliza Data Analytics. También se usa en muchas industrias para permitir que las organizaciones tomen mejores decisiones.

Analista de datos vs Científico de datos según las responsabilidades

a) Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial. Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio.
  • Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

b) Responsabilidades del analista de datos

  • Identifique cualquier problema de calidad de datos en la adquisición de datos.
  • Resolviendo problemas de negocios. Al mapear y luego rastrear los datos.
  • Un analista de datos debe coordinarse con los ingenieros para recopilar nuevos datos.
  • Realizar análisis estadísticos de datos comerciales.
  • Documentar los tipos y la estructura de los datos comerciales.

Analista de datos versus roles de científico de datos basados ​​en conjuntos de habilidades

a) Roles de Data Scientist según sus habilidades

  • Las creatividades de datos
  • Desarrolladores de datos
  • Investigadores de datos
  • Los empresarios de datos

b) Roles de analista de datos según sus habilidades

  • Administradores de bases de datos
  • Operaciones
  • Los arquitectos de datos
  • Un analista de datos

Para conocer más diferencias entre el análisis de datos y la ciencia de datos, siga el enlace mencionado a continuación:

Data Science VS Data Analytic

Un analista de datos trabaja nuestras relaciones y conocimientos significativos a partir de los datos sin procesar. Recopilan y procesan datos mediante el uso de conceptos y algoritmos estadísticos para datos estructurados y no estructurados. Por lo general, resuelven los problemas comerciales existentes con el análisis de datos y muchas veces, descubren patrones y tendencias nuevos y latentes para resolver problemas comerciales más grandes.

Responsabilidades:

Recopilación y procesamiento de datos, análisis de datos mediante algoritmos estadísticos y programación. Usan lenguajes como SQL, NoSQL, JS, HTML, Python, R y C / C ++

Un científico de datos analiza los datos y presenta algoritmos y modelos matemáticos relevantes. Estos algoritmos y modelos se utilizan para crear herramientas y productos comerciales necesarios para resolver los problemas. La diferencia clave aquí es que se necesita un científico de datos cuando los volúmenes de datos recopilados por la empresa son tan grandes que la experiencia en el análisis de datos de rutina no tiene sentido a partir de los datos no estructurados.

Los científicos de datos son excelentes para contar historias y tienen una gran experiencia en visualización para compartir sus hallazgos y trabajar con sus pares y la administración.

Responsabilidades:

Recopilación de datos, limpieza y procesamiento, aplicación de conceptos y herramientas de aprendizaje automático a los datos, visualización, ejecución de consultas en bases de datos y aplicación de análisis estadístico a los datos. Usan lenguajes como MatLab, Hadoop, Hive, Spark, Pig, Python y R, etc.

Un científico de datos y un analista de datos están muy relacionados en algunos casos. Un trabajo de Data Scientist es comprender los datos desde el punto de vista comercial y dónde, a medida que el analista de datos trabaja en la recopilación de datos y obtener información estadística de ellos, los analistas de datos son responsables de la presentación de los datos en forma de gráficos.

El rol de Data Scientist está familiarizado con los sistemas de bases de datos y mientras que el analista de datos está familiarizado con el almacenamiento de datos. Data Analyst necesita una sólida comprensión de Hadoop y Data Scientist debe comprender las funciones analíticas.

En Data Science, R desempeña un papel clave, mientras que Data Analyst utiliza herramientas ETL. Al comparar los salarios de ambos, el científico de datos y el analista de datos, un científico de datos puede obtener más salario que el doble de salario del analista de datos.

Si hablamos de la definición exacta de estos, entonces un científico de datos es una persona que es buena en estadística y un analista de datos es una persona que vive en California. Si hablamos sobre el trabajo exacto de ambos, se espera que un científico de datos formule las preguntas que ayuda al negocio y también procede a resolverlos, mientras que un equipo de negocios le hace preguntas a un analista de datos y busca una solución con esa guía.

Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

Data Science es un campo nuevo y en rápida evolución, por lo que no siempre hay un acuerdo generalizado sobre los títulos y lo que cada uno implica.

Trabajo para Dataquest, donde enseñamos datos en un entorno basado en un navegador interactivo. Tenemos dos caminos principales de aprendizaje: Data Scientist y Data Analyst basados ​​en los dos resultados de trabajo, ¡así que me hacen esta pregunta mucho!

Comencemos ampliando ligeramente el alcance para hablar sobre Data Science en sí.

Definición # 1: Generalista de ciencia de datos

Para mí, la ciencia de datos es un término amplio que abarca muchas cosas y muchos roles, y dentro de eso hay especialidades: análisis analítico, aprendizaje automático, visualización de datos y más.

Un buen paralelismo es la medicina: es un término general que abarca muchas especialidades: cardiología, ortopedia, pediatría y más.

Algunas personas usarán el término científico de datos y lo considerarán como un término general que describe todas estas especialidades, o podrían estar pensando en un generalista de ciencia de datos, que puede hacer un poco de todo pero nada con demasiados detalles. como un médico general (también conocido como médico de atención primaria en los EE. UU.).

Definición # 2: Científicos de datos y especialistas en análisis de datos

Además de este uso generalista, a medida que el campo de datos continúa evolucionando y madurando, los especialistas se están volviendo mucho más comunes, y parece haber una convergencia en torno a dos títulos clave que describen dos cosas diferentes: analistas de datos y científicos de datos .

La diferencia clave que parece separar a los científicos de datos de los analistas de datos en el uso común es el aprendizaje automático.

En general, los especialistas en ciencias de la información tienden a profundizar en hacer predicciones y ejecutar algoritmos de aprendizaje automático. Los especialistas en análisis de datos tienden a estar más orientados a encontrar información sobre datos y descubrir valor.

Esperaría que alguien en un rol de analista especialista esté limpiando, analizando, visualizando y respondiendo preguntas utilizando datos.

En un rol de especialista en ciencia de datos, habría algo de lo anterior, pero también algo de trabajo en la construcción de modelos de aprendizaje automático que hagan predicciones.

Comparación salarial

Para responder a la segunda parte de su pregunta sobre los salarios, puede esperar que, en general, a un Data Scientist se le pague mucho más que a un analista de datos. Mirando alguna información de Glassdoor, obtienes los siguientes rangos de salario para los Estados Unidos:

Científico de datos

Analista de datos


Si te gustó esta respuesta, considera votarla y seguirme.

Trabajo para Dataquest, la mejor plataforma en línea para aprender a ser un Científico de Datos o un Analista de Datos. Si eso le interesa, puede inscribirse y completar nuestro primer curso gratis en Dataquest.io

Hola, no dejes que los términos de la industria de Analytics te confundan. Solo hay tres tipos de análisis: descriptivo, predictivo y prescriptivo. Si usted es un analista de datos o científico, esto es todo lo que hace.

Incluso puedes unirte a un seminario web gratuito el sábado 16 o 23 para aprender estadísticas en vivo.

La única diferencia es que (en general) los analistas de datos trabajan en las partes más simples como la base de la imagen (línea azul) mientras que el científico de datos trabaja en análisis más complejos: línea roja. Como puede ver, también hay una superposición clara. Entonces, aunque muchos se unen como analistas de datos, aumentan su habilidad y después de 4 a 5 años pueden asumir el papel de Científico de Datos (si son agudos). No todo el mundo necesita hacer eso por cierto. Muchos pasan sus vidas en análisis de datos (y ganan mucho dinero al hacerlo)

Descriptivo – Consultar datos, borrar datos, modelar datos, crear informes, crear alertas / automatización para todas las actividades enumeradas aquí. Los ejemplos incluyen informes de tendencias de ventas o informes para medir el éxito de una campaña de marketing, o incluso los SMS que recibe cuando compra algo en su tarjeta de crédito.

Predictivo : predice por qué las cosas suceden como están en un negocio, por ejemplo, por qué las ganancias fueron repentinamente bajas en septiembre. Brinde a los líderes empresariales información sobre esto y proporcione modelos para predecir sucesos positivos y negativos en el futuro. Exactamente qué tan alta será la demanda de AC en junio es otro ejemplo.

Prescriptivo: prescriba o brinde una previsión empresarial sobre cómo proceder en el futuro para los escenarios predichos por el modelo predictivo. Por ejemplo, otorgue descuentos cada noviembre ya que las ventas son bajas porque todos esperan descuentos de fin de año. Recomiende que los compradores de teclados inalámbricos también vean el mouse inalámbrico, o aquellos que compraron un boleto para Goa o Miami también consideren un descuento para los deportes acuáticos de aventura en Goa o Miami.

Primero, veamos las diferencias entre el científico de datos de dos roles y el analista de datos.

  1. Normalmente, se espera que un científico de datos formule las preguntas que ayudarán a las empresas y luego las resuelva, mientras que un equipo de negocios responde a un analista de datos y las resuelve.
  2. Se espera que ambos roles escriban consultas, trabajen con equipos de ingeniería para obtener los datos correctos, mezclar datos (obtener los datos en el formato correcto, conveniente para el análisis / interpretación) y derivar información de los datos. Sin embargo, en la mayoría de los casos, no se espera que un analista de datos cree modelos estadísticos o sea práctico en aprendizaje automático y programación avanzada. En cambio, un analista de datos generalmente trabaja en SQL estructurado más simple o bases de datos similares o con otras herramientas / paquetes de BI.
  3. El papel del científico de datos también requiere fuertes habilidades de visualización de datos y la capacidad de convertir datos en una historia de negocios. Un analista de datos normalmente no lo es.

Diagrama de Venn del científico de datos

Diagrama de Venn de analista de datos

En resumen, podemos analizar la diferencia entre estos diferentes roles a través de esto.

Recursos: -Cursos de formación de certificación en línea para profesionales | Simplilearn

Consultoría informática, digital, tecnológica y de gestión

Comunidad de análisis | Discusiones analíticas | Discusión de Big Data

Espero que esto ayude … !!! 🙂

Ref: científicos de datos vs analistas de datos: por qué es importante la distinción – Import.io

Científico de datos :

representa una evolución desde el rol de analista de datos o negocios. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas , análisis y matemáticas . Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

ref Trayendo big data a la empresa

Analista de datos:

Los analistas de datos generalmente están bien versados ​​en Sequel, conocen algunas expresiones regulares, pueden dividir y cortar datos, pueden usar paquetes de análisis o BI, como Tableau o Pentaho o una solución de análisis interna, y pueden contar una historia del datos. También deberían tener cierto nivel de curiosidad científica.

Sugiero comenzar con estas cosas:

  1. Comience a aprender SQL “Tutorial SQL”, R “Programación R – Universidad Johns Hopkins | Coursera ”(comience con SQL y use Oracle / Mysql como DB)
  2. Comience a aprender estadísticas
  3. Comience a aprender Big Data (Hadoop, Hive, Pig, …)

Algunos buenos cursos:

Ciencia de datos | Coursera

Algoritmos: Diseño y Análisis, Parte 1 – Universidad de Stanford | Coursera

Por el salario del científico de datos: una mirada interna a los salarios de Big Data

Buena suerte 🙂

Los científicos de datos son sus barras de error.

Para alguien sin experiencia en estadísticas, el resultado de analistas y científicos de datos se ve igual. Cada uno tiene un valor “más alto” y “más bajo”, cada uno hará declaraciones sobre lo que esperan que suceda a continuación, y ambos tienen alguna capacidad de acceder directamente a los datos a través de SQL o habilidades similares. Sin embargo, el analista rara vez tendrá más de un curso de pregrado en estadística, por lo que no puede saber qué tan confiables son sus datos o cómo probar la precisión de sus predicciones a lo largo del tiempo.

Hay una tendencia a variar en el uso de herramientas, pero esta línea es menos absoluta. Los científicos de datos tienen más probabilidades de utilizar R y Python. Es más probable que los analistas usen Excel. Los científicos de datos tienen más probabilidades de usar R-Shiny. Es más probable que los analistas usen Periscope o Looker (ninguno de los cuales tiene la capacidad de trazar simplemente barras de error o pronósticos). Los científicos de datos tienen más probabilidades de tener una maestría o un doctorado en estadística, matemáticas o similar, donde los analistas tienden a tener una licenciatura en ciencias de la computación.

Muchas empresas no pueden notar la diferencia, por eso creo que las contrataciones varían tanto. Es imposible para (la mayoría) de los MBA tener tiempo para entender por qué mis números deberían ser la base de las recomendaciones. Parte de mi trabajo es hacerlo transparente, pero dejar esto claro sin sonar como un imbécil para los analistas puede ser difícil. Creo que cuanto más pequeño es el negocio, más confusos son estos roles hasta que la empresa madura. Las compañías más grandes parecen tener más de un modelo de analistas que apoyan a los científicos de datos, en lugar de ser reporteros independientes. Esta es probablemente la razón por la cual muchas personas responden que “no pueden notar la diferencia”.

Analista de datos versus científico de datos: diferencias

  • El papel del trabajo de un científico de datos con una gran perspicacia comercial y habilidades de visualización de datos para convertir la información en una historia comercial, mientras que no se espera que un analista de datos posea perspicacia comercial y habilidades avanzadas de visualización de datos.
  • El científico de datos explora y examina los datos de múltiples fuentes desconectadas, mientras que un analista de datos generalmente analiza los datos de una sola fuente como el sistema CRM.
  • Un analista de datos resolverá las preguntas dadas por la empresa, mientras que un científico de datos formulará preguntas cuyas soluciones puedan beneficiar a la empresa.
  • En muchos escenarios, no se espera que los analistas de datos tengan experiencia práctica en el aprendizaje automático o construyan modelos estadísticos, pero la responsabilidad principal de un científico de datos es construir modelos estadísticos y estar bien versado en el aprendizaje automático.

Analista de datos versus científico de datos: comparación

  • Las habilidades de analista de datos y científico de datos se superponen, pero hay una diferencia significativa entre los dos. Tanto los roles de trabajo requieren algunos conocimientos básicos de matemáticas, comprensión de algoritmos, buenas habilidades de comunicación y conocimiento de ingeniería de software.
  • Los analistas de datos son maestros en SQL y usan expresiones regulares para cortar y cortar los datos. Con cierto nivel de curiosidad científica, los analistas de datos pueden contar una historia a partir de los datos.
  • Un científico de datos, por otro lado, posee todas las habilidades de un analista de datos con una base sólida en modelado, análisis, matemáticas, estadística e informática.
  • Lo que diferencia a un científico de datos de un analista de datos es la gran perspicacia junto con la capacidad de comunicar los hallazgos en forma de historia tanto a los líderes de TI como a las partes interesadas del negocio de tal manera que pueda influir en la forma en que una empresa se acerca desafío de negocio.

Tutoriales útiles de Big Data para estudiantes de primer año y profesionales

Hola:

Aquí están mis 2 centavos … Algunas compañías no diferencian entre un científico de datos y un profesional de análisis y usan estos términos indistintamente para definir a los miembros de su equipo. Por otro lado, un número significativo de empresas tienen esta diferenciación. En general, aquí están los factores que, en mi opinión, pueden separar los dos

Sin embargo, para tener éxito, ya sea como científico de datos o profesional de Business Analytics, las siguientes son las habilidades necesarias:

  • Amor por los números y las cosas cuantitativas.
  • Grit para seguir aprendiendo
  • Amor por la codificación y la programación.
  • Enfoque de pensamiento estructurado
  • Pasión por resolver problemas
  • Buen conocimiento de conceptos estadísticos.

Aquí están mis 10 punteros principales para garantizar un éxito duradero en cualquier campo.

  • Aprende tanto como sea posible. Pase de 4 a 5 horas cada semana en el aprendizaje y el desarrollo y conozca lo último en la industria
  • Desafío del status quo. Nunca suponga que lo que se está haciendo está siguiendo el enfoque más efectivo
  • Cree que eres igual a todos los demás en la jerarquía. No tengas miedo de decir lo que piensas
  • Concéntrese en la innovación y salga con la tierra rompiendo ideas en lugar de hacer el negocio como de costumbre.
  • Concéntrese en desarrollar excelentes habilidades de comunicación y habilidades blandas, ya que esta es una de las mayores brechas que he visto en los profesionales de análisis
  • No te conviertas en un pony de un solo truco. trate de obtener exposición en diferentes industrias y diferentes áreas funcionales.
  • Participe en competiciones y eventos como Kaggle, para saber cuál es su posición frente a su grupo de compañeros.
  • Intente escribir libros blancos y blogs sobre su experiencia en el tema.
  • Desarrollar experiencia en el dominio ya que sin ese análisis no es efectivo.
  • Finalmente, mantenga siempre una visibilidad clara de su fortaleza y oportunidades y de cualquier punto ciego. Busque activamente comentarios de su grupo de pares y sus superiores.

Espero que esto ayude.

¡Salud!

Gracias por sus votos a favor de antemano. Me mantienen en marcha! ¡Gracias!

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

CIENTÍFICO DE DATOS

Un científico de datos posee una combinación de análisis, aprendizaje automático, análisis de datos y habilidades estadísticas, así como experiencia con algoritmos y codificación.

MINERÍA DE DATOS

Data Mining está buscando grandes cantidades de datos para descubrir patrones y analizar los datos para obtener información / información mediante el algoritmo.

APRENDIZAJE AUTOMÁTICO

El subconjunto de IA que incluye técnicas estadísticas abstrusas que permiten a las máquinas mejorar en tareas con experiencia. La categoría incluye aprendizaje profundo.

APRENDIZAJE PROFUNDO

El subconjunto de aprendizaje automático compuesto por algoritmos que permiten que el software se capacite a sí mismo para realizar tareas, como el reconocimiento de voz y de imagen, al exponer redes neuronales de varias capas a grandes cantidades de datos.

More Interesting

Empleos y carreras en ciencia de datos: ¿Sería beneficioso ser un científico de datos con antecedentes médicos (para aquellos que ya tienen MD), o sería innecesario?

¿Seguir el camino proporcionado por Coursera es bueno para mí para convertirme en científico de datos?

¿Cómo debo prepararme para programar preguntas en una entrevista de ciencia de datos?

¿Qué hace a un exitoso científico / analista de datos?

¿Es la especialización de la ciencia de datos o big data suficiente para unirse al mercado como científico de datos?

¿Qué característica es más importante para un científico de datos: habilidades de codificación o habilidades de comunicación?

¿Qué programa de posgrado debería elegir para ser un buen científico de datos, sin embargo, mi promedio de calificaciones es inferior a 3.0?

¿Qué desean los matemáticos que los científicos de datos supieran?

¿Qué cualidades separan a los grandes científicos de datos de los buenos científicos de datos?

¿Dónde puedo prepararme para diferentes temas como estructura de datos, algoritmos, SO, DBMS, etc. para el tema GATE en el formato MCQ?

¿Debería ser un ingeniero de datos o un científico de datos?

¿El trabajo de minería de datos requiere habilidades de programación intensivas?

¿Cómo debo cambiar mi carrera de desarrollador de iOS a científico de datos?

Como científico de datos o consultor de análisis, ¿cómo explica su trabajo a los padres mayores que nunca habían usado computadoras?

¿Un científico de datos necesita saber física? ¿Ayuda de alguna manera?