¿Hay trabajos separados disponibles para analistas de datos o una empresa contrata científicos de datos para el mismo rol?

Un analista de datos es alguien que trabaja en un problema comercial específico que el cliente / empleador ha solicitado. El problema podría estar relacionado con la rotación de clientes o la predicción de los precios de la vivienda. Las tareas que realizan están directamente relacionadas con las necesidades comerciales tangibles.

Mirando algunas habilidades requeridas de un analista de datos en el mundo de hoy:

SQL

Los analistas trabajan principalmente con datos estructurados, por lo que a menudo usan SQL en sus roles de trabajo. Escriben consultas SQL para recuperar un subconjunto de datos de una base de datos.

Estas consultas a menudo se entregan al analista de datos en forma de preguntas y es tarea del analista encontrar la consulta adecuada para recuperar la respuesta a la pregunta planteada.

Los analistas de datos generalmente tienen la capacidad de ejecutar una lógica sofisticada, que incluye calcular estadísticas resumidas sobre subpoblaciones, ordenar, unir varias tablas con datos relacionados y más.

Sobresalir:

Los analistas de datos son excelentes asistentes. Utilizan pivotes en Excel para resumir los datos de manera flexible, lo que permite una exploración rápida de los datos y produce información valiosa a partir de los datos acumulados. También están bien versados ​​en fórmulas de Excel y saben cómo y cuándo usarlos para hacer cálculos rápidos.

Herramientas de inteligencia empresarial:

Los datos tienden a extenderse, atrapados en varios silos. La última ola de herramientas de BI está tratando de eliminar las barreras entre esos silos para que se forme una imagen holística basada en múltiples fuentes de datos. Esto proporciona pronósticos mucho más precisos. Las herramientas de BI facilitan que un analista de datos identifique tendencias y patrones clave en los datos y comunique los resultados mediante informes a los tomadores de decisiones.

Algunos ejemplos de las herramientas más famosas y utilizadas en toda la industria son Tableau y Microsoft Power BI, que lo ayudan a crear paneles y visualizar los datos que se les presentan, en un formato comercial más fácil de entender para el usuario final.

Científico de datos

Los científicos de datos son los asistentes que a menudo se espera que generen sus propias preguntas a partir de datos sin procesar.

Un científico de datos tiene un conocimiento excepcionalmente bueno en estadística, aprendizaje automático y codificación, y también una mejor comprensión de disciplinas como tecnologías de bases de datos, narración de historias, experiencia en dominios y métricas de productos o negocios.

Tecnologías de bases de datos

Los científicos de datos entienden cómo instalar y usar SQL, NOSQL, Apache Hadoop y Spark. Entienden el ecosistema completo de big data y también saben cómo se procesan los datos en la tubería de datos.

Tienden a comprender estas tecnologías a nivel estratégico / de alto nivel en lugar de ser expertos en estas tecnologías, como un arquitecto de big data o un ingeniero de datos.

Codificación

La experiencia de codificación se refiere a la necesidad de programación para implementar y ejecutar modelos estadísticos.

Los científicos de datos están bien versados ​​en R, Pythaon o SAS, los tres lenguajes de ciencia de datos más populares.

En una gran parte de las grandes empresas, la limpieza y el proceso de los datos los realiza un equipo separado que ahorra una gran cantidad de tiempo a los científicos de datos. Mientras que, en las startups, se espera que los científicos de datos limpien y procesen los datos que se les proporcionan para su análisis.

Estadísticas y aprendizaje automático

Las estadísticas y el aprendizaje automático son algunas de las competencias centrales de cualquier científico de datos. Un científico de datos sabe cómo construir un modelo estadístico o un algoritmo de aprendizaje automático desde cero.

También saben cómo implementar estos algoritmos en python o R o cualquier otro lenguaje de programación de ciencia de datos.

A pesar de la gran cantidad de algoritmos de minería de datos específicos desarrollados a lo largo de los años, solo hay un puñado de tipos de tareas fundamentalmente diferentes que estos algoritmos abordan. Tales como regresión, clasificación, agrupamiento, modelado casual, etc.

En muchos proyectos de ciencia de datos, es posible que desee encontrar “correlaciones” entre una variable particular que describe una variable individual y otras variables. Por ejemplo, en los datos históricos puede saber qué clientes abandonaron la empresa después de que expiraran sus contratos. Es posible que desee averiguar qué otras variables se correlacionan con la salida de un cliente en un futuro próximo. Encontrar tales correlaciones son los ejemplos más básicos de tareas de clasificación y regresión.

SQL

Un buen científico de datos conoce los conceptos básicos de los conceptos de bases de datos relacionales y, con frecuencia, recupera datos de las bases de datos escribiendo consultas SQL. La mayoría de los científicos de datos dedican la mayor parte de su tiempo a escribir SQL y scripts relacionados. Los científicos de datos usan SQL para transformar datos complejos en tablas para implementar algoritmos en estos conjuntos de datos.

Experiencia en el campo

Los científicos de datos tienen antecedentes profundos o capacitación rigurosa en las disciplinas y áreas de dominio en las que se encuentran actualmente desplegados. Los científicos de datos están familiarizados con los matices de los datos con los que están trabajando o con los supuestos del dominio en el que están trabajando y producen análisis que impactan el crecimiento de la compañía.

Cuentacuentos

La narración de historias de datos es mucho más que simplemente crear gráficos de datos visualmente atractivos. La narración de historias de datos es un enfoque para comunicar percepciones de datos utilizando datos, imágenes y narrativa. Los científicos de datos entienden cómo estos diferentes elementos se combinan y trabajan juntos en la narración de datos. Cuando la narrativa se combina con datos, ayuda a explicar a su audiencia lo que sucede en los datos y por qué es importante una visión particular. Los científicos de datos también aplican visuales interactivos a los datos utilizando herramientas como D3.Js para iluminar a la audiencia y obtener información que no verían sin cuadros o gráficos

Espero haber aclarado la diferencia entre un científico de datos y un analista de datos.