¿Cuáles son las habilidades que diferencian a los científicos de datos con los ingenieros de datos?

Habilidades de los científicos de datos:

  • habilidades para resolver problemas (problemas de negocios),
  • habilidades analíticas de datos,
  • fuertes habilidades de programación,
  • experiencia de trabajo en diferentes conjuntos de datos,
  • profundo conocimiento de los fundamentos de la informática,
  • estadística,
  • habilidades para trabajar con herramientas de minería de datos,
  • conocimiento de Scala, Python, R,
  • habilidades para trabajar con Apache Spark, Hadoop,
  • aprendizaje automático, etc.

Los ingenieros de datos no necesariamente deben conocer el aprendizaje automático o el análisis de big data, pero deben tener en cuenta:

  • Hadoop, MapReduce, herramientas Hive,
  • MySQL, NoSQL, SQL,
  • transmisión de datos,
  • gestión e integración de datos,
  • ETL
  • construyendo prototipos, algoritmos y modelos,
  • diseño e instalación de sistemas de gestión de datos,
  • desarrollar procesos de conjuntos de datos,
  • habilidades creativas de resolución de problemas,
  • conocimiento de la industria, etc.

No es sorprendente que esta pregunta haya surgido antes. Por ejemplo, en el Berkeley Data Science Forum 2016, un panelista, Aditi Bhagat (Adobe), respondió lo siguiente: “Un científico de datos entiende qué preguntas hacer” en contraste con otras descripciones de trabajo de “datos *”.

Olvidando por un momento qué título le otorgamos, creo que ella hace una distinción importante. La implicación es que un “científico de datos” comprende las necesidades comerciales, las necesidades humanas y similares, y luego puede relacionarlos con el método, la tecnología y otras cosas que asociamos con la ciencia de datos.

Pero los títulos pueden ser una distracción.

Hace décadas, las bandas de rock solían observar que “enviar el vino de vuelta (en un restaurante elegante)” era una señal de que la banda estaba bajando la colina, y que pronto se rompería. Una analogía empresarial es cuando todos quieren tener un título de “VP”.

Por lo tanto, mi sugerencia es no involucrarse demasiado en los títulos de trabajo, pero entiendo que hay que hacer distinciones importantes. El desafío es que estas distinciones pueden ser sutiles, por supuesto.

Entonces, con experiencia en estadística e ingeniería de software, debe tener un excelente comienzo. Simplemente no olvides que también deberías estar adquiriendo una apreciación y comprensión del punto.

Científico de datos

Debe tener habilidades de científico de datos

  • Conocimiento experto de Matemáticas y Estadística .
  • Habilidades de programación intermedia.
  • Inteligencia empresarial perspicaz.
  • Habilidades de visualización de datos y narración de cuentos.
  • Conocimiento de algoritmos de aprendizaje automático.

Algunas de las herramientas importantes para Data Scientist

  • Pitón
  • Programación R
  • Apache Spark
  • SPSS
  • Weka
  • Herramientas de visualización de datos como Tableau
  • SQL

Ingeniero de datos

Habilidades clave de un ingeniero de datos

  • Almacenamiento de datos
  • Diseño de bases de datos
  • Recolección y transformación de datos.
  • Codificación

Algunas de las herramientas importantes para el ingeniero de datos

  • Hadoop y herramientas relacionadas como Pig, Hive, HBase, etc.
  • Bases de datos NoSQL
  • Cloudera
  • Herramientas de BI como Pentaho, informática, talend, …
  • SQL
  • Cassandra

Espero que ayude 🙂

Algunas referencias

Científico de datos http://www.slideshare.net/DavidR

Comparación de infografías Comparación de trabajos – Científico de datos vs Ingeniero de datos vs Estadístico

Para salario: Salario de Ingeniero de Datos / Ingeniero

Espero que ayude 🙂

Según las últimas ofertas de trabajo, estos son los requisitos previos más importantes que se requieren para los científicos e ingenieros de datos:

Habilidades principales de Data Scientist:

Ingeniero de datos Habilidades principales –

Como puede ver, definitivamente hay cierta superposición de habilidades entre las dos posiciones, incluidas SQL y Python. Si está equipado con ambos, ya está en camino de convertirse en ingeniero de datos. A continuación, recomendaría dedicar algo de tiempo a aprender Java.

En Paysa, incluso puedes ver cuánto valen las habilidades específicas. Por ejemplo, para un ingeniero de software recién graduado en el Área de la Bahía, las habilidades en Java valen alrededor de $ 13K al año. Paysa también puede sugerir habilidades que lo ayudarán a avanzar en su carrera. Aquí está el enlace si quieres verlo: Paysa.

¡Buena suerte!

Creo que el título “ingeniero de datos” generalmente se refiere a alguien que trabaja en el almacenamiento de datos y herramientas y tuberías de procesamiento de datos, mientras que un “científico de datos” es más alguien que trabaja en análisis y modelado de datos. La división aproximada es: el ingeniero de datos trabaja en las herramientas de datos, el científico de datos es el usuario principal de esas herramientas. Tal vez pueda pensar en esto como algo similar a la división de desarrolladores front-end / back-end.

Sin embargo, tenga en cuenta que el científico de datos también usa otras herramientas, como las bibliotecas de aprendizaje automático y las bibliotecas de visualización de datos. Pero típicamente estas herramientas son desarrolladas por el científico de datos y no por el ingeniero de datos.

Los ingenieros de datos deberían ser expertos en más cosas de “back-end” como la gestión de bases de datos y la canalización de datos. Los científicos de datos deberían ser más hábiles en aprendizaje automático y análisis estadísticos rigurosos.

More Interesting

¿Qué es lo emocionante de Big Data?

¿Por qué hay tanto énfasis en hacer una EM antes de convertirse en un científico de datos?

Cómo convertirse en un científico de datos de ser ingeniero mecánico

¿Hay científicos de datos para quienes DevOps es una parte importante de su trabajo?

¿Qué clases debo tomar en BITS Pilani si quiero ser un científico de datos?

¿Es un rol de analista de negocios en Apple lo suficientemente desafiante para alguien que es científico de datos en la industria no tecnológica y programas en Python y C ++?

Habiendo obtenido una certificación de especialización en ciencia de datos en Coursera y sin experiencia relevante en la industria, ¿cómo comienzo mi carrera como científico de datos?

¿Debo ingresar a consultoría tecnológica, análisis de datos, desarrollo de software o gestión de productos?

¿Cómo debería ser la cuenta de GitHub de un científico de datos?

¿Puede un científico de datos fingirlo hasta que lo logre?

Estoy trabajando como científico de datos por $ 100K en Chattanooga. Tengo una oferta por $ 160K en San Francisco. Con el ajuste de COLA, ¿es esta una oferta justa?

¿Cómo detectan los científicos de datos los cambios estructurales que pueden socavar las predicciones?

¿Qué clases debo tomar en el MIT si quiero convertirme en un científico de datos?

¿Qué tan diferente es una maestría en análisis de una maestría en ciencia de datos?

¿Cuál es una manera de trazar los límites del árbol de decisión con R?