¿En qué se diferencia el trabajo de un científico de datos del de un ingeniero de software?

Estás haciendo una pregunta como cuál es la diferencia entre el trabajo de un camionero y un repartidor de flores. Al final del día, ambos tienen que mover cosas del punto A al B.

“Escribir código de una forma u otra” simplifica enormemente las funciones de los ingenieros de software y los científicos de datos. Ambas funciones son sustancialmente más que solo escribir código.

El deber principal de un científico de datos es descubrir qué datos se pueden usar y cómo responder ciertas preguntas, antes de escribir cualquier código que lo haga. Un científico de datos presenta formas creativas de usar datos, formas de visualizar e interactuar con datos, y contar historias a partir de datos. Sucede que necesitan usar computadoras para hacer esto en escala, por lo que tienen que escribir software de vez en cuando. Pero cuando lo hacen, generalmente escriben prototipos rápidos. Muy rara vez escriben software de producción que sirva a los clientes directamente. Eso suele dejarse para los ingenieros de software. Los científicos de datos a menudo no están capacitados en ciencias de la computación o ingeniería, pueden tener experiencia en matemáticas o ciencias naturales, por ejemplo.

El rol de un ingeniero de software también va mucho más allá de escribir código. Implica analizar casos de uso, diseñar arquitecturas, preocuparse por la calidad del software, diseñar pruebas unitarias, etc. antes de comenzar a escribir código. Un buen ingeniero de software no solo escribe código, sino que se asegura de que la base del código sea escalable, bien documentada, comprobable, sostenible, etc. Estas son habilidades que los científicos de datos no suelen tener, y en la mayoría de los casos no tienen tener.

Considere el análogo de construir un puente: el trabajo de los científicos de datos es descubrir que necesitamos cruzar el río, y la mejor manera de hacerlo es construir un puente y tal vez intentar construir un puente de madera horrible para demostrar que es posible. El trabajo de un ingeniero de software es diseñar y construir un puente real, y asegurarse de que no se derrumbe.

Entonces sí, mientras que al final del día, tanto un ingeniero de software como un científico de datos pueden terminar escribiendo código de una forma u otra, escriben tipos de código totalmente diferentes. La programación es una herramienta que tanto los ingenieros de software como los científicos de datos terminan usando. Pero su trabajo y habilidades son muy diferentes, aunque se superponen. Estas habilidades complementarias son la razón por la que a menudo ve a los escultores de datos trabajando en colaboración con ingenieros de software.

Un gran resumen de científicos de datos: http://oreil.ly/zVwKNr
Lea también más sobre ingeniería de software en, por ejemplo, Wikipedia http://en.wikipedia.org/wiki/Sof…

Hay una diferencia significativa entre ambos campos. De hecho, los roles de trabajo ni siquiera son coplanares. Con respecto al conjunto de habilidades, se puede decir que cada ingeniero de software es un subconjunto de Data Science. Data Science es un campo demasiado vasto en comparación con los ingenieros de software.

Data Scientist juega un papel más perspicaz y bastante estratégico, mientras que los ingenieros de software están más centrados en el producto y son de naturaleza creativa. Aquí hay algunas diferencias que se pueden señalar entre un científico de datos y un ingeniero de software.

Ingeniero de software

Un ingeniero de software crea aplicaciones y sistemas. El ingeniero estará involucrado en todas las etapas de este proceso, desde el diseño hasta la redacción del código, las pruebas y la revisión. Están creando los productos que crean los datos. El ingeniero de software es el más antiguo de estos tres roles y ha establecido metodologías y conjuntos de herramientas.

El trabajo incluye:

  • Desarrollo frontend y backend
  • Aplicaciones web
  • Aplicaciones móviles
  • Desarrollo del sistema operativo
  • Diseño de software

Científico de datos

Hay científicos de datos que afinan los modelos estadísticos y matemáticos que se aplican a los datos. Cuando alguien aplica su conocimiento teórico de estadísticas y algoritmos para encontrar la mejor manera de resolver un problema de ciencia de datos, está cumpliendo el papel de científico de datos. Cuando alguien crea un modelo para predecir el número de impagos de tarjetas de crédito en el próximo mes, lleva puesto el sombrero de científico de datos.

Un científico de datos podrá tomar un problema comercial y traducirlo a una pregunta de datos, crear modelos predictivos para responder la pregunta y contar historias sobre los hallazgos. Los estadísticos que se centran en la implementación de enfoques estadísticos de los datos, y los gerentes de datos que se centran en ejecutar equipos de ciencia de datos tienden a caer en el papel de científico de datos. Los científicos de datos son el puente entre la programación y la implementación de la ciencia de datos, la teoría de la ciencia de datos y las implicaciones comerciales de los datos.

Un científico de datos construye análisis sobre los datos. Esto puede venir en forma de un análisis único para un equipo que intenta comprender mejor el comportamiento del cliente, o un algoritmo de aprendizaje automático que luego se implementa en la base del código por ingenieros de software e ingenieros de datos.

El trabajo incluye:

  • Modelado de datos
  • Aprendizaje automático
  • Algoritmos
  • Tableros de inteligencia empresarial

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a los talentos de ingeniería a iniciar su carrera en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes construyeron proyectos sobre el conjunto de datos REAL y las declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos