Cómo entrar en la ingeniería de datos como ingeniero de software

La Ingeniería de Datos en mi experiencia es solo un subconjunto de Ingeniería de Software, básicamente estás trabajando con muchos datos y es por eso que necesitas usar herramientas específicas y algoritmos específicos.

Como muchas cosas en la vida, solo se trata de practicar. Las herramientas actuales no son tan difíciles hoy en día, cualquiera con una comprensión básica de Java / Python y algo de experiencia en codificación puede codificar un trabajo de Hadoop con bastante facilidad en unos minutos. Entonces necesitarás tiempo para mejorar, por supuesto.

Por lo tanto, le sugiero que elija uno de los grandes marcos / herramientas (o como quiera llamarlos) y comience a codificar:

  • Apache Spark
  • Apache Hadoop

Hay otros, por supuesto, pero estos son los grandes hoy en día. Encontrarás muchos ejemplos en la web, libros y tutoriales.

Otra parte importante es la arquitectura, por lo tanto, mientras sus trabajos se ejecutan en su computadora portátil o en un conjunto de máquinas virtuales, eche un vistazo a las arquitecturas típicas de big data, eche un vistazo a las publicaciones de Facebook Engineering, Google y otras compañías de big data (toneladas de ellas hoy en día). Allí verá cómo combinan el procesamiento de datos (hadoop / spark) con otras partes importantes del rompecabezas (por nombrar algunas):

  • Ingestión de datos
  • Los experimentos
  • Servir datos a las interfaces
  • Fecha de almacenamiento

More Interesting

¿Cómo puede un principiante en diseño de software convertirse en profesional en el campo? Estoy estudiando ingeniería de software, pero cuando veo software serio parece complicado. Entonces, ¿cómo debo llegar al punto en que pueda diseñar un software complejo y robusto?

¿Cuál de los siguientes lenguajes de programación es el más rápido de aprender: C ++, C #, Java, Erlang, Go, Rust, C, D y Hack?

¿Estaría de acuerdo en que la ingeniería de software tiene menos que ver con la programación y más con la habilidad?

¿Qué significa esto para un ingeniero de software: "No estás en un nivel superior"?

¿Qué es una lista de compañías en el Área de la Bahía que contratan ingenieros de software que tienen poca experiencia (2 años) pero son buenos para resolver problemas?

¿Qué idiomas debo aprender para ser ingeniero de software?

¿Hay un buen ingeniero de software que no conozca Java?

¿Cuál es el mejor sitio para principiantes en el dominio comercial para aprender terminologías comerciales?

¿Todos los desarrolladores / ingenieros de software necesitan saber JavaScript?

¿Cuáles son algunos términos comunes utilizados por los ingenieros de software que todos deberían saber?

Como ingeniero de software, ¿qué conocimientos técnicos me estoy perdiendo si no estoy trabajando en Google / Facebook / Amazon / Apple / Microsoft? ¿Cómo puedo compensarlo?

Como estudiante de ingeniero de software, ¿qué aplicaciones o sitios web puedo usar para mejorar?

¿Qué debo hacer para seguir aumentando mis conocimientos y habilidades como ingeniero de software? Específicamente, ¿qué habilidades debería mejorar para trabajar en empresas como Google, Twitter, LinkedIn, etc.?

¿Qué posibilidades hay de que contraten ingenieros de software de Google si vuelven a pasar por el proceso de entrevista?

¿Cómo son las perspectivas laborales para los nuevos ingenieros de software en 5 a 10 años?