Como científico de datos, ¿cómo aprendo a ‘escribir código de producción’?

Creo que esta pregunta puede dividirse en dos partes. 1) código en sí 2) flujo de trabajo

Código en sí

En realidad, esto tiene más que ver con la calidad del código que con el idioma que usa, ya que debería poder escribir código de calidad independientemente.

Las métricas que pueden ser importantes para los algoritmos de aprendizaje automático, como la precisión predictiva o la tasa de error, pueden no ser tan importantes en comparación con la forma en que su código se desempeña bajo una carga pesada y maneja las condiciones de límite y las excepciones. Suceden muchas cosas malas en el entorno de producción en las que ni siquiera piensas.

Flujo de trabajo

Usted codifica como parte del equipo y necesita trabajar eficazmente con procesos de ingeniería de software como gestión de proyectos, revisión de código, control de revisión, control de calidad, etc. Cada organización tiene una cultura laboral distinta en torno a dichos procesos que es difícil de aprender a menos que esté en ese ambiente.

Eso no es todo

Debido a que el entorno de producción es muy difícil, su equipo tiende a ser conservador para cambiar las cosas. Como científico de datos, debe cambiar su algoritmo a medida que mejora su algoritmo o los cambios en la fuente de datos. Esa es una tensión interesante para experimentar.

Visite un buen equipo de ingeniería de software que apreciará sus habilidades analíticas.

Sería genial si puedes trabajar en un producto basado en aprendizaje automático, como un sistema de recomendación, pero solo estar en un equipo de ingeniería y construir algo te llevará allí.