¿Hay científicos de datos para quienes DevOps es una parte importante de su trabajo?

DVC (Data Version Control) es una herramienta de código abierto para proyectos de ciencia de datos. Hace que sus proyectos de ciencia de datos sean reproducibles y aparece cada vez que un científico de datos comienza a buscar instrumentos DevOps-for-Analytics efectivos:

DVC gestiona los siguientes problemas de DevOps en las rutinas diarias de Data Scientist y llena estos vacíos entre las prácticas clásicas de ciencia de datos y las demandas comerciales de las empresas para construir procesos sólidos de DevOps: Control de versiones de datos en análisis Paradigma de DevOps

1. Extraiga todo tipo de datos necesarios de una variedad de fuentes . Una vez que configure y escriba sus trabajos de extracción de datos con DVC, será persistente y operable en toda su infraestructura de datos y servicios

2. Extraer, transformar y cargar los datos . ETL será fácil y repetible una vez que lo configure con secuencias de comandos DVC. Se convertirá en una tubería sólida para operar sin un gran esfuerzo de apoyo. Además, rastreará todos los cambios y activará una alerta de actualizaciones en los pasos de la tubería a través de DAG.

3. Facilitar el aprendizaje automático continuo y la toma de decisiones. La parte de la tubería facilitada a través de secuencias de comandos DVC puede ser trabajos para cargar datos de nuevo a cualquier sistema transaccional (como ERP, ERM, CRM, etc.), almacén o data mart. Luego estará expuesto a las partes interesadas del negocio para tomar decisiones inteligentes basadas en datos.

4. Comparta sus algoritmos y datos . El modelado de Machine Learning es un proceso iterativo y es extremadamente importante realizar un seguimiento de sus pasos, dependencias entre los pasos, dependencias entre su código y archivos de datos y todos los argumentos de ejecución de código. Esto se vuelve aún más importante y complicado en un entorno de equipo donde la colaboración de los científicos de datos requiere una gran cantidad de esfuerzo del equipo. DVC será el brazo para ayudarlo con esto.

Como científico de datos, no es necesario adquirir habilidades relacionadas con DevOps a menos que las necesite en su trabajo actual o simplemente desee aprender por interés personal.

Construir y mantener una tubería DevOps es una tarea para ingenieros de software, no para científicos de datos. Hay muy pocas posiciones que requieren habilidades de análisis y DevOps.

Si está en una pequeña empresa, muchas veces todos necesitarán saber un poco de todo, y esto incluye a los “científicos de datos”, así que sí.

En general, creo que es bueno aprender un poco sobre cómo funcionan las cosas en todo el proceso, porque facilita la colaboración con otros y, por extensión, lo hace más valioso. Si desea construir sus propios proyectos, también ayuda saber cómo configurar las cosas.

Aparte de eso, no, los científicos de datos generalmente no hacen trabajo devops.

Es agradable de tener pero no de necesidad.

Podría ser útil si trabaja en una startup o dentro de un pequeño equipo de ciencia de datos que carece de soporte de ingeniería de datos.

Dicho esto, nunca es la parte importante de lo que hace un científico de datos. Si es el caso, hay un problema.

No que yo sepa.

En este momento hay dos caminos principales en el aprendizaje automático.

El científico de datos … esos son los tipos de doctorado y el ingeniero de aprendizaje automático, esos son los programadores de Python que construyen los modelos.

Python no es tan difícil de aprender.

Tome este curso gratuito y verá que es un lenguaje de alto nivel.

Las 5 mejores bibliotecas de aprendizaje automático en Python – Udemy

More Interesting

¿Cuáles son las diferencias en el trabajo realizado por un analista de datos y un científico de datos en Netflix?

¿Qué tipo de trabajo / función puede hacer un científico de datos después de su maestría?

¿Es usted un científico de datos hecho a sí mismo? ¿Cómo lo hiciste?

¿Cuán valioso y relevante es el curso de análisis de negocios 360 que ofrece Analytixlabs para un aspirante a científico de datos?

¿Ser un experto en algoritmos es una habilidad necesaria como científico de datos, que se especializa específicamente en el aprendizaje profundo?

¿Qué programa de posgrado debería elegir para ser un buen científico de datos, sin embargo, mi promedio de calificaciones es inferior a 3.0?

¿Cómo convertirse en un científico de datos? ¿Qué campo ofrece más oportunidades de trabajo / investigación? ¿Cómo se relaciona con la automatización de datos?

¿Qué es lo emocionante de Big Data?

¿Cómo te desarrollas como profesional cuando eres el único en tu campo en tu empresa?

¿Cómo puede un científico de datos conseguir un trabajo en el sector gubernamental en la India?

¿Existe un mercado para un aspirante a científico de datos o ingeniero de aprendizaje automático para trabajar en proyectos en casa y recibir un pago?

¿Es posible que una persona que ha trabajado durante tres años en soporte de TI se mueva a la ciencia de datos? En caso afirmativo, ¿cómo comenzar y avanzar?

¿Qué tan raros son los científicos de datos?

Como científico de datos junior de fin de estudios en París, ¿qué tan difícil será encontrar oportunidades de trabajo en los Estados Unidos?

¿Qué piensan los codificadores, matemáticos y científicos de alto nivel sobre la eficiencia de tiro de Steph Curry?