¿Cuál es un día de trabajo promedio para un científico de datos?

Como científico de datos que trabaja para una empresa relativamente pequeña, es probable que use muchos sombreros. Aquí hay un desglose de mi tiempo comenzando con las tareas que esperaría:

  • Tareas relacionadas con PNL (15%) . No es de extrañar que la tecnología de corrección de pruebas automatizada de PaperRater requiera un uso intensivo de analizadores, etiquetadores, expresiones regulares y otras ventajas de la PNL como parte de los algoritmos centrales y los módulos de comentarios.
  • Aprendizaje automático (5%) . Como otros han dicho, esto tiende a ser la parte más agradable. Limpieza de datos, extracción de características / ingeniería / selección y construcción de modelos.
  • Informes y análisis (10%) . Ejecución de consultas, revisión de análisis y asistencia en la toma de decisiones estratégicas.
  • Gestión de datos (5%) . Configuración y administración de servidores de bases de datos, incluidos MySQL, Redis y MongoDB. Los proyectos más grandes pueden requerir Hadoop o Spark.
  • Desarrollo de software general (40%) . Muchos DS tienen experiencia en CS, así que espere participar si tiene una experiencia aplicable. Integración API, desarrollo web, y donde sea que pueda agregar valor. Incluso en una startup de IA, la mayor parte del desarrollo no implicará IA.
  • Otro (25%) . Esto incluye una amplia variedad de tareas que incluyen publicaciones de blog, marketing, administración, documentación técnica, soporte técnico, copia de sitios web, correos electrónicos, reuniones y publicaciones como esta. 🙂 [1]

Notas al pie

[1] Revisión de gramática y corrección de pruebas en línea gratis

En Health Catalyst:

  • Mejore la infraestructura de aprendizaje automático (ML) (es decir, healthcare.ai) a través de
  • Corrección de errores
  • Nuevas funciones para la ingeniería de características.
  • Algoritmos mejores / más rápidos
  • Mejor soporte para la interpretabilidad del modelo.
  • Ayudar a los analistas a encontrar preguntas comerciales apropiadas para ML; ayúdelos a construir modelos utilizando datos clínicos y nuestras herramientas de ML [1].
  • Escriba publicaciones de blog, regale bolsas de café, haga transmisiones de YouTube y, en general, entusiasme a la gente sobre el uso de ML.
  • Notas al pie

    [1] healthcare.ai: aprendizaje automático de código abierto para la asistencia sanitaria

    1. Investigue sobre nuevos algoritmos de aprendizaje automático y pruebe su necesidad en los negocios
    2. Analice datos y visualice lo que puedo derivar de los datos.
    3. Evaluar las diferentes herramientas disponibles y que servirían a las empresas.
    4. Trabaje con diferentes grupos en diferentes proyectos y brinde apoyo según sea necesario

    En India, tengo que pasar 8 horas en la oficina haciendo lo siguiente,

    1. Recolección de datos
    2. Limpieza de datos
    3. Análisis, exploración, visualización, informes, etc.
    4. Transferencia de conocimiento
    5. Reuniones / Correo, etc.
    6. Chismes

    El hecho es que nuestro día no es más diferente que el tuyo. Cambia con la carga de trabajo, plazos y proyectos.

    La respuesta de Akash es acertada.

    Tenga en cuenta que la construcción de modelos no está en primer o segundo lugar.

    Estoy en el espacio de aprendizaje automático y la gran mayoría de mi día es la limpieza de datos.

    No se trata de construir modelos todo el día, esa es la parte divertida y esa es una pequeña parte de su trabajo.

    Si es nuevo en el aprendizaje automático, consulte mi curso gratuito sobre Python y algunas bibliotecas de uso frecuente.

    Las 5 mejores bibliotecas de aprendizaje automático en Python – Udemy

    Gracias Jojo por A2A,

    El promedio del día laboral para el científico de datos o cualquier otro trabajo depende del país en el que trabaje, por ejemplo, en Francia 35 h / semana 7 horas / día, en Alemania 8 horas / día, y así sucesivamente; También las horas de trabajo cambian de empresa a otra.

    Espero que ayude