Me pregunto cuántas de las llamadas falacias son percepciones erróneas. Como ya señalaron algunos, pasará la mayor parte de su tiempo limpiando datos. Sin embargo, eso no es solo para ML. Es imprescindible en cualquier trabajo intensivo basado en datos.
Una regla general: el 90% de su tiempo lo pasará limpiando o manejando datos y solo el 10% haciendo lo que aprendió en libros, escuela, etc., por ejemplo, modelado, etc.
¿Por qué? Si piensas un poco más, te darás cuenta de que es de sentido común. Por ejemplo, suponga que recibe una muestra de una población y un conjunto de preguntas para responder. Primero debe verificar si los datos contienen lo que le han preguntado y si esa muestra representa las poblaciones, los valores faltantes, etc. Es una realidad con la que tiene que lidiar. Eso lleva tiempo, mucho tiempo. Debe conocer el tema relacionado con los datos. Es por eso que los empleadores quieren, por ejemplo, en relación con la atención médica, quieren personas con conocimiento de los datos de salud si es posible, y así sucesivamente. Cada dato tiene sus propios problemas, según el tema, etc.
- ¿Cómo es trabajar como científico de datos para el gobierno de Singapur?
- ¿Cómo puedo convertirme en un científico autodidacta?
- ¿Necesito un título en ciencias de datos para ser un científico de datos?
- Cómo ser un científico de datos con experiencia en comercio
- ¿Cuáles son los cursos recomendados para científicos de datos?
Con respecto a la entrevista: Ummmm … si no tienes experiencia en un dato particular (salud, financiero, etc.) sobre el que te preguntarían, lo detectarán en el acto. Confía en mí, no mientas si no conoces esos datos. No hay ningún libro que pueda aprender sobre esos datos. Incluso las personas con experiencia que trabajan durante 30 años en el tema aprenden todos los días. Incluso he visto muchos trabajos publicados de revisión por pares de investigación con suposiciones erróneas con respecto a los datos, es decir, ni siquiera (todas) las personas en la academia conocen los detalles intrínsecos que se encuentran en los datos de un tema en particular. Es por eso que muchas personas tienen dificultades para cambiar de sucursal.
Buena suerte