Las entrevistas con científicos de datos en diferentes compañías variarán entre el análisis de datos y la programación más pesada. Es importante leer cuidadosamente el papel, ya que el título de “científico de datos” realmente puede significar varios trabajos diferentes. Explicaré a continuación las diferencias en las entrevistas entre científicos de datos que realmente son ingenieros de aprendizaje automático, ingenieros de datos o analistas de datos. Tenga en cuenta que la posición también puede ser una mezcla de más de uno de estos.
Científico de datos como analista de datos
El trabajo de un analista de datos es analizar los datos y presentarlos de manera efectiva. Analizará los resultados de las pruebas A / B y, a menudo, hará recomendaciones basadas en datos. Para estos roles, un título en ciencias de la computación a menudo es innecesario, y muchas de las habilidades requeridas podrían adquirirse en el trabajo. En muchos casos, cierta experiencia en SQL o R sería suficiente para pasar una entrevista.
- ¿Cuáles son algunas de las posibles razones por las que un entrevistador rechazaría a un entrevistado si el entrevistado contesta correctamente todas las preguntas prácticas del examen?
- Una pregunta de entrevista CS: ¿Cómo escribo una cola de mensajes desde cero?
- ¿Cuándo puedes calificarte 8/10 en lenguaje C?
- ¿Cómo es un proceso típico de entrevista de DirectI para un desarrollador de Android?
- ¿Cuántas rondas de entrevistas hay en Amazon y cuáles son algunas de las preguntas que se hacen?
Las habilidades en análisis y presentación de datos son realmente importantes aquí. Los entrevistadores a menudo le pedirán que les explique un proyecto o idea de ciencia de datos o ingeniería en términos que un científico o ingeniero que no sea de datos pueda entender. A menudo le presentarán los resultados de una prueba A / B y le pedirán que analice lo que sucedió. O podrían preguntarle cómo determinaría si la característica X mejora la métrica Y, a lo que podría considerar una prueba A / B, entre otras cosas.
Realmente no se le harán preguntas difíciles de codificación para los tipos de roles de analista de datos. Si se requiere codificación en un lenguaje de scripting o SQL en el trabajo, es posible que se le hagan preguntas básicas de codificación a nivel de un curso de programación de introducción o estructuras de datos, y probablemente también algunas preguntas SQL.
Científico de datos como ingeniero de aprendizaje automático
En algunos casos, un científico de datos está trabajando en sistemas de recomendación, alimentación / clasificación, búsqueda y productos que utilizan el aprendizaje automático. Tener una sólida base de programación es realmente importante aquí porque estarás programando durante la mayor parte de tu día. La programación que se prueba generalmente está relacionada con estructuras de datos y algoritmos, y a menudo también con alguna idea de probabilidad o estadística. Por lo general, no se lo probará en áreas como sistemas operativos, redes o desarrollo de aplicaciones, porque esos problemas probablemente serían menos importantes para usted que para un ingeniero de software tradicional, pero a menudo se espera que tenga una sólida comprensión de los algoritmos y diferentes enfoques, como la programación dinámica. También querrá poder explicar diferentes modelos de aprendizaje automático y saber cuándo usar diferentes, cuáles son los beneficios y los inconvenientes, etc.
ML Engineer es el caso más probable en el que se requiere un doctorado, por lo que si su entrevistador se preocupa por su investigación en uno de estos escenarios, es para este puesto.
Científico de datos como ingeniero de datos
En las startups con pequeños equipos de datos, el científico de datos probablemente trabajará en la construcción de la infraestructura de datos. Sin una infraestructura sólida todavía en su lugar, no tendría el tiempo o la potencia informática para implementar modelos complicados de aprendizaje automático. En este caso, la experiencia en ingeniería es realmente lo más importante, y las entrevistas tienden a reflejar eso al hacer preguntas de codificación como en una entrevista de ingeniería de software. La probabilidad y las estadísticas se enfatizan menos en las entrevistas allí porque será menos importante para diseñar la infraestructura, pero un pequeño porcentaje de sus preguntas podría referirse a eso o al aprendizaje automático de su afirmación de tener experiencia en él.
Las nuevas empresas a menudo serán más hacky y menos centradas en la investigación que en las compañías más grandes que están listas para contratar personas para roles como el Ingeniero ML o un científico de datos / investigación. Me han informado que en estas entrevistas es mejor no centrarse en su investigación. Cuando construye infraestructura, no tiene tiempo para elegir el mejor modelo de aprendizaje automático o la mejor selección de características. Su entrevistador quiere saber que puede moverse rápidamente y puede trabajar en muchos proyectos a menudo al mismo tiempo, desde la infraestructura hasta el análisis y el científico: usted, y tal vez un par de personas, son la persona clave para todas las necesidades relacionadas con los datos.