¿Cuáles son algunas preguntas comunes de entrevistas de aprendizaje automático?

Le haríamos los siguientes tipos / ejemplos de preguntas, no todas las cuales se consideran aprobadas / reprobadas, pero nos brindan una imagen razonable y completa de la profundidad del candidato en esta área.

En general, elija uno o dos (en los que el candidato sea bueno) y siga profundizando cada vez más, en lugar de ir horizontalmente a través de alguna lista de verificación. Es mucho más indicativo de profundidad.

Dominio general : cuando realmente entiendes algo (por ejemplo, has pasado por el ciclo de aprender-hacer-enseñar-hacer), puedes expresar conceptos aparentemente complejos de maneras simples. O desarrolla puntos de vista perspicaces sobre cosas a un nivel más amplio y puede explicarlo a otros. P.ej,:

Discuta sus puntos de vista sobre la relación entre el aprendizaje automático y las estadísticas.
Hable sobre cómo encaja el aprendizaje profundo (o el método XYZ) (¿o no?) Dentro del campo.
¿No es todo solo ajuste de curva? Habla de eso.
¿Cómo son diferentes los métodos del núcleo?
¿Por qué necesitamos / queremos el término sesgo?
¿Por qué lo llamamos GLM cuando es claramente no lineal? (pregunta un tanto complicada, que debe hacerse con humor, pero extremadamente reveladora).
¿Cómo se relacionan las redes neuronales con las transformadas de Fourier? ¿Qué son las transformadas de Fourier, para el caso?
Etc.

Habilidades de ML específicas : por ejemplo,

Elija un algoritmo que le guste y guíeme por las matemáticas y luego su implementación, en pseudocódigo.
Bien, ahora escojamos otro, quizás más avanzado.
Discuta el significado de la curva ROC y escriba un pseudocódigo para generar los datos para dicha curva.
Discuta cómo realiza la ingeniería de características (busque tanto la intuición como las técnicas de evaluación específicas).
Etc.

Sistemas distribuidos (nuestras necesidades) : por ejemplo,

Discuta MapReduce (o su abstracción de paralelización favorita). ¿Por qué se hace referencia a MapReduce como una arquitectura de “nada compartido” (claramente los nodos tienen que compartir algo, no?) ¿Cuáles son las ventajas / desventajas de “nada compartido”?
Elige un algoritmo. Escriba el pseudocódigo para su versión paralela.
¿Cuáles son las compensaciones entre implementaciones de forma cerrada e iterativas de un algoritmo, en el contexto de sistemas distribuidos?
Etc.

Otros (experiencia práctica, logros pasados, etc.) :

¿Tiene experiencia con R (o Weka, Scikit-learn, SAS, Spark, etc.)? Dime que has hecho con eso. Escriba algunos ejemplos de canalizaciones de datos en ese entorno.
Hábleme de un momento en que usted … {trabajó en un proyecto que involucra ML; optimizado un algoritmo para rendimiento / precisión / etc. }
Calcule la cantidad de tiempo que pasó en su proyecto anterior en cada segmento de su trabajo de minería de datos / aprendizaje automático.
Etc.

Aprendizajeaprendizaje automáticoBig DataEmpleos y carrerasentrevistas deEntrevistas de trabajo deMinería de datosPregunta de listaPreguntas de entrevistas de trabajotrabajo