Le haríamos los siguientes tipos / ejemplos de preguntas, no todas las cuales se consideran aprobadas / reprobadas, pero nos brindan una imagen razonable y completa de la profundidad del candidato en esta área.
En general, elija uno o dos (en los que el candidato sea bueno) y siga profundizando cada vez más, en lugar de ir horizontalmente a través de alguna lista de verificación. Es mucho más indicativo de profundidad.
Dominio general : cuando realmente entiendes algo (por ejemplo, has pasado por el ciclo de aprender-hacer-enseñar-hacer), puedes expresar conceptos aparentemente complejos de maneras simples. O desarrolla puntos de vista perspicaces sobre cosas a un nivel más amplio y puede explicarlo a otros. P.ej,:
- ¿Cómo lidias con un ex jefe que te ha prometido una referencia negativa?
- ¿Es una buena idea reconocer mi propia debilidad durante una entrevista de trabajo?
- Cómo pasar una entrevista telefónica técnica para un puesto de desarrollador junior de Java / Android
- ¿Cuál es el tiempo más largo que ha esperado una oferta de trabajo después de completar sus entrevistas?
- ¿Qué tipo de preguntas se hacen en la prueba de ingreso CEPT para Masters?
- Discuta sus puntos de vista sobre la relación entre el aprendizaje automático y las estadísticas.
- Hable sobre cómo encaja el aprendizaje profundo (o el método XYZ) (¿o no?) Dentro del campo.
- ¿No es todo solo ajuste de curva? Habla de eso.
- ¿Cómo son diferentes los métodos del núcleo?
- ¿Por qué necesitamos / queremos el término sesgo?
- ¿Por qué lo llamamos GLM cuando es claramente no lineal? (pregunta un tanto complicada, que debe hacerse con humor, pero extremadamente reveladora).
- ¿Cómo se relacionan las redes neuronales con las transformadas de Fourier? ¿Qué son las transformadas de Fourier, para el caso?
- Etc.
Habilidades de ML específicas : por ejemplo,
- Elija un algoritmo que le guste y guíeme por las matemáticas y luego su implementación, en pseudocódigo.
- Bien, ahora escojamos otro, quizás más avanzado.
- Discuta el significado de la curva ROC y escriba un pseudocódigo para generar los datos para dicha curva.
- Discuta cómo realiza la ingeniería de características (busque tanto la intuición como las técnicas de evaluación específicas).
- Etc.
Sistemas distribuidos (nuestras necesidades) : por ejemplo,
- Discuta MapReduce (o su abstracción de paralelización favorita). ¿Por qué se hace referencia a MapReduce como una arquitectura de “nada compartido” (claramente los nodos tienen que compartir algo, no?) ¿Cuáles son las ventajas / desventajas de “nada compartido”?
- Elige un algoritmo. Escriba el pseudocódigo para su versión paralela.
- ¿Cuáles son las compensaciones entre implementaciones de forma cerrada e iterativas de un algoritmo, en el contexto de sistemas distribuidos?
- Etc.
Otros (experiencia práctica, logros pasados, etc.) :
- ¿Tiene experiencia con R (o Weka, Scikit-learn, SAS, Spark, etc.)? Dime que has hecho con eso. Escriba algunos ejemplos de canalizaciones de datos en ese entorno.
- Hábleme de un momento en que usted … {trabajó en un proyecto que involucra ML; optimizado un algoritmo para rendimiento / precisión / etc. }
- Calcule la cantidad de tiempo que pasó en su proyecto anterior en cada segmento de su trabajo de minería de datos / aprendizaje automático.
- Etc.