¿Cuáles son algunas preguntas comunes de entrevistas de aprendizaje automático?

Le haríamos los siguientes tipos / ejemplos de preguntas, no todas las cuales se consideran aprobadas / reprobadas, pero nos brindan una imagen razonable y completa de la profundidad del candidato en esta área.

En general, elija uno o dos (en los que el candidato sea bueno) y siga profundizando cada vez más, en lugar de ir horizontalmente a través de alguna lista de verificación. Es mucho más indicativo de profundidad.


Dominio general : cuando realmente entiendes algo (por ejemplo, has pasado por el ciclo de aprender-hacer-enseñar-hacer), puedes expresar conceptos aparentemente complejos de maneras simples. O desarrolla puntos de vista perspicaces sobre cosas a un nivel más amplio y puede explicarlo a otros. P.ej,:

  1. Discuta sus puntos de vista sobre la relación entre el aprendizaje automático y las estadísticas.
  2. Hable sobre cómo encaja el aprendizaje profundo (o el método XYZ) (¿o no?) Dentro del campo.
  3. ¿No es todo solo ajuste de curva? Habla de eso.
  4. ¿Cómo son diferentes los métodos del núcleo?
  5. ¿Por qué necesitamos / queremos el término sesgo?
  6. ¿Por qué lo llamamos GLM cuando es claramente no lineal? (pregunta un tanto complicada, que debe hacerse con humor, pero extremadamente reveladora).
  7. ¿Cómo se relacionan las redes neuronales con las transformadas de Fourier? ¿Qué son las transformadas de Fourier, para el caso?
  8. Etc.

Habilidades de ML específicas : por ejemplo,

  1. Elija un algoritmo que le guste y guíeme por las matemáticas y luego su implementación, en pseudocódigo.
  2. Bien, ahora escojamos otro, quizás más avanzado.
  3. Discuta el significado de la curva ROC y escriba un pseudocódigo para generar los datos para dicha curva.
  4. Discuta cómo realiza la ingeniería de características (busque tanto la intuición como las técnicas de evaluación específicas).
  5. Etc.

Sistemas distribuidos (nuestras necesidades) : por ejemplo,

  1. Discuta MapReduce (o su abstracción de paralelización favorita). ¿Por qué se hace referencia a MapReduce como una arquitectura de “nada compartido” (claramente los nodos tienen que compartir algo, no?) ¿Cuáles son las ventajas / desventajas de “nada compartido”?
  2. Elige un algoritmo. Escriba el pseudocódigo para su versión paralela.
  3. ¿Cuáles son las compensaciones entre implementaciones de forma cerrada e iterativas de un algoritmo, en el contexto de sistemas distribuidos?
  4. Etc.

Otros (experiencia práctica, logros pasados, etc.) :

  1. ¿Tiene experiencia con R (o Weka, Scikit-learn, SAS, Spark, etc.)? Dime que has hecho con eso. Escriba algunos ejemplos de canalizaciones de datos en ese entorno.
  2. Hábleme de un momento en que usted … {trabajó en un proyecto que involucra ML; optimizado un algoritmo para rendimiento / precisión / etc. }
  3. Calcule la cantidad de tiempo que pasó en su proyecto anterior en cada segmento de su trabajo de minería de datos / aprendizaje automático.
  4. Etc.

Creo que muchas personas no saben cómo llevar a cabo una entrevista de ciencia de datos, principalmente porque no entienden qué buscar por sí mismos, ¿cómo le preguntas a alguien sobre algo de lo que sabes muy poco?

En primer lugar, Data Scientist será una posición EXTREMADAMENTE diferente para una startup frente a una gran empresa (es decir, GOOGLE / IBM Research). Lo más probable es que, para una organización grande, los problemas en los que se centrará sean un poco más limitados, en comparación con una startup, probablemente será como “necesitamos una primera versión de modelos de clasificación / recomendación / etc.”.

En una startup, lo más probable es que no quieras a alguien que tenga las habilidades de lucha de datos (dependiendo, Pig / Python / SQL, etc.) y que haya usado bibliotecas ML estándar, aunque esto ** se aplicará ** de alguna manera a un gran empresa. La cuestión es que la gran empresa tiene recursos para hacer una exploración más novedosa, mientras que pocas startups se arriesgarán a inventar algo completamente novedoso.

De todos modos, la forma correcta de realizar una entrevista de ciencia de datos es crear un conjunto de datos (es decir, de un Kaggle, etc.) que se asemeje al problema que desea resolver, y que el ‘científico’ trabaje a través de los diferentes pasos de principio a fin. ellos harían

¿Qué datos elegirían?
¿Cómo limpiarían los datos?
¿Qué tipos de características? ¿Cómo se podrían mejorar las características con el conocimiento del dominio?
¿Qué modelo usarían? ¿por qué por qué no?
¿Qué métricas de evaluación? (f1 / recuperación / precisión, etc.)
¿Qué dicen otros periódicos sobre esto? ¿Cuál es el punto de referencia académico para un problema como este?
¿Quién en la academia ha presentado trabajos sobre este tipo de problema?
etc.

Realizo muchas pantallas básicas de teléfonos en esta área, pero no soy un experto en ML (por NINGÚN tramo de la imaginación). Estas preguntas y respuestas que he enumerado son útiles para mí como reclutador.

Pregunta : ¿Con qué áreas del aprendizaje automático está más familiarizado?

Respuestas :

  • aprendizaje supervisado
  • aprendizaje sin supervisión
  • Detección de anomalías
  • aprendizaje activo
  • Bandidos
  • procesos gaussianos
  • métodos del núcleo
  • redes profundas

Pregunta : ¿Qué tipo de problema de optimización estaría resolviendo para entrenar una máquina de vectores de soporte?

Respuestas : maximizar el margen (mejor respuesta), programa cuadrático, cuadrático con restricciones lineales, referencia para resolver la forma primaria o dual.

Pregunta : Cuénteme acerca de los aspectos positivos y negativos del uso de procesos gaussianos / enfoque general de métodos de kernel para el aprendizaje.

Respuesta : Positivos: no lineales, no paramétricos. Negativos: escalado incorrecto con instancias, es necesario realizar ajustes de hiperparámetros

Pregunta : ¿Cómo se escala un método de núcleo con el número de instancias (por ejemplo, con un núcleo gaussiano rbf)?

Respuesta: Cuadrática (refiriéndose a la construcción de la matriz de gramo (núcleo)), cúbica (refiriéndose a la inversión de la matriz)

Pregunta : Describa formas de superar los problemas de escala.

Respuestas : métodos nystrom / aproximaciones de matriz de kernel de bajo rango, características aleatorias, local por consulta / vecinos cercanos

Pregunta : ¿Cuáles son algunas herramientas para paralelizar algoritmos de aprendizaje automático?

Respuestas : GPU, Matlab parfor, escriba las suyas usando primitivas de bajo nivel / RPC / MPI, mapreduce, spark, votepal, graphlab, giraph, petuum, parametererver

Pregunta : En Python, ¿tienes un PEP favorito / menos favorito?

Respuesta : Peps son propuestas de mejora de Python. Si tienes un favorito o menos favorito, significa que tienen conocimiento de Python.

Espero que este pequeño fragmento de preguntas y respuestas te ayude.

More Interesting

¿Qué tipo de pregunta debo esperar en la entrevista en pantalla telefónica para New Grad Software Engineer en Google? ¿Hay alguna diferencia en la dificultad entre el puesto de ingeniero de software?

¿Cómo debe uno prepararse para la entrevista de BARC OCES / DGFS?

¿Cuál fue la pregunta más extraña que te hizo un profesor?

¿Cuál es el precio mínimo que debe pagar por una demanda para entrevistas de trabajo?

¿Son habituales los gastos pagados por las entrevistas de trabajo en el extranjero o están más interesados ​​en mí que de costumbre?

¿Cómo respondo la pregunta de la entrevista de marketing, "Por favor, invente una estrategia de marketing buena / mala"?

Soy un posible empleado en una empresa de software y me invitaron a conversar con el CEO. ¿Qué tipo de preguntas debo hacer?

¿Qué razón para irme puedo decir durante una entrevista de trabajo después de 3 años?

¿Cuáles son las cosas importantes que un ingeniero de pruebas con experiencia de 1 año necesita saber mientras se enfrenta a una entrevista?

¿Cómo se prepara para una entrevista de análisis de datos in situ para una empresa de juegos?

¿Por qué Google quiere tener una entrevista más después del sitio?

¿Qué tipos de preguntas se hicieron en la entrevista ALD / KYC en India?

Si todos los ingenieros de Google tuvieran que volver a entrevistar para mantener su trabajo, ¿qué porcentaje tendría éxito?

¿Cuál es la mejor respuesta si alguien me pide que venda algo en una entrevista?

¿Cuál debería ser el tema importante para prepararse para un lecturate, así como para una discusión grupal en una entrevista de SSB de las Fuerzas Armadas de la India para las vacantes de un civil técnico de SSC?