Cómo prepararse para un puesto de analista de datos / científico en Facebook

Como no trabajo para Facebook, no podré responder esta pregunta específicamente. Sin embargo, antes de responder, también desearía establecer la premisa correcta.
A partir de hoy, no existe una definición estándar de Analista de datos y Científico de datos que distinga claramente entre los dos roles. En pocas palabras, un DA sería más un rol centrado en el negocio, mientras que DS sería más un rol matemático (no orientado a la programación). La siguiente tabla da una idea de esto:

Ahora a la siguiente parte de la pregunta, sobre la posición de Facebook. Si su experiencia es en tecnología, debería buscar DS en lugar de DA, función. Muy a menudo, enfrentará preguntas sobre el modelado de una solución, que de alguna manera involucraría a los usuarios con contenido promocionado. Ahí es donde Facebook gana dinero, ¿verdad? Conceptos como publicidad en imágenes, relevancia publicitaria, sistemas de recomendación son algunos de los ejemplos que se le puede pedir que responda. Esto es solo mi suposición, y la realidad podría ser diferente, pero no muy lejos de esto.

Acabo de pasar por una entrevista de trabajo en Facebook para un puesto de ciencia de datos. Quería escribir aquí una reseña completa. En línea hay TONELADAS de recursos sobre entrevistas de trabajo, pero todas son vagas en el mejor de los casos. ¡A veces incluso se ven falsas! ¡Nunca me pidieron que encajara pelotas en un autobús!

1er paso -> Cómo obtener la entrevista. Buena suerte aplicando en línea … Creo que la única forma de obtener una entrevista en lugares como FB es a través de una referencia interna. Al menos esa fue mi experiencia.

2do paso -> Entrevista de recursos humanos. Fue solo una conversación informal sobre por qué quería trabajar en Facebook. Vi varios videos en Youtube de ejecutivos de FB hablando sobre la misión de FB. Escogí de los videos un par de cosas que me resonaron y le dije a HR que realmente amaba que FB tenía esa misión y quería ser parte de eso. Me concentré en hacer eso personal. Soy indio, así que le conté sobre la importancia que puede tener la conexión de personas en línea en mi propio país, dando ejemplos.

3er paso -> Me enviaron un desafío de datos. Se trataba de publicidad. Cómo evaluarlos y encontrar los mejores. ¡Fue un poco difícil! Había tantas formas de verlo. Algunos anuncios fueron excelentes para el crecimiento porque obtuvieron muchos clics, pero no fueron rentables. Algunos rentables, pero pocos clics. Eventualmente, creé una combinación muy simple de crecimiento y rentabilidad y clasifiqué los anuncios basados ​​en eso. Me ayudó que antes de haber hecho bastantes desafíos del libro, la colección de desafíos de ciencia de datos para llevar a casa. Uno es similar al desafío FB. Además, la práctica me dio un poco más de confianza y no me asusté por la presión del tiempo. ¡Al menos tenía menos miedo!

4to paso-> Pantalla compartida. Codificación SQL. Antes de esto, estaba aterrorizado. Nunca había codificado frente a nadie en mi vida y SQL definitivamente no es mi lenguaje # 1. Sentí que no me fue muy bien. Casi ninguna de mis consultas habría funcionado. ¡En algún momento, entré en pánico tanto que cambié a Python! Le dije: ¡déjame resolver esto en Python y luego lo hago en SQL! Pero de alguna manera lo pasé! A continuación pongo una de las dos consultas que me pidieron que resolviera:

1. Considere una tabla Lifetime_music_actions que para cualquier valor dt tiene todos los pares de canciones de usuario que han existido y el recuento de escuchas para cada par. Escriba una consulta para actualizar esa tabla para hoy dado que la tiene para ayer y music_actions para hoy.

(Para una partición dt dada, la tabla tiene TODOS los pares de canciones de usuario que se hayan registrado hasta ese día).

El esquema será algo así como:

“Lifetime_music_actions”

dt STRING #date

user_id BIGINT

song_id BIGINT

cnt INT

music_actions registra cuando un usuario escucha una canción. Su esquema es:

dt STRING # fecha

marca de tiempo BIGINT

user_id BIGINT

song_id BIGINT

5to paso -> Entrevista en el sitio. Tuve 5 reuniones: 2 gerentes de producto, 2 científicos de datos y 1 de recursos humanos. RH solo estaba charlando. No me sentí como una entrevista. Para los demás, esta es la pregunta más importante que me hicieron. Algunos eran bastante vagos. Creo que era mi deber definirlos mejor o hacerles preguntas para reducir el problema.

  1. 1er PM: ¿Cómo estimaría el tiempo de vida de un clic en un anuncio? Concéntrese en cómo comunicaría esto en términos simples a un anunciante.
  2. 2do PM: hemos desarrollado un nuevo modelo de anuncio. ¿Cómo probaría si esto es mejor que el modelo actual? No solo con respecto a los ingresos, sino también pensando en la experiencia del usuario (¡me encantó esta pregunta porque mostró cómo FB siempre piensa primero en la experiencia del usuario!)
  3. 1er DS: crea un modelo para clasificar si un clic en FB proviene de un usuario real o un bot (¡la primera vez que escuché sobre bots en mi vida!).
  4. 2º DS: elige tu modelo favorito y guíame por él. Cómo funciona, cómo está construido, por qué es tu favorito. Elegí un bosque al azar, pero lo hice mal aquí. No podría explicar bien cómo se construyó cada árbol. Los criterios de división.

Conclusión -> Desafortunadamente no obtuve el trabajo. Sin embargo, todavía obtuve un trabajo de DS en otra empresa de alta tecnología. Lo hice mal en una entrevista de DS y creo que eso fue todo.

De todos modos, espero que esto sea útil para otras personas.

¡Buena suerte!

More Interesting

Quiero convertirme en un científico de datos con especialidad de aprendizaje automático, ¿qué cursos debo tomar?

¿Cuál será el alcance de los trabajos de científico de datos en los próximos años?

Al elegir entre convertirse en un científico de datos y un ingeniero de software, ¿cuál tiene el mejor futuro?

Como científico de datos, ¿necesitamos Excel y todas las herramientas de Microsoft?

¿Cómo es un día en la vida de un científico de datos? ¿Por qué es esta la carrera más popular en este momento?

Muchas personas se llaman a sí mismas "científicos de datos". ¿Cómo identificas a un científico de datos real?

¿Cuál es la diferencia entre un arquitecto de datos, un analista de datos, un ingeniero de datos y un científico de datos?

Como científico de datos o ingeniero de aprendizaje automático, ¿cuánto tiempo dedicas a los algoritmos?

¿Qué oportunidades de carrera en ciencia de datos y aprendizaje automático existen en Microsoft?

¿Qué habilidades tiene como analista de datos o científico de datos que otros profesionales de la informática no tendrán?

¿Qué edad, experiencia, métrica de grado son mejores para ser llamado científico de datos?

¿Cómo debo cambiar mi carrera de desarrollador de iOS a científico de datos?

¿Cuánto dinero ganan los científicos de datos y cuál es la trayectoria profesional de los científicos de datos?

¿Cuál es la mejor configuración de Python para un científico de datos?

¿Qué debo hacer para convertirme en un gran científico de datos si actualmente soy estudiante de ingeniería en IIT Roorkee y pasante en Nucleus Software, y quiero trabajar con una empresa como Google o Facebook?