No es sorprendente que los datos desempeñen un papel importante en el papel de uno como Data Scientist (DS). En Airbnb, tenemos muchos tipos diferentes de datos, por lo que tenemos muchos tipos diferentes de DS.
Nuestro equipo actual de datos tiene muchos colaboradores: científicos de datos (obviamente), ingenieros de datos, analistas de datos, expertos en visualización de datos, gerentes de productos de datos, etc.
Dividimos la parte DS de este equipo en 6 grupos funcionales: crecimiento, invitado, anfitrión, pagos, confianza y seguridad, y operaciones. En estos sub-equipos, el rol de un DS variará dependiendo de los datos que estén analizando, los socios comerciales con los que estén trabajando y el producto que estén ayudando a dar forma.
- Cómo comparar el pasante científico de datos en Airbnb versus el pasante científico de datos de infraestructura en Facebook
- ¿Cómo debería ser reclutado como científico de datos / analista de datos directamente de la universidad?
- Un estudiante de IIT que tiene un IPC bajo de 5, pero tengo interés en Data Science. ¿Cómo podría prepararme para conseguir un buen trabajo en el campo de la ciencia de datos?
- Además del aprendizaje automático, ¿cuáles son las otras cosas que debo aprender para convertirme en un científico de datos / PNL?
- ¿Qué proyecto se debe seleccionar en ciencia de datos para conseguir un trabajo?
Growth DS se asocia con el equipo de Marketing y el equipo de Producto para identificar formas de atraer más tráfico a Airbnb. Muchos de nuestros canales de adquisición involucran otras plataformas, por lo que estos DS ayudan a construir canales que vinculan los datos de estos terceros con nuestros propios datos. Estos DS también ayudan a diseñar y analizar experimentos escalables, con asignaciones tanto fuera de línea (no rastreadas a nivel de usuario) como en línea (A / B más tradicionales), para que el equipo pueda lanzar constantemente nuevas pruebas.
Los DS invitados y los DS host se centran en analizar los cambios en el producto principal, incluidas las clasificaciones de búsqueda y las recomendaciones de precios . A menudo usan conjuntos de datos con consultas de búsqueda registradas, preferencias de calendario de host e interacciones de flujo de reserva. Estos proyectos tienden a ser una mezcla de análisis experimental y desarrollo de productos (con modelos y simulaciones de aprendizaje automático).
Los DS de pagos y los DS de confianza y seguridad trabajan principalmente en el desarrollo de modelos que utilizan técnicas de aprendizaje automático para identificar anomalías en los datos de transacciones y los datos de comportamiento del usuario, respectivamente. Estos DS también son responsables de analizar cualquier cambio de producto asociado con estos modelos, como opciones de pago o identificaciones verificadas. Además de trabajar con el equipo de Producto, estos DS también se asociarán a menudo con equipos de operaciones, como representantes de ventas y agentes de confianza y seguridad.
Por último, los DS de Ops se asocian con el resto de los departamentos de Airbnb (el equipo de DS trabaja con todos los equipos de Airbnb), incluidas las políticas y los recursos humanos. Estos DS tienden a depender más de fuentes de terceros (como datos de encuestas, censos o empleados) y menos de datos experimentales.
Las responsabilidades diarias de un DS en Airbnb han evolucionado a lo largo de los años , a medida que otros equipos especializados, como Data Infrastructure, han aparecido. Hoy, la mayoría de los DS se enfocan en construir tuberías para limpiar datos y definir métricas, diseñar experimentos para medir el impacto de los cambios en el producto y desarrollar modelos predictivos para comprender los comportamientos de nuestros usuarios e identificar formas de personalizar aún más la experiencia del producto.
Desde el primer día, el equipo de DS ha mantenido un modelo de trabajo híbrido, donde los DS se sientan entre sí para fomentar el intercambio y el aprendizaje interfuncional, pero trabajan (a menudo independientemente de otros DS) con unidades centradas en proyectos que generalmente consisten en un Gerente de Producto , un diseñador y un puñado de ingenieros.
La mayoría del equipo de DS usa Hive o Presto (ambos basados en SQL) para consultar nuestros datos almacenados y R o Python para analizarlos y modelarlos. Spark también se está volviendo más utilizado, aunque principalmente para el aprendizaje automático.
Si trabajar con alguno de estos conjuntos de datos suena emocionante, ¡estamos contratando !