¿Me va bien en Kaggle conseguirme un trabajo de ciencia de datos de nivel de entrada?

En resumen, sí.

Sin embargo, en mi experiencia de entrevista (he entrevistado para puestos de científico de datos en tres compañías y recientemente acepté una oferta), están más interesados ​​en cómo abordaron los problemas que en qué tan bien se clasificaron. En todas mis entrevistas hablé extensamente sobre los pocos proyectos de Kaggle en los que había trabajado.

Mi consejo: escriba en detalle todo su proceso para construir un modelo de aprendizaje automático. Esto lo ayudará a responder preguntas en el acto.

Es decir, comenzando con los datos sin procesar, responda este tipo de preguntas por sí mismo:

¿Cómo preprocesaste? ¿Cuál fue su técnica para los valores perdidos? ¿Hizo alguna ingeniería de características y, de ser así, mejoró su precisión? ¿Cómo se cruza la validación? ¿Es su modelo interpretable (muy importante en el mundo real. Nada en Kaggle)? ¿Cómo elegiste tu algoritmo final? ¿Cómo podría acelerar el tiempo de entrenamiento (reduciendo la dimensionalidad, un algoritmo más rápido, etc.)

Al menos en mi experiencia, hablé extensamente con mis entrevistadores sobre mi proceso y me hicieron todas estas preguntas. Ninguno de ellos expresó interés en mi clasificación, pero todos estaban interesados ​​en el problema en sí. Si tiene buenas respuestas a estas, realmente las impresionará porque demuestra que comprende todo el proceso y no solo copia los scripts de otras personas o simplemente empuja sus datos a través de un bosque aleatorio y lo llama un día.

¡Buena suerte! El proceso de la entrevista puede ser increíblemente agotador. Sin embargo, es realmente gratificante una vez que vale la pena.

No.

Probablemente te ayudará a conseguir una entrevista , pero ciertamente no es un trabajo por sí solo.

En primer lugar, los trabajos de ciencia de datos tienen muchos sabores. No todos requieren optimizar un modelo predictivo de aprendizaje automático como Kaggle. A menudo, los enfoques algorítmicos de caja negra no son lo que se requiere.

En segundo lugar, Kaggle solo prueba un subconjunto de habilidades requeridas en un rol de ciencia de datos. Es importante definir un problema y obtener los datos en forma de Kaggle. Es importante tener una comprensión más amplia del éxito más allá de las métricas de error. La comunicación a un público tanto técnico como no técnico es importante.

En tercer lugar, en igualdad de condiciones, preferiría un proyecto de la vida real realizado en su propio tiempo sobre Kaggle.

Finalmente, y quizás lo más importante, “poder hacer el trabajo” a veces no es lo mismo que “poder hacer el trabajo en nuestra empresa, con nuestro equipo”.


Hacer bien en Kaggle es una ventaja, pero no es suficiente. Tenemos maestros de Kaggle en nuestro equipo de ciencia de datos, pero como personas son mucho más que sus puntajes de Kaggle. Y a medida que contratamos, tomaría un candidato más completo con una actitud positiva que encaja en el equipo cualquier día.

En el esquema más amplio de las cosas, si el candidato tiene unos pocos cientos o incluso un par de miles de puestos más bajos en la tabla de clasificación, que así sea. Las habilidades de Kaggling pueden ser entrenadas. Algunas de las otras habilidades, no tan fácilmente.

Tal vez. Vemos algunos candidatos que han trabajado en un proyecto de Kaggle por su cuenta o como parte de un equipo. En muchos casos, las personas que obtienen mejores resultados en las competencias de Kaggle son personas que han hecho ajustes a los algoritmos que los ayudan a obtener un aumento en el rendimiento que es mínimo, pero suficiente para ponerlos por delante de otros competidores de Kaggle. Para muchos problemas del mundo real (aunque no todos, por supuesto), un pequeño aumento en la precisión o AUC no vale la cantidad de tiempo que tendría que pasar para mejorar el modelo. Además, en algunos casos, un aumento fraccional en el rendimiento está asociado con un aumento bastante grande en el costo computacional, lo cual es un problema para los sistemas implementados en tiempo real.

Además, gran parte del trabajo de ser un científico de datos en muchos entornos consiste en establecer un enfoque para un problema no estructurado. A diferencia de Kaggle, nadie le dice qué datos usar para el entrenamiento o cómo deben estructurarse los datos. Nadie le dice sobre qué base se debe evaluar su algoritmo. Si alguien no puede hacer un trabajo razonable definiendo un problema real y pensando cuidadosamente cómo abordarlo (selección de datos, limpieza de datos, modelado, ajuste, evaluación, etc.), probablemente no haremos la contratación.

¡Si y no!

Dejame explicar.

El primer paso para conseguir un trabajo es llegar hasta la mesa de entrevistas. Y para esta parte del viaje para obtener la oferta, Kaggle es un muy buen emblema en su perfil. He visto a muchos candidatos con rango de Kaggle ser llamados para una entrevista que muchos candidatos sin rango de Kaggle. Esta tendencia la observé en Silicon Valley y principalmente para los candidatos, que solo tenían experiencia académica en ML / DL. Entonces, Kaggle los hizo sobresalir en un espacio muy concurrido de nuevos candidatos ML / DL. Asegúrese de comprender que kaggle “ayuda” a destacarse.

Pero, una vez que está más allá de la pantalla de perfil y consigue una entrevista de trabajo, Kaggle tiene el mismo significado que cualquier otro trabajo realizado por usted. Lo que quiero decir aquí es que debes hablar sobre el “cuerpo de trabajo” realizado por ti, no importa si fue para tu última compañía o para Kaggle. por ejemplo, si construyó una tubería de limpieza de datos, es relevante independientemente de dónde lo hizo. Además, si sabe cómo usar la técnica de conjunto para aumentar su resultado, eso es muy útil, independientemente de dónde lo haya usado, ya sea kaggle o su última compañía. Entonces, para esta parte del viaje, en la que debe demostrar su conocimiento, Kaggle solo puede ayudarlo en términos de desarrollar un conocimiento práctico real. Pero no lleva ninguna marca registrada como tal. Entonces, en la entrevista no es mucho más relevante que otra cosa. Entonces, no, la “marca” de Kaggle no lo hará navegar a través de la entrevista, pero el “conocimiento” de Kaggle definitivamente ayudará a desempeñarse bien.

Además de la pregunta en cuestión, en mi experiencia, ser capaz de desempeñarse bien en Kaggle aumentará su confianza y lo inspirará a profundizar durante su proceso de aprendizaje. Me sucedió después de leer libros y cursos interminables. Me hizo trabajar en problemas largos y pude desarrollar celo para experimentar durante mi viaje de kaggle.

¡Mis dos centavos!

¡Feliz aprendizaje!

¡Esa es una pregunta fantástica! Los desafíos de Kaggle son una excelente manera de practicar sus habilidades de ciencia de datos y comprender qué cosas interesantes puede hacer con la ciencia de datos. Un aspecto que no podrá obtener experiencia comercial. Tuve este mismo problema cuando terminé mi doctorado, tenía las habilidades pero no la experiencia comercial. Hice un bootcamp llamado Science to Data Science, donde trabajé en un proyecto de ciencia de datos real durante 5 semanas y aprendí cómo aplicar estas habilidades en un entorno comercial. Luego comencé a solicitar puestos de nivel de entrada y en unos pocos meses tuve un par de ofertas de trabajo para elegir. Espero que esto ayude 🙂 tenga un día fantástico

Ciertamente puede. Si ya tiene conocimientos de ciencia de datos, puede solicitarlo directamente a las empresas que contratan personas con este perfil.

Seguramente crea una posibilidad muy alta para que usted reciba una llamada de entrevista. Funciona como una estrella en tu currículum / perfil de linkedin.

More Interesting

¿Cuáles son las compañías que contratarían a los nuevos para sus cosas relacionadas con la ciencia de datos?

Cómo juzgar a un buen científico de datos con solo 5 preguntas

A pesar del gran éxito de la ciencia de datos en diferentes campos, ¿por qué no hay muchos trabajos / nuevas empresas de ciencia de datos en el campo del petróleo y el gas?

¿Es posible cambiar de compañía y entrar en BigData?

¿De qué se trata la ciencia de datos? ¿Cómo es el futuro en eso?

¿Cuáles son los diferentes tipos de científicos de datos?

Estoy trabajando como un genoma científico. No tengo un buen conocimiento de las computadoras y las matemáticas. ¿Cómo debo proceder para lograr habilidades de ciencias de datos?

¿Un científico de datos necesita saber física? ¿Ayuda de alguna manera?

La ciencia de datos como profesión ha sido bastante popular durante los últimos 3-5 años. ¿Cuándo alcanzaremos el equilibrio de oferta y demanda para los científicos de datos?

¿Contrataría a un científico de datos sin título?

Cómo prepararse para trabajos de ingeniero de datos en Amazon / Google / Facebook / Quora

¿Quiénes son las personas que trabajan en el campo de la ciencia de datos / big data en India? ¿En qué habilidades y tecnologías trabajan y cómo las aprendieron?

¿Cuál es el mejor curso para el científico de datos en Pune?

¿Cuáles son las diferencias en el trabajo realizado por un analista de datos y un científico de datos en Netflix?

Cómo realizar prácticas como científico de datos en startups