Estoy de acuerdo en que Kaggle por sí solo puede ser una ruta ineficaz para convertirse en un científico de datos, por algunas razones:
- Kaggle se ocupa principalmente del aprendizaje automático, que es solo un aspecto de la ciencia de datos.
- Cuando trabaja en Kaggle, se trata principalmente de datos previamente limpiados, por lo que no tiene suficiente experiencia en la limpieza de datos desordenados, que es (coloquialmente) el 80% de lo que hace un científico de datos.
- Debido al gran volumen de personas que ingresan a las competencias de Kaggle, llegar al primer porcentaje o ganar una competencia requiere no solo habilidad, sino mucho tiempo y algo de suerte.
Y hasta cierto punto, también estoy de acuerdo con lo que le han dicho que poner código R / Python en github no tiene sentido, a menos que tenga mucho propósito en qué código poner y cómo .
- Como científico de datos, ¿necesitamos Excel y todas las herramientas de Microsoft?
- ¿Qué es la ciencia de datos, y su alcance y trabajos?
- ¿Cuáles son las oportunidades de científicos de datos en Canadá?
- ¿Es valiosa la ciencia de datos para una carrera como bioestadista?
- ¿Qué curso debemos hacer para seleccionar como científico de datos?
Lanzar código aleatorio y esperar que alguien lo vea no es un gran enfoque. Poner pensamiento y esfuerzo en la construcción de una cartera completa de proyectos de ciencia de datos es.
En Dataquest, abogamos por construir una cartera de proyectos para ayudar a nuestros estudiantes a obtener sus primeros trabajos de ciencia de datos, y muchos lo han hecho con éxito.
Voy a compartir algunas estrategias, basadas en mi experiencia, para construir una cartera de ciencia de datos que lo hará notar y conseguirá un trabajo.
POR QUÉ HACER UNA CARTERA
La razón por la que un portafolio de ciencia de datos es útil es porque demuestra que usted puede hacer las cosas por las que un empleador quiere contratarlo. Es efectivamente un sustituto de la experiencia laboral que le falta.
Piénselo desde la perspectiva del empleador: quieren maximizar la posibilidad de contratar a un gran candidato y minimizar la posibilidad de contratar a un candidato débil. Como candidato, su trabajo es demostrarles que tiene las habilidades y cualidades que necesitan para ese papel.
Una sólida cartera de ciencia de datos está compuesta por varios proyectos de ciencia de datos de tamaño mediano, que combinados demuestran al empleador que tiene las habilidades clave que están buscando.
COMIENCE POR SER REALISTA
Lo primero que debe tener en cuenta es que es extremadamente raro que el primer rol de alguien en Data Science sea un rol de aprendizaje automático ‘hardcore’.
Este es su primer trabajo en la industria, por lo que debe esperar que lo consideren para los roles Junior, y luego puede progresar progresivamente desde allí.
Es posible que los roles ni siquiera se llamen ‘Data Scientist’, sino algo así como ‘Data Analyst’ o ‘Business Analyst’. Sea humilde y esté dispuesto a hacer lo que sea necesario para ingresar a la industria.
Por esta razón, llenar su cartera con proyectos de aprendizaje automático es un esfuerzo en la dirección incorrecta (aunque recomiendo tener al menos uno). Considere esto cuando piense en qué tipo de proyectos incluir.
TIPOS DE PROYECTOS
Diferentes proyectos pueden demostrar cosas diferentes. Aquí hay algunos tipos diferentes de proyectos que puede construir:
- Proyecto de limpieza de datos : muestra que puede tomar múltiples conjuntos de datos desordenados, limpiarlos, combinarlos y usarlos para realizar análisis. Ejemplo
- Proyecto de narración de datos : muestra que puede extraer información de los datos, comunicar estas ideas y razonar con los datos. Ejemplo
- Proyecto de visualización de datos : muestra que puede comunicar datos visualmente mediante diagramas y gráficos apropiados.
- Proyecto de aprendizaje automático : muestra que puede construir efectivamente un modelo que haga predicciones precisas con datos Ejemplo
- Proyecto de extremo a extremo : muestra que puede crear un sistema autónomo que puede tomar datos, procesarlos y producir resultados en una forma específica. Ejemplo
- Publicación explicativa : muestra que puede comunicarse y explicar bien con los datos al explicar un concepto como un concepto estadístico o un algoritmo de aprendizaje automático
Debe pensar en el tipo de trabajo que desea al seleccionar qué proyectos agregar a su cartera. Como se mencionó anteriormente, no deberían ser todos los proyectos de aprendizaje automático.
Si tiene un interés particular en la visualización de datos, por ejemplo, puede hacer un par de proyectos de visualización de datos y tal vez agregar algunas visualizaciones interactivas para demostrar sus habilidades en esa área.
Debe familiarizarse con los anuncios de los trabajos que va a buscar: ver las habilidades que solicitan y usarlo como una indicación de cómo seleccionar proyectos para su cartera.
Si necesita ayuda para encontrar conjuntos de datos para su proyecto, verificaría este gran recurso: 18 lugares para encontrar conjuntos de datos para proyectos de ciencia de datos.
PRESENTA BIEN TUS PROYECTOS
Un proyecto efectivo no es hacer un análisis y subirlo. Debe dedicar tiempo y esfuerzo para que su proyecto sea fácil de entender y digerir.
Esto significa darle a su proyecto una introducción o un archivo léame. Debe ‘vender’ su proyecto, teniendo en cuenta que es muy posible que su léame sea lo único que algunas personas mirarán. Haga que su proyecto se sienta como si hubiera sido contratado para realizar un proyecto; explique cuál era el objetivo, qué enfoque adoptó, los datos que utilizó y el resultado.
También debe asegurarse de que su archivo Léame tenga instrucciones para instalar o ejecutar su proyecto, de modo que cualquiera que quiera reproducir su trabajo pueda hacerlo fácilmente.
Debido a esto, debe asegurarse de incluir todos los archivos y conjuntos de datos relevantes, así como proporcionar una lista de las bibliotecas necesarias para ejecutar sus proyectos (por ejemplo, un archivo require.txt para un proyecto de Python)
Si su proyecto está compuesto por scripts independientes, debe asegurarse de que sean fáciles de leer y que los comentarios se utilicen en su código para explicar lo que está haciendo y por qué.
Si su proyecto usa cuadernos, agregue un descuento a su proyecto que explique lo que está haciendo e interprete sus resultados a medida que avanza.
Si desea obtener más información sobre cómo presentar su cartera, este artículo es un gran recurso.
CATER PARA DIFERENTES TIPOS DE PERSONAS QUE MIRARÁN SU PROYECTO
Tenga en cuenta que dentro del proceso de contratación, diferentes tipos de personas examinarán su cartera y tendrán diferentes niveles de habilidad y comprensión.
Un gerente de contratación que revise su cartera al inicio del proceso podría tener una comprensión técnica limitada. Debes asegurarte de que haya muchas explicaciones para este tipo de persona, y tal vez incluso considerar poner tus proyectos en un blog y en GitHub para que puedas escribir con más detalle sobre tu proyecto y explicar cómo funciona para alguien con menos experiencia técnica.
Más adelante en el proceso, un gerente de la compañía puede examinar su cartera, y ellos estarán interesados en cómo puede entregar valor a la compañía y comunicarse. Debe asegurarse de que todas sus explicaciones sean claras y que su proyecto cumpla con su objetivo.
Por último, debe esperar que alguien técnico evalúe su cartera. Debe asegurarse de que su código esté limpio, refactorizado y eficiente.
Para diferentes compañías, el proceso de contratación será diferente y algunas de estas personas solo examinarán su cartera. Debes considerar y prepararte deliberadamente para cada uno.
DEJE A LOS EMPLEADORES SABER SOBRE SU CARTERA
Un error común es colocar algunos proyectos en GitHub y luego simplemente agregar la URL de su perfil de GitHub a la parte superior de su currículum. Recuerde que el proceso de contratación es difícil, por lo que debe facilitar que quienes buscan en su aplicación encuentren y evalúen su cartera.
En lugar de simplemente ‘agregar una URL’ y esperar que alguien la encuentre, mencione explícitamente su cartera y proyectos específicos en su carta de presentación. Si llama a alguien por teléfono, mencione su cartera y cómo muestra cómo puede proporcionar valor a la empresa. Aproveche todas las oportunidades que pueda para presentar su cartera.
Otro enfoque efectivo es incluir sus proyectos de cartera en su currículum como si fueran contratos a corto plazo (aunque tenga cuidado de no ser engañoso). Dé un breve resumen del objetivo y las habilidades que demuestra, y proporcione un enlace fácil de seguir.
También ayuda recordar que, en general, se encontrará con menos personas técnicas al comienzo del proceso de contratación y más personas técnicas más adelante, por lo que su aplicación inicial podría incluir su ‘blog’ de cartera de manera más prominente.
TL; DR
Un portafolio es una forma extremadamente efectiva de actuar como un reemplazo de la experiencia cuando busca su primer trabajo de Data Science, sin embargo, solo arrojar algo de código en GitHub no es suficiente.
Debe crear varios proyectos sustanciales que demuestren habilidades específicas que sean relevantes para los trabajos que desea obtener. Debe tomarse el tiempo para presentarlos bien y tener en cuenta los diferentes tipos de personas que verán su cartera en el proceso de contratación.
Por último, debe hacer un esfuerzo para asegurarse de que su cartera sea una parte destacada de su aplicación, y considere presentar sus proyectos de cartera como contratos a corto plazo.
Si te gustó esta respuesta, considera votarla y seguirme.
Trabajo para Dataquest, la mejor plataforma en línea para aprender a ser un científico de datos. Más allá de enseñarle los conceptos que necesita, estamos a favor de un enfoque de aprendizaje basado en proyectos, y tenemos muchos proyectos guiados que pueden formar el comienzo de su cartera de ciencia de datos.
Si eso le interesa, puede inscribirse y completar nuestro primer curso gratis en Dataquest.io