¿Cómo puede alguien sin experiencia en análisis de datos construir su cartera y reanudar para solicitar un puesto de analista de datos / científico?

Hay muchos usuarios activos en Quora trabajando en el campo. He encontrado que las publicaciones de William Chen son muy útiles: ha escrito muchas publicaciones que detallan excelentes recursos, la mayoría de ellos gratuitos, para aquellos que están interesados ​​en comenzar una carrera trabajando con datos, así como para aquellos que ya tienen algo de experiencia. Recientemente comencé a seguir a Michael Hochster también. Él escribe muy claramente y tiene un tono amigable.

Pero para responder a su pregunta directamente, la mejor manera de asegurar un puesto de trabajo con datos sin mucha experiencia es simplemente comenzar . Esto podría verse como enviar su solicitud para un programa de ciencia de datos, comenzar la primera lección de un curso en línea sobre regresión o descargar un conjunto de datos e intentar darle algún sentido. Sea cual sea la forma que elija, simplemente siga avanzando. Mucha gente no supera la fase de planificación. 🙂

Mi colega hizo la lista de proyectos de ciencia de datos simples pero ilustrativos para crear un CV de científico de datos sin experiencia laboral: https://blog.statsbot.co/data-sc

Dejaré la descripción de uno de estos proyectos solo para tener la idea de si vale la pena seguir el enlace.

Spam o jamón
El spam vive donde sea posible dejar mensajes. Uno de los problemas clásicos de la ciencia de datos es la detección de spam. Puede entrenar un modelo para detectar correos electrónicos no deseados, mensajes de spam y comentarios de usuarios de spam para ocultarlos en el navegador.

Un motor de aprendizaje automático define el spam en función de la probabilidad de encontrar palabras como “venta” y “compra” en los mensajes de spam. Como resultado, puede obtener un prototipo funcional de AdBlock en aproximadamente una semana.

Problema de ML: clasificación de texto
Algoritmos: ingenuos bayes, clasificadores lineales, clasificadores de árboles, clasificadores de lo que quieras
Tecnologías: sklearn, nltk, scrapy
Datos: conjunto de datos de spam de SMS, conjunto de datos de spam de correo electrónico, conjunto de datos de spam de comentarios de YouTube
Implementación: extensión del navegador
Referencias: AdBlock, Adguard
Guías: Cómo construir un clasificador simple de aprendizaje automático de detección de spam, Primeros pasos: construcción de una extensión de Chrome

Otros problemas de ML son:

  • No hotdog
  • Recomendaciones de películas de Netflix
  • Lentes originales de Snapchat
  • Transmisión de Twitter
  • Apuestas de tenis
  • Predicción del precio de las acciones

Espero que sea útil!

Como analista de datos, encuentro esta pregunta bastante insultante.

Sustituya otras profesiones por “análisis de datos” y veremos:

“¿Cómo puede alguien sin capacitación médica construir su currículum y solicitar un trabajo como cirujano?”

“¿Cómo puede alguien sin capacitación legal construir su currículum y solicitar un trabajo como abogado?”

“¿Cómo puede alguien sin entrenamiento en terapia construir su currículum y solicitar un trabajo como terapeuta?”

Si quieres ser analista de datos, está bien. Volver a la escuela. Tomar cursos de estadística / análisis de datos. Si quieres ser un “científico de datos”, probablemente también deberías tomar cursos de informática. Si esos cursos son buenos, incluirán muchas tareas prácticas. Después de graduarse (en estos días, es probable que desee un doctorado), entonces puede solicitar puestos de trabajo.

Al igual que el cirujano tendría que ir a la escuela de medicina, el abogado a la facultad de derecho, etc.