Soy autodidacta en ciencia de datos, a través de material MOOC equivalente a un currículo de bootcamp de ciencia de datos. ¿Qué puedo hacer a continuación para obtener un trabajo en el campo?

No seguiría una receta que alguien escriba para ti o proyectos basados ​​en tutoriales.

Cada uno de nosotros que llega a la ciencia de datos desde cualquier camino, excepto una maestría en matemáticas o ciencias de la computación o un doctorado en algo relevante, tiene que tomar algunas decisiones difíciles y personales y hacer un trabajo serio.

Habiendo hecho esto yo mismo (realmente todavía lo estoy haciendo, porque es un proceso), puedo decirte que es más fácil y más difícil de lo que crees que será.

Si tiene habilidades fundamentales sólidas y está dispuesto a trabajar por un salario y beneficios de nivel de entrada durante 12–18 meses, puede encontrar muchas personas que buscan contratar personas con más habilidades de Excel. Pueden estar dispuestos a comprometer el conocimiento del dominio y la experiencia del mundo real si realmente eres alguien que intentará, fallará e intentará nuevamente y tiene una capacidad estadística y de programación real.

Para rellenar el currículum, puede hacer un montón de tutoriales que la gente sugiere, analizar los ejemplos que otras personas han hecho, pero nada es más impresionante para un jefe potencial que es un tomador de riesgos (que deben ser para tomar a alguien cuyo el pedigrí es arriesgado) más que alguien que se arriesga, hace un proyecto que podría fracasar por completo, tal vez incluso lo hace, pero obtiene una GRAN experiencia y aprende a aprender.

Intenta algo, basado en una técnica que conozcas, que inventes por tu cuenta. Si está interesado en tecnología de aletas, haga algo relacionado con el mercado. SI usted es un geek biológico, analice algunos genes … solo tenga pasión por el proyecto porque eso es lo que me ha llevado a pasar la mayoría de mis primeras rondas … ¡entusiasmo por el trabajo!

Descubrí que las cartas de presentación eran extremadamente importantes para aclarar mis habilidades y establecer expectativas razonables de manera positiva. Además, si eres ligero en las habilidades difíciles, pero transmites el tipo correcto de personalidad para encajar bien, es posible que encuentres personas dispuestas a moldearte un poco. ¡Tómese el tiempo para escribir cartas de presentación y hágalo bien!

Sobre todo, siga trabajando, siga aprendiendo, sea voluntario si le brinda experiencia real y siga enviando hojas de vida y cartas de presentación. Y recuerde que un científico de datos es un analista de datos … ¡comience donde puede recibir llamadas!

Mi camino:

Yo era un PROFESOR DE ARTE en la escuela secundaria … mi título era tecnología, pero mi título era en arte. Decidí hacer un cambio después de aprender un pequeño código para trabajar con mis alumnos.

Después de 6 meses de MOOC, hice una pasantía de verano para maestros y durante ese período, conocí a un profesor que tenía 7 meses de financiación si alguien estaba dispuesto a trabajar en un entorno muy ambiguo, programando sensores, construyendo impresoras 3D y analizando datos de prueba de los sensores. .

Renuncié a un trabajo con salarios bajos, buena estabilidad y muy buenos beneficios para uno con el mismo salario y sin beneficios y sin estabilidad. Eso llevó a un puesto de analista de datos, en el que he trabajado mucho para evolucionar a un rol de ciencia de datos seis meses más adelante. Era una oportunidad … y podría haber fallado miserablemente, pero estaba dispuesto a aprovecharla. Tienes que decidir lo que puedes vivir sin …

Dieciocho meses después de esta posición, recibo atención constante en linkedin y otros sitios donde mi CV es visible.

Acabo de ser aceptado en un programa de maestría en ciencias de datos de primer nivel sin necesidad de trabajo correctivo (basado en los exámenes de ingreso en codificación, matemática y SQL) y estoy en las etapas de entrevista para análisis real y roles de ciencia de datos con los beneficios, ventajas y ventajas. que vienen con ellos Estoy siendo muy intencional al elegir este próximo rol, porque quiero que el próximo puesto sea significativo y me ayude a convertirme en un analista de alto nivel.

Honestamente, no fue tan difícil meter un pie en la puerta. Pero una vez allí, crecí rápidamente y por eso ahora es mucho más útil y vale más.

La clave es encontrar el camino correcto para usted. Probablemente no será un trabajo donde Data Scientist sea el puesto publicado. Si es así, es probable que no sepan cómo usar, capacitar, respaldar o gestionar razonablemente las expectativas de un científico de datos, no importa un analista incipiente con aspiraciones de DS.

Mi mejor consejo es encontrar a alguien que quiera un científico de datos, que sepa que no puede pagarlo o que la administración permita este movimiento radical, que tenga expectativas razonables y que ofrezca un buen apoyo, luego crezca a una velocidad razonable como analista con libertad o responsabilidades adicionales. ellos para pagar clases, entrenamiento, conferencias.

Ir a reuniones. Presente públicamente a los mejores científicos de datos y en aproximadamente 2 años, se despertará un día y se dará cuenta de que lo logró, o se dará cuenta de que es mucho trabajo y no es realmente el mejor camino para usted … muchos caminos hacia la iluminación, pero solo una forma de saberlo, da ese primer paso valiente.

Paso 1 :-

Primero elabore su currículum con los siguientes proyectos, la mayoría de ellos son como “hola mundo” para la ciencia de datos

Spam o jamón

El spam vive donde sea posible dejar mensajes. Uno de los problemas clásicos de la ciencia de datos es la detección de spam. Puede entrenar un modelo para detectar correos electrónicos no deseados, mensajes de spam y comentarios de usuarios de spam para ocultarlos en el navegador.

Un motor de aprendizaje automático define el spam en función de la probabilidad de encontrar palabras como “venta” y “compra” en los mensajes de spam. Como resultado, puede obtener un prototipo funcional de AdBlock en aproximadamente una semana.

Problema de ML: clasificación de texto
Algoritmos: ingenuos bayes, clasificadores lineales, clasificadores de árboles, clasificadores de lo que quieras
Tecnologías: sklearn, nltk, scrapy
Datos: conjunto de datos de spam de SMS, conjunto de datos de spam de correo electrónico, conjunto de datos de spam de comentarios de YouTube
Implementación: extensión del navegador
Referencias: AdBlock, Adguard
Guías: Cómo construir un clasificador simple de aprendizaje automático de detección de spam, Primeros pasos: construcción de una extensión de Chrome

No hotdog

Not Hotdog es una aplicación viral de la serie Silicon Valley que puede reconocer perritos calientes y no perritos calientes en las fotos.

Puedes entrenar un clasificador de imágenes para lo que quieras usando redes sociales o imágenes de Google para recopilar un conjunto de datos (usando hashtags o consultas de búsqueda).

El entrenamiento de una red neuronal desde cero requiere muchas muestras de entrenamiento y tiempo de computación, por lo que es mejor usar una red pre-entrenada (este enfoque se llama aprendizaje de transferencia).

Problema de ML: reconocimiento de imágenes, clasificación de imágenes, transferencia de aprendizaje
Algoritmos: redes neuronales convolucionales
Tecnologías: keras, lasaña, API de Instagram (o bibliotecas externas, por ejemplo, Instabot)
Datos: use la API de Instagram y los hashtags para recopilar el conjunto de datos
Implementación: aplicación móvil
Referencias: No hotdog
Guías: Transfiera el aprendizaje usando Keras, construyendo poderosos modelos de clasificación de imágenes usando muy pocos datos

Recomendaciones de películas de Netflix

Los sistemas de recomendación son necesarios para las grandes empresas como Google o Facebook, porque es valioso desde una perspectiva de ingresos y compromiso (anuncios de Facebook, recomendaciones de Youtube).

Los principiantes científicos de datos pueden practicar en este subdominio de la ciencia de datos y construir su sistema personal de recomendación de películas.

Ilustración: MovieLens

Problema de ML: sistemas de recomendación
Algoritmos: reducción de dimensionalidad, filtrado colaborativo, algoritmos de clasificación
Tecnologías: Sklearn, Wongpal Wabbit
Datos: conjunto de datos de premios de Netflix, conjunto de datos de MovieLens
Implementación: aplicación web
Referencias: Jinni, MovieLens
Guías: Guía rápida para construir un motor de recomendaciones en Python

Lentes originales de Snapchat

Si eres bueno en diseño gráfico, deberías intentar crear tu propia lente Snapchat personalizada. Cualquier red social tiene tales cosas en su arsenal: Instagram, Facebook y Snapchat.

Gif: https://support.snapchat.com/en-

Las lentes detectan puntos faciales clave para mostrar dónde están los bordes de los labios, ojos, nariz y cara. Luego, el motor ML crea una máscara que coincide con la cara correctamente incluso si se está moviendo (por ejemplo, usando openCV o cualquier biblioteca gráfica).

Problema de ML: reconocimiento de imagen, detección de rostros
Algoritmos: redes neuronales convolucionales, detección de puntos clave faciales
Tecnologías: dlib, openface, keras, openCV
Datos: conjunto de datos de detección de puntos clave faciales
Implementación: aplicación móvil
Referencias: Snapchat, Instagram
Guías: puntos de referencia faciales con dlib, OpenCV y Python, construir una aplicación de cámara simple

Transmisión de Twitter

Muchas compañías monitorean las menciones de sus clientes en Internet para reaccionar a las negativas lo antes posible. Por ejemplo, T-Mobile y Verizon deben responder rápidamente a los tweets negativos y descubrir cuál es el problema y cómo pueden resolverlo.

Todos pueden realizar este proyecto utilizando una API de Twitter conveniente y algoritmos de análisis de sentimientos para detectar dichos tweets en toda la transmisión.

Problema de ML: análisis de sentimientos
Algoritmos: análisis de sentimientos
Datos: API de Twitter
Tecnologías: nltk, spaCy
Implementación: aplicación web
Referencias: Twilert, Tweetreach
Guías: análisis de sentimientos de Twitter usando Python y NLTK

Apuestas de tenis

Los apostadores profesionales siempre buscan apuestas rentables. El tenis es un buen tipo de deporte para las predicciones debido a la gran cantidad de datos estadísticos, y a veces los corredores de apuestas cometen errores.

Los científicos de datos pueden crear sitios web con el historial de partidos y la información de los jugadores, crear un modelo de predicción y comparar los resultados con las evaluaciones de los corredores de apuestas.

El objetivo es encontrar una brecha entre la predicción de ML y la evaluación de una casa de apuestas, lo que da la oportunidad de ganar. ¡Es un buen problema científico de datos para la ingeniería de características!

Problema de ML: clasificación
Algoritmos: clasificación
Datos: Sitio oficial del tenis profesional masculino | ATP World Tour | Tenis
Tecnologías: sklearn, scrapy
Implementación: aplicación web
Referencias: http://olbg.com , http://verifiedbets.com
Guías: Aprendizaje automático para la predicción de partidos de tenis profesionales

Predicción del precio de las acciones

Una aplicación popular de ML es la predicción de series de tiempo. Un motor de ciencia de datos puede predecir los tipos de cambio y las existencias, por lo que los operadores o bots pueden apostar según estas predicciones.

Si elige este problema, descubrirá que es fácil obtener esos datos y practicarlos. Este subdominio se deriva de la econometría y el aprendizaje automático clásico, por lo que debe estar listo para explorar un método de estadísticas.

Problema de ML: predicción de series de tiempo
Algoritmos: ARIMA, regresión
Tecnologías: sklearn, profeta, scrapy
Datos: Quandl
Implementación: aplicación web
Referencias: tablas de finanzas
Guías: una introducción al análisis de datos del mercado de valores con Python


Paso 2 :-

ir a google para trabajos y buscar el rol apropiado que desea Buscar trabajos – Google Careers

Complete su perfil en linkedin e interactúe con muchos científicos de datos y los reclutadores les preguntan qué espera la compañía de los científicos de datos

practicar problemas en kaggle, creo que esta es suficiente exposición para ti https://www.kaggle.com/

Paso 3:-

Compre 100 cocos, vaya al templo más cercano y ofrézcalo a su dios favorito

#OmSaiRam #OmSaiRam #OmSaiRam

Paso 4 :-

reza a dios por el trabajo

ps: – los pasos 3 y 4 son puro sarcasmo, pero en serio lo intentan. FUNCIONA

De hecho, acabo de crear una ruta de aprendizaje curada que describe cómo va la búsqueda de empleo en ciencia de datos y las estrategias óptimas de búsqueda de empleo que aprendí de los buscadores de empleo, reclutadores y gerentes de contratación de ciencias de datos. La ruta contiene muchos recursos diferentes que pueden ser útiles.

Si tuviera que resumirlo, sería ofrecer los siguientes consejos prácticos:

  1. Cree diferentes proyectos de ciencia de datos propios
  2. Sea activo en comunidades de ciencia de datos como Kaggle
  3. Cree un perfil y una marca en las reuniones y comunidades de ciencia de datos y úselo para diferenciarse como un excelente y ansioso solucionador de problemas con las habilidades técnicas y la aptitud para realizar trabajos de ciencia de datos
  4. Planifique las industrias y empresas para las que desea trabajar. Sé exigente e investiga al máximo todo. Ven preparado.
  5. Comuníquese de manera proactiva con los científicos de datos que trabajan para las empresas en cuestión y pídales que tomen un café con usted. Practica entrevistas informativas.
  6. Haga que las personas que ha conocido actúen como su referencia y pasos iniciales para las empresas de ciencia de datos.
  7. Comprenda lo que buscan los gerentes de contratación y prepárese, prepárese, prepárese para el proceso de entrevista de ciencia de datos.

¡Ojalá eso ayude!

(Por cierto, trabajo para una empresa que acaba de crear el primer campo de arranque en línea para garantizarle un trabajo de ciencia de datos o le devolvemos su dinero 🙂)

¿Se puede obtener una certificación, tal vez en un producto en particular? Eso calificaría el estudio que ha completado.

¿Existe un conjunto de datos público del que pueda extraer datos útiles que aún no se conocen? Publicaciones periódicas en, por ejemplo, LinkedIn, señalando alguna tendencia o estadística destacada sobre un conjunto de datos que tiene relevancia para la sociedad (por ejemplo, datos electorales) demostrarían públicamente sus habilidades.

La ciencia de los datos parece estar aún más llena de jerga que la tecnología en general, pero he oído decir que la mayoría de los algoritmos y técnicas con nombres elegantes son bastante simples de entender. ¿Quizás una serie de publicaciones (nuevamente, en LinkedIn, para asegurar una audiencia centrada en el trabajo) que expliquen cada una?

¡Buena suerte!

Gran pregunta Yo diría que su próximo paso sería ganar experiencia comercial. Yo mismo, después de completar mi doctorado, descubrí que esa era la última pieza del rompecabezas. También hice algunos cursos en línea después de mi doctorado. Hice un Bootcamp de Data Science donde el foco estaba trabajando en un proyecto que agregaría valor a la empresa y que luego podría usar como experiencia laboral para conseguir un trabajo.

También destacaría que la comunicación es realmente importante. Dos libros que encontré muy útiles para ayudarme a mejorar mis habilidades de comunicación son Just Listen y Crucial Conversations . Ambos le darán excelentes consejos y trucos que puede usar en su trabajo diario 🙂

Proyectos y educación. La mayoría de los trabajos requerirán una maestría o doctorado cuantitativo (creo que es el 85-90% de los científicos de datos que tienen esa formación) Si puede demostrar que tiene mucha experiencia, se reflejará bien, especialmente si no tiene la educación.