Cómo saber si realmente me apasiona la ciencia de datos / análisis de datos

La respuesta a esta pregunta es similar a una más genérica. “¿Cómo puedo saber si soy un apasionado de X?” (X es cualquier sujeto)

Y la respuesta, como era de esperar, resulta ser: “Encontrarás acerca de X al intentarlo y practicarlo”.


Caminos al mundo de los datos

Aquí hay algunos caminos para comenzar:

  • Un punto de partida podría ser trabajar para mejorar una herramienta existente de Data Science. Por ejemplo, puede trabajar en la implementación de nuevas características en el proyecto scikit-learn (es una biblioteca de aprendizaje automático de uso general en Python).
  • También puede obtener algunos datos de cualquier fuente disponible públicamente (las principales empresas tienen API de acceso libre y puede encontrar fácilmente conjuntos de datos gratuitos en línea). Juega un poco con estos datos. Construye un sistema de recomendación. Predecir algunos resultados. Graficar los datos y detectar algunos patrones. Y muchas otras cosas que hacer.
  • Participa en los desafíos de Data Science. Kaggle es una gran plataforma para trabajar en problemas del mundo real (o al menos una versión cercana) y aprender nuevas técnicas de Machine Learning.
  • Otro camino hacia una carrera de Data Science sería realizar una pasantía / trabajo en una empresa donde los datos son activos valiosos (cualquier empresa móvil o basada en la web hoy en día, por ejemplo). Tenga la seguridad de que manejará los datos y, tarde o temprano, aprenderá algunas de las técnicas de un gran científico de datos: recopilar, preprocesar, transformar, modelar, visualizar e informar datos.
  • Finalmente, puede comenzar tomando algunos cursos gratuitos en línea (Coursera es un proveedor famoso) y leyendo entradas de blog sobre temas de Data Science (FiveThirtyEight es un excelente blog orientado a datos). También puede seguir a las personas en Twitter, leer libros e incluso comenzar su propio blog sobre Data Science.

Conclusión

Como puede ver, las posibilidades son infinitas. Simplemente pruebe algunas de las rutas mencionadas anteriormente. Ve si funciona para ti. Quédese lo suficiente como para tener una idea de si solo le atrae la ‘palabra de moda’ (una palabra inventada) del campo o si es un verdadero amante de los datos.

¡Que te diviertas!

Para ir más lejos, puede leer algunas de mis respuestas sobre Data Science:

  • La respuesta de Yassine Alouini a ¿Cómo puedo convertirme en científico de datos?
  • La respuesta de Yassine Alouini a ¿Qué cursos deben tomarse para un programa de maestría en minería de datos y análisis de big data?
  • La respuesta de Yassine Alouini a ¿Qué puede crear un científico de datos en 1 hora, 1 día, 1 semana o 1 mes? ¿Qué problemas pueden abordar? ¿Qué herramientas usarían?

Como de costumbre, algunas fuentes para comenzar:

Proyectos de código abierto

  • Sitio web del proyecto Scikit-learn: scikit-learn: aprendizaje automático en Python
  • Repositorio de GitHub de Scikit-learn : scikit-learn / scikit-learn
  • Sitio web del proyecto Pandas: Python Data Analysis Library

Fuentes de datos

  • API de Twitter: API REST | Desarrolladores de Twitter
  • Una utilidad de carga de conjuntos de datos de scikit-learn: 5. Utilidades de carga de conjuntos de datos

Blogs

  • Sitio web de FiveThirtyEight : FiveThirtyEight
  • Blog de Kaggle: sin presentimiento gratis
  • Un gran blog de Machine Learning: FastML
  • Según lo sugerido por Ahmed Besbes: Adil Moujahid // Data Analytics y más

Libros

  • Un gran libro sobre Data Analyysic en Python: Python for Data Analysis
  • Un libro interesante sobre algunas aplicaciones de inferencia, estadística y aprendizaje automático para sujetos de la vida real: La señal y el ruido: por qué fallan tantas predicciones, pero algunas no: Nate Silver: 9780143125082: Amazon.com: Libros

Cursos online

  • El famoso curso de Machine Learning de Coursera: https://www.coursera.org/learn/m…
  • Una pista de especialización de ciencia de datos en Coursera: https://www.coursera.org/special…
  • Aprenda ciencia de datos en su navegador: aprenda ciencia de datos en línea, gratis

¿Le gustaría trabajar en el campo de la ciencia de datos si:

  1. ya no es genial ?
  2. ¿No se paga tan bien como otras posiciones mejores ?
  3. fallas a menudo con tus proyectos / problemas difíciles?
  4. la gente a tu alrededor no aprecia lo que haces?

Si respondiste que sí a las preguntas anteriores, diría que te apasiona la ciencia de datos, 🙂

Los cómics de lápices zen sobre Robert Goddard ilustran la pasión magníficamente:

Tienes tu respuesta dentro de tus proyectos fuera de línea de preguntas. En serio, la única forma de saberlo con certeza es experimentarlo de una manera de bajo riesgo. Además, el análisis de datos puede ser un verdadero dolor en el culo: solo del 10 al 15% es REALMENTE sexy. La mayoría de las veces está limpiando los datos y / o configurando la infraestructura adecuada. Es una prueba de paciencia, no todo es mágico como con lo que trabaja Tony Stark. (Aunque parece MÁGICO para los espectadores cuando les presento una aplicación que puede predecir cuáles de sus miembros inactivos terminarán siendo clientes de pago)
La mayoría de las veces es cortar cebollas, el plato final puede ser un sabroso biryani, pero solo tú sabes cuánto tiempo y lágrimas pasaste cortando las cebollas 😉

Hágase estas preguntas:

  1. ¿Te encuentras analizando procesos y acciones de empresas y colegas?
  2. ¿Te sientes frustrado o molesto cuando los procesos a tu alrededor no van tan bien como se esperaba?
  3. ¿A menudo piensas que si solo hicieras X o Y podrías mejorarlos mucho?
  4. ¿Le gusta resolver problemas y encontrar formas innovadoras / eficientes de resolver estos problemas?
  5. ¿Encuentra que las soluciones a menudo involucran sistemas automatizados y, por lo tanto, datos y ciencia de datos?

Si respondió afirmativamente a todas las preguntas anteriores, es probable que le apasione la ciencia de datos y ser un científico de datos …

No te juzgues por alguien más o por lo que ellos quieren. A quién le importa lo que quieren.
¿Eres bueno en eso?
¿Empiezas a trabajar en un problema y todo el tiempo desaparece?
¿Te gusta decirle a alguien cómo resolviste un problema?
¿Tratas de decirle a tu mamá o papá en qué estás trabajando, hablar tan rápido que hiperventilas y casi te desmayas y se quedan mirando con una mirada perpleja hasta que les dices que son “cosas de matemáticas y computadora”?

Entonces no te preocupes y a quién le importa. Puede agotarse en 10 o 20 años, pero tendrá una gran base de habilidades y muchas opciones para cambiar a otra cosa.

le gusta la programación, las estadísticas, los negocios y la resolución de desafíos utilizando datos.

Le motiva ver resultados y mejoras en la forma en que se hacen las cosas y siente pasión por los softwares y marcos de código abierto.

¿Importa la razón por la que quieres perseguirlo?

Si te gusta ahora: persíguelo. Si luego cambias de opinión: que así sea: cambia tu carrera de acuerdo a esto.

Ya has expresado una pasión por eso, y te creo. Hay una gran necesidad de personas con buenos datos, no importa si es zumbido o no. Sería diferente si quisieras ser un empleado del servicio postal.

http://www.bls.gov/emp/ep_table_

More Interesting

¿Qué característica es más importante para un científico de datos: habilidades de codificación o habilidades de comunicación?

¿En qué se parecen o difieren los deberes de los investigadores cuantitativos de la experiencia del usuario con los deberes de los científicos de datos que se centran en el análisis (en lugar de los científicos de datos que se centran en la construcción)?

¿Cuánto dinero ganan los científicos de datos y cuál es la trayectoria profesional de los científicos de datos?

¿Puedo convertirme en un científico de datos autodidacta?

¿Qué tipo de científicos de datos se emplearán siempre, incluso durante las caídas del mercado? ¿Es la única forma de lograr la seguridad laboral en tecnología siendo tan bueno que en el instante en que no esté satisfecho con su trabajo, otra compañía lo recibirá con los brazos abiertos?

¿Cómo hace un aspirante a científico de datos para encontrar un mentor?

Como científico de datos, ¿te acaban de dar los datos? En caso afirmativo, ¿en qué formato se suele dar? Si no se le proporcionan los datos, ¿cómo los recupera? ¿Cuáles son sus primeros pasos cuando se adquieren los datos?

¿Cuáles son las habilidades necesarias para convertirse en un científico de datos?

¿Qué lenguajes de bases de datos se deben aprender para convertirse en científicos de datos?

¿Es el mejor camino para convertirse en un ingeniero de ML / Data Scientist para enfocarse en convertirse primero en un desarrollador de software (para alguien sin experiencia en estadísticas o programación)?

¿Qué tan fácil / difícil es conseguir un trabajo en los Estados Unidos mientras se está fuera del país? Tengo una tarjeta verde y una sólida formación en tecnología / consultoría. No quiero dejar mi concierto actual hasta que consiga uno bueno allí. ¿Alguien puede compartir su experiencia?

¿Qué herramientas utilizan los científicos de datos para presentaciones profesionales (por ejemplo, diagramas, gráficos, diagramas de flujo, etc.)?

¿Cuál es la vida de un 'científico de datos' en la India que tenía experiencia de 5 años o más? ¿Me refiero a la carga de trabajo diaria en las bases diurnas?

Estoy haciendo un doctorado en aprendizaje automático. ¿Podría ser considerado como un científico de datos después?

¿Existe alguna posición en el aprendizaje automático y los grandes datos donde uno no tiene que escribir códigos? Alguien más lo hará, solo desarrollas la teoría.