La respuesta a esta pregunta es similar a una más genérica. “¿Cómo puedo saber si soy un apasionado de X?” (X es cualquier sujeto)
Y la respuesta, como era de esperar, resulta ser: “Encontrarás acerca de X al intentarlo y practicarlo”.
Caminos al mundo de los datos
Aquí hay algunos caminos para comenzar:
- ¿Cuáles son algunas calificaciones o certificados que puede obtener un analista de datos / científico de datos?
- ¿Cómo resolvería un científico de datos este problema comercial?
- ¿Qué hace un científico de datos como su rol funcional?
- Además de los sistemas de recomendación, ¿cuáles son los productos finales típicos que los científicos de datos podrían ofrecer?
- Cuando los científicos de datos tienen su propio equipo, ¿cómo las empresas les ayudan efectivamente a comunicarse y contribuir a los equipos de características y productos?
- Un punto de partida podría ser trabajar para mejorar una herramienta existente de Data Science. Por ejemplo, puede trabajar en la implementación de nuevas características en el proyecto scikit-learn (es una biblioteca de aprendizaje automático de uso general en Python).
- También puede obtener algunos datos de cualquier fuente disponible públicamente (las principales empresas tienen API de acceso libre y puede encontrar fácilmente conjuntos de datos gratuitos en línea). Juega un poco con estos datos. Construye un sistema de recomendación. Predecir algunos resultados. Graficar los datos y detectar algunos patrones. Y muchas otras cosas que hacer.
- Participa en los desafíos de Data Science. Kaggle es una gran plataforma para trabajar en problemas del mundo real (o al menos una versión cercana) y aprender nuevas técnicas de Machine Learning.
- Otro camino hacia una carrera de Data Science sería realizar una pasantía / trabajo en una empresa donde los datos son activos valiosos (cualquier empresa móvil o basada en la web hoy en día, por ejemplo). Tenga la seguridad de que manejará los datos y, tarde o temprano, aprenderá algunas de las técnicas de un gran científico de datos: recopilar, preprocesar, transformar, modelar, visualizar e informar datos.
- Finalmente, puede comenzar tomando algunos cursos gratuitos en línea (Coursera es un proveedor famoso) y leyendo entradas de blog sobre temas de Data Science (FiveThirtyEight es un excelente blog orientado a datos). También puede seguir a las personas en Twitter, leer libros e incluso comenzar su propio blog sobre Data Science.
Conclusión
Como puede ver, las posibilidades son infinitas. Simplemente pruebe algunas de las rutas mencionadas anteriormente. Ve si funciona para ti. Quédese lo suficiente como para tener una idea de si solo le atrae la ‘palabra de moda’ (una palabra inventada) del campo o si es un verdadero amante de los datos.
¡Que te diviertas!
Para ir más lejos, puede leer algunas de mis respuestas sobre Data Science:
- La respuesta de Yassine Alouini a ¿Cómo puedo convertirme en científico de datos?
- La respuesta de Yassine Alouini a ¿Qué cursos deben tomarse para un programa de maestría en minería de datos y análisis de big data?
- La respuesta de Yassine Alouini a ¿Qué puede crear un científico de datos en 1 hora, 1 día, 1 semana o 1 mes? ¿Qué problemas pueden abordar? ¿Qué herramientas usarían?
Como de costumbre, algunas fuentes para comenzar:
Proyectos de código abierto
- Sitio web del proyecto Scikit-learn: scikit-learn: aprendizaje automático en Python
- Repositorio de GitHub de Scikit-learn : scikit-learn / scikit-learn
- Sitio web del proyecto Pandas: Python Data Analysis Library
Fuentes de datos
- API de Twitter: API REST | Desarrolladores de Twitter
- Una utilidad de carga de conjuntos de datos de scikit-learn: 5. Utilidades de carga de conjuntos de datos
Blogs
- Sitio web de FiveThirtyEight : FiveThirtyEight
- Blog de Kaggle: sin presentimiento gratis
- Un gran blog de Machine Learning: FastML
- Según lo sugerido por Ahmed Besbes: Adil Moujahid // Data Analytics y más
Libros
- Un gran libro sobre Data Analyysic en Python: Python for Data Analysis
- Un libro interesante sobre algunas aplicaciones de inferencia, estadística y aprendizaje automático para sujetos de la vida real: La señal y el ruido: por qué fallan tantas predicciones, pero algunas no: Nate Silver: 9780143125082: Amazon.com: Libros
Cursos online
- El famoso curso de Machine Learning de Coursera: https://www.coursera.org/learn/m…
- Una pista de especialización de ciencia de datos en Coursera: https://www.coursera.org/special…
- Aprenda ciencia de datos en su navegador: aprenda ciencia de datos en línea, gratis