Por el nombre “Data Scientist” en sí mismo, debe comprender y sentir los datos. Para ello, necesita cierto conjunto de habilidades técnicas que le proporcionarán la experiencia técnica y la intuición para analizar los datos. Una vez que obtenga estas habilidades y pueda usar su intuición y conocimiento para descubrir tendencias en los datos y encontrar patrones en ellos.
Déjame dividir esto en viñetas.
- Estadística básica: necesita tener un buen conocimiento estadístico para comprender los datos. Aprender sobre la media, la mediana, los diseños experimentales y otros conceptos. Esto parece una buena fuente. Introducción a los conceptos básicos
- Técnicas avanzadas de modelado estadístico: aprenda sobre el ajuste de curvas, la regresión (lineal / multivariada / logística / lazo / cresta) y las técnicas de predicción utilizando estos modelos estadísticos. Fuente de ejemplo: Estadísticas avanzadas, 5 técnicas de estadísticas avanzadas y cuándo usarlas
- R: R es una fuente abierta y una de las técnicas más populares en términos de modelado estadístico. Le ayudará a simular su modelo y aplicar técnicas estadísticas. También le ayuda a visualizar los resultados pronosticados de su modelo
- Python: si eres bueno programando, también puedes aprender Python, ya que puedes usarlo independientemente o en combinación con R.Python proporciona algunos buenos conjuntos de bibliotecas de aprendizaje automático como scikit-learn.
- Minería de datos y conceptos relacionados: le ayuda a descubrir patrones y tendencias en grandes conjuntos de datos. Es la intersección de la inteligencia artificial, el aprendizaje automático, las estadísticas y los sistemas de bases de datos. Fuente: Minería de datos – Wikipedia
- Herramientas de visualización: junto con una habilidad para desarrollar un modelo de predicción e identificar tendencias, un científico de datos debe poder visualizar sus datos finales. Para ello, puede aprender algunas herramientas como Tableau Public, D3.js – Documentos basados en datos), RAWGraphs dependiendo de su nivel de experiencia.
Además de esto, he encontrado que los siguientes sitios web son una buena fuente para aprender personalmente.
- ¿Debo ingresar a consultoría tecnológica, análisis de datos, desarrollo de software o gestión de productos?
- ¿Cuál es el futuro de la ciencia de datos?
- Cómo comenzar mi carrera como científico de datos desde un gerente de TI (implementación de ERP)
- Estoy haciendo un doctorado en aprendizaje automático. ¿Podría ser considerado como un científico de datos después?
- Soy un científico de datos con 15 años de experiencia en el campo. Siempre clavo las estadísticas y la parte de aprendizaje automático de las entrevistas, pero fallo miserablemente con CS y preguntas de algoritmos. ¿Cuál es un buen punto de partida para ser decente?
STAT 497C – ¡Temas en lenguaje estadístico R!
https: //onlinecourses.science.ps…
¡Bienvenido a STAT 510!
Minería de datos aplicados y aprendizaje estadístico (Imp)
¡Bienvenido a STAT 897D!
¡Bienvenidos! El | STAT 414/415
Estadísticas aplicadas
https: //onlinecourses.science.ps…
Análisis multivariado aplicado
¡Bienvenido a STAT 505!
Diapositivas de minería de datos
material.html