Bueno, el analista de datos también hace cosas similares, como un científico de datos. La única diferencia radica en el dominio de las habilidades.
Si calificamos el nivel de competencia (P0 -> P5 con P5 como el más alto) para ambos roles es el siguiente:
Analista de datos (experiencia entre 1 y 3 años) –
- ¿Cómo es útil Microsoft Azure para los científicos de datos?
- ¿Cuál es la naturaleza del trabajo que uno termina haciendo después de completar un curso de maestría como maestro de CMU de ciencia de datos computacionales u otros cursos de ciencias de datos?
- ¿Qué herramientas pueden hacer que los científicos de datos sean más productivos?
- ¿Un INFJ disfrutaría de una carrera como científico de datos? ¿Por qué?
- ¿Cómo convertirse en un científico de datos? ¿Qué debo estudiar y en qué universidades?
- SQL: nivel P2 / P3
- R: P1
- Python: P0 o no requerido
- Estadísticas: P1
- Visualización de datos – Tableau: P2
- Conocimiento empresarial: P2
- Diversidad de proyectos: P2
Científico de datos (experiencia entre 3 y 7 años) –
- SQL: nivel P3
- R: P4
- Python: P3
- Estadísticas: P4
- Visualización de datos – Tableau: P3
- Conocimiento empresarial: P2
- Diversidad de proyectos: P4
A continuación se detallan los pasos por los cuales el analista de datos puede alcanzar el nivel de un verdadero científico de datos:
El conocimiento de SQL se puede aumentar fácilmente mediante la práctica. Intente escribir consultas anidadas más que crear varias tablas. Mejorará tu capacidad de codificación.
R / Python / Statistics están interconectadas: para mejorar la competencia en esto, debe invertir tiempo trabajando en proyectos de muestra o trabajando en proyectos reales en el trabajo. El conocimiento de R & Python se puede mejorar tomando cursos en Coursera y también trabajando en proyectos de muestra mediante codificación.
Quizás esta respuesta pueda ayudarlo: la respuesta de Puneet Verma a En qué orden se deben aprender las herramientas de análisis de datos, a saber. R, Python, Hadoop, Tableau, SQL?)
Regístrese en Kaggle y descargue conjuntos de datos de muestra de las industrias en las que desea trabajar. No necesita competir con otros. Se trata de construir tu conocimiento. Así que tómate el tiempo que quieras.
Lo siguiente es desarrollar conocimiento en la aplicación de Analytics : esto no solo preparará conjuntos de habilidades en R / Python sino también en la diversidad de proyectos. Recuerde para un científico de datos que la diversidad de su proyecto es muy importante. Por ejemplo, algunos de los proyectos de muestra que se esperan de un científico de datos son:
- Agrupación – K significa
- Análisis factorial
- Predicción usando regresión lineal, ARIMA, modelos multiplicativos
- Modelos predictivos de abandono / desgaste utilizando regresión logística
- Carro / Chaid
- Raspado web
- Crear mapas de calor en R
- Análisis de los sentimientos
- Análisis de la canasta de mercado
- Construyendo algoritmos de recomendación
- Proyectos sobre aprendizaje supervisado y aprendizaje no supervisado
Debe tener conocimientos de estadísticas y codificación en R / Python para los proyectos anteriores. También trabaje en la creación de conocimiento según su industria. Supongamos que solicita un puesto en Analytics Retail / Ecommerce. Lluvia de ideas e investigación sobre las aplicaciones de Analytics en Retail / Ecommerce. Ejemplo a continuación
- La previsión de la demanda es una aplicación muy importante en el sector minorista: estudie al respecto. Descargue conjuntos de datos de muestra y cree modelos de regresión lineal / ARIMA en R para predecir la demanda
- Segmentación del cliente: investigue y aplique técnicas como la agrupación K-means para tener una idea al respecto
- Análisis de precios: encontrará muchos proyectos de muestra en Internet en este
Comprender la aplicación de matemáticas / herramientas / estadísticas es muy importante. R-bloggers es un buen lugar donde puedes encontrar muchos escenarios de casos de uso.