¿Qué idiomas debo saber para convertirme en científico de datos?

Ingles

R, Python, Scala, etc. son simples herramientas. El dominio de estos le hará un buen “conserje” de datos.

Sin embargo, explicar sus ideas posteriores a la janitación utilizando una forma no matemática / estadística le hará ganar clientes $ que están dispuestos a considerar su decisión e invertir.

Data Storytelling es lo que identifica a un científico de datos de unicornio de un “conserje” / analista de datos ordinario.

Debe empaquetar adecuadamente las ideas utilizando Narrativas , Imágenes y Datos para generar la combinación correcta de explicación , compromiso e iluminación para realmente causar cualquier cambio en la perspectiva de sus clientes.

De lo contrario, todo el objetivo de la ciencia de datos se vuelve inútil. Período.

Para comenzar como Data Scientist, uno debe conocer Python, Scala y R. No hay idiomas “más ricos” cuando se trata de Data Science. Varios idiomas son conocidos por sus cualidades específicas.

Para realizar cargas de trabajo de producción en conjuntos de datos que deben ejecutarse en varias máquinas: Scala / Spark.

Para bases de código que son pequeñas y para un buen análisis estadístico y para Deep Learning– Python.

Para un análisis exploratorio impresionante: R.

Para entornos basados ​​en alto rendimiento y resultados más rápidos: C ++

R o Python (con NumPy, Pandas, Matplotlib, scikit-learn, statsmodels modules). El nuevo participante es Julia

El científico de datos y el desarrollador de bases de datos son trabajos diferentes.

Como desarrollador de bases de datos, definitivamente querrás saber SQL. Ese es el lenguaje que usará para configurar, modificar y extraer datos de la base de datos.

Como científico de datos, es útil conocer SQL, pero es probable que desee comenzar con Python o R. Python y R se utilizan para analizar y visualizar datos una vez que están fuera de la base de datos.

Python sería el primero.

R segundo.

Pregunta extraña, pero R o Python