Acabo de solicitar estudios de posgrado en CS pero no tengo conocimiento previo. ¿Qué habilidad debo aprender para prepararme para una carrera como científico de datos?

Por el nombre “Data Scientist” en sí mismo, debe comprender y sentir los datos. Para ello, necesita cierto conjunto de habilidades técnicas que le proporcionarán la experiencia técnica y la intuición para analizar los datos. Una vez que obtenga estas habilidades y pueda usar su intuición y conocimiento para descubrir tendencias en los datos y encontrar patrones en ellos.

Déjame dividir esto en viñetas.

  • Estadística básica: necesita tener un buen conocimiento estadístico para comprender los datos. Aprender sobre la media, la mediana, los diseños experimentales y otros conceptos. Esto parece una buena fuente. Introducción a los conceptos básicos
  • Técnicas avanzadas de modelado estadístico: aprenda sobre el ajuste de curvas, la regresión (lineal / multivariada / logística / lazo / cresta) y las técnicas de predicción utilizando estos modelos estadísticos. Fuente de ejemplo: Estadísticas avanzadas, 5 técnicas de estadísticas avanzadas y cuándo usarlas
  • R: R es una fuente abierta y una de las técnicas más populares en términos de modelado estadístico. Le ayudará a simular su modelo y aplicar técnicas estadísticas. También le ayuda a visualizar los resultados pronosticados de su modelo
  • Python: si eres bueno programando, también puedes aprender Python, ya que puedes usarlo independientemente o en combinación con R.Python proporciona algunos buenos conjuntos de bibliotecas de aprendizaje automático como scikit-learn.
  • Minería de datos y conceptos relacionados: le ayuda a descubrir patrones y tendencias en grandes conjuntos de datos. Es la intersección de la inteligencia artificial, el aprendizaje automático, las estadísticas y los sistemas de bases de datos. Fuente: Minería de datos – Wikipedia
  • Herramientas de visualización: junto con una habilidad para desarrollar un modelo de predicción e identificar tendencias, un científico de datos debe poder visualizar sus datos finales. Para ello, puede aprender algunas herramientas como Tableau Public, D3.js – Documentos basados ​​en datos), RAWGraphs dependiendo de su nivel de experiencia.

Además de esto, he encontrado que los siguientes sitios web son una buena fuente para aprender personalmente.

STAT 497C – ¡Temas en lenguaje estadístico R!

https: //onlinecourses.science.ps…

¡Bienvenido a STAT 510!

Minería de datos aplicados y aprendizaje estadístico (Imp)

¡Bienvenido a STAT 897D!

¡Bienvenidos! El | STAT 414/415

Estadísticas aplicadas

https: //onlinecourses.science.ps…

Análisis multivariado aplicado

¡Bienvenido a STAT 505!

Diapositivas de minería de datos

material.html

Ahora..

Puede comenzar con Python o R (lenguajes de programación). Hay muchos cursos maravillosos en línea sobre ambos en términos de ciencia de datos. Esta es la parte técnica.

Para tener una mejor comprensión o alguna comprensión de lo que está haciendo, debe comenzar a leer libros sobre estadísticas O, al menos, leer todo lo que pueda para lo que quiere hacer.

Por ejemplo, desea utilizar la regresión logística para predecir la probabilidad de que una persona tenga cáncer de pulmón o algo así.

¿Qué es una regresión logística? ¿Como funciona? ¿Cuáles son las fórmulas detrás de esa cosa? ¿Qué tipo de información necesito para que funcione correctamente? ¿Qué es un modelo de regresión? ¿Cómo sé si mi modelo es el mejor posible con los datos que tengo? ¿Cómo elijo el mejor modelo? ¿Qué busco?

Después de comprender todo lo que hay que entender sobre lo que desea hacer, busque su implementación, ya sea en R o Python, SAS, Matlab o cualquier otro software.

En conclusión…

Debería elegir 1 herramienta (digamos R) y mantenerla al menos al principio.

Debe aprender a investigar cosas que no conoce y dónde encontrar la información que necesita. Puede sonar obvio, pero muchas personas no saben cómo hacerlo a pesar de que a veces es tan simple como escribir su pregunta en Google.

Hay algunas comunidades realmente agradables que se ocupan de Data Science: creo que la más grande es stackoverflow y crossvalidated.

More Interesting

¿Qué información sobre BI puedo proporcionar a un propietario de clubes nocturnos como científico de datos?

Cómo conseguir un trabajo de Data Scientist de BITS Pilani

Como científico de datos, ¿te acaban de dar los datos? En caso afirmativo, ¿en qué formato se suele dar? Si no se le proporcionan los datos, ¿cómo los recupera? ¿Cuáles son sus primeros pasos cuando se adquieren los datos?

¿Cuáles son algunas buenas maneras de comenzar una carrera como científico de datos?

La mayoría de las empresas requieren una maestría o doctorado para científicos de datos o ingenieros de aprendizaje automático, pero la mayoría de los recursos están disponibles en línea. ¿Debo ir a la universidad para hacer una maestría o continuar aprendiendo en línea y buscar trabajo con mi título universitario?

¿Qué elementos de SQL necesitan saber los científicos de datos?

¿Qué oportunidades de carrera en ciencia de datos y aprendizaje automático hay en Redfin?

¿Podría comparar la ciencia de los datos y la informática, las complejidades de cada una, las perspectivas profesionales futuras y las trayectorias profesionales en consecuencia? ¡Gracias!

¿Qué compañías ofrecen trabajo de científico de datos en Hyderabad?

¿Puedo convertirme en un científico de datos autodidacta?

¿Cuál es el salario de los trabajos de ciencia de datos?

Estoy haciendo el curso a tiempo parcial de ciencia de datos de la Asamblea General (Londres) en 5 meses. ¿Qué puedo hacer de antemano para estar lo más preparado posible?

¿Qué oportunidades de carrera en ciencia de datos y aprendizaje automático existen en Microsoft?

¿Qué tan buenas son las perspectivas de carrera, después de hacer un MSC en Estadística del Reino Unido? ¿Volver a la India después del curso es la elección correcta?

¿Cuál es la mejor manera de prepararse para un trabajo como científico de datos a tiempo completo?