Cómo prepararse para una pasantía en ciencia de datos

Para un puesto inicial en Data Science, como pasante, al menos debe tener sus estadísticas básicas y conceptos de programación borrados.

Si sus estadísticas básicas son irregulares, considere revisar el material de estadísticas en la Academia Khan, puede pasar a leer Introducción al aprendizaje estadístico.

En cuanto a la elección de la programación, puede optar por Python o R, la tendencia de la industria se está moviendo hacia Python, pero gran parte del trabajo aún se realiza bajo R.
Ayudará a verificar la pila de tecnología de compañías específicas si tiene algo en mente, la elección del idioma no es tan importante, sería fácil cambiar de uno a otro e idealmente debería saber que ambos avanzan en tu carrera en el campo.

Recomiendo encarecidamente tomar Harvard’s Open Class CS109 Data Science (usa Python). Te lleva en un viaje de ciencia de datos desde la implementación de probabilidad básica hasta las técnicas intermedias de aprendizaje automático. También tiene tareas asignadas para ensuciarse las manos con el código que lleva lo que aprende en las conferencias a cómo realmente resolverá los problemas del mundo real. Resuélvalos como lo haría si lo estuviera tomando en su Uni.

También hay una gran clase de Stanford llamada Introducción al aprendizaje estadístico (por los autores del famoso libro del mismo nombre). Aprendizaje estadístico

Solo mantén un fuerte control sobre tus conceptos básicos y no te preocupes demasiado, una pasantía está destinada principalmente a aprender y contribuir un poco a la organización mientras estás en ello. 🙂

Lo dividiré en 4 recomendaciones principales.

  1. Aprende algo de Python. Un montón de tutoriales en línea. Necesitas precisar los fundamentos. Python es bastante amigable para principiantes. Si tienes tiempo y quieres profundizar, prueba esta Introducción al Curso de programación de Python | Udacity
  2. Familiarícese con el entorno Linux. Aquí hay un excelente curso que tomaría ~ 6 horas. Configuración de servidores web Linux | Udacity
  3. Aprenda SQL (el lenguaje de consulta estructurado) y cómo se estructuran las bases de datos relacionales. Las bases de datos populares incluyen MySQL / Postgres. La mayoría de los sitios / aplicaciones más grandes del mundo usan algún tipo de base de datos.
  4. Se asegura de que su fondo de estadísticas sea sólido como una roca. Si se está especializando en economía, probablemente habrá completado algunos cursos de matemáticas que se sumergieron en estadísticas / modelado. Revisa esas notas si puedes para ayudarte a refrescar tu memoria, sinergizará bien con todo.
  5. Juega con algunos datos abiertos, crea algunos modelos y visualiza algunas ideas. Pon todo eso en un blog junto con una buena reseña.

Fuente: Liderar el equipo de análisis de datos en OneClass. Entrevisté a múltiples candidatos para pasantías de análisis de datos.

Data Science es un vasto dominio. Requiere una mezcla de habilidades multidisciplinarias que van desde una intersección de matemáticas, estadística, informática, comunicación y negocios.

Siendo un profesional de Data Science, puedo recomendar los mejores cursos disponibles, que lo prepararán de manera constructiva para descifrar pasantías en el dominio correspondiente.

No solo pasantías, los cursos le permiten obtener un trabajo como Data Scientist también.

Aquí hay una lista que puede seguir para alcanzar su objetivo:

  1. Aprenda la programación Python Python : lo ayudará a adquirir experiencia en análisis cuantitativo, minería de datos y presentación de datos para ver más allá de los números al transformar su carrera en el rol de Científico de Datos. Aprenderá a usar bibliotecas como Pandas, Numpy, Matplotlib, Scipy, Scikit, Pyspark y dominará conceptos como aprendizaje automático de Python, scripts, secuencia, raspado web y análisis de grandes datos aprovechando Apache Spark. A continuación se muestra el curso, puede ir para dominar Python: Curso de certificación de Python | Entrenamiento Python | Edureka
  2. Ciencia de datos con Python: este curso de ciencia de datos en Python lo ayuda a adquirir experiencia en varios algoritmos de aprendizaje automático, como regresión, agrupación, árboles de decisión, bosque aleatorio, Naïve Bayes y Q-Learning. Lo expone a conceptos de estadísticas, series temporales y diferentes clases de algoritmos de aprendizaje automático, como algoritmos supervisados, no supervisados ​​y de refuerzo. A lo largo del curso de certificación de ciencia de datos, resolverá estudios de casos de la vida real en los medios, la atención médica, las redes sociales, la aviación, los recursos humanos: Edureka

Espero que esto ayude. Feliz aprendizaje..!!

Para prepararse para la pasantía de ciencia de datos, debe comenzar con los conceptos centrales de la ciencia de datos, como las bahías ingenuas, el agrupamiento de k-medias y el análisis predictivo. Una vez que esté familiarizado con estos conceptos, pase a las partes de análisis y programación, como conectar R con Hadoop, Apache Mahout, algoritmos de aprendizaje automático, etc.

Sin embargo, simplemente obtener conocimiento teórico no es suficiente, ya que necesitará experiencia práctica en todos los aspectos anteriores. Para esto, debe inscribirse en el curso de capacitación en Ciencias de datos que están disponibles en línea.

Intellipaat es un instituto que proporciona un conocimiento y una experiencia exhaustivos en Conceptos de ciencia de datos a través de clases interactivas, prácticas de laboratorio, proyectos en tiempo real y cuestionarios. También podrá calificar para la certificación de Data Scientist de Cloudera, que es altamente valorada por las principales empresas multinacionales. Además, obtener la certificación de Intellipaat equivale a seis meses de experiencia industrial.

Vea el siguiente video para obtener más información:

Para prepararse para la pasantía de ciencia de datos, debe comenzar con los conceptos centrales de la ciencia de datos, como las bahías ingenuas, el agrupamiento de k-medias y el análisis predictivo. Una vez que esté familiarizado con estos conceptos, pase a las partes de análisis y programación, como conectar R con Hadoop, Apache Mahout, algoritmos de aprendizaje automático, etc.

Sin embargo, simplemente obtener conocimientos teóricos no es suficiente, ya que necesitará experiencia práctica en todos los aspectos anteriores. Para esto, debe inscribirse en el curso de capacitación en Ciencias de datos que están disponibles en línea. Intellipaat es uno de esos institutos que proporciona un conocimiento y experiencia exhaustivos en Conceptos de Ciencia de Datos a través de clases interactivas, prácticas de laboratorio, proyectos en tiempo real y cuestionarios. También podrá calificar para la certificación de Data Scientist de Cloudera, que es altamente valorada por las principales empresas multinacionales. Además, obtener la certificación de Intellipaat equivale a seis meses de experiencia industrial.

Vea el siguiente video para obtener más información:

Realice el curso de capacitación de Intellipaat Data Science:

https://intellipaat.com/data-sci