¿Desde dónde empezar a aprender a convertirse en un científico de datos?

Para darle una idea de lo que hacen los científicos de datos y qué conjunto de habilidades se necesita para ser uno, explicaré un poco. Esto debería darle un camino claro en términos de lo que debe estudiar y qué enfoque debe seguir para ser un Científico de Datos.

Científicos de datos: estos profesionales utilizan sus habilidades estadísticas, matemáticas, de aprendizaje automático y analíticas para convertir los datos sin procesar en información procesable. La ciencia de datos implica un nivel muy alto de análisis de datos. Los científicos de datos tienen un gran sentido comercial y son tomadores de decisiones muy hábiles.

El rol de trabajo de un Científico de Datos puede abarcar diferentes responsabilidades dependiendo de los requisitos y la naturaleza de la empresa. Por ejemplo, un proveedor de servicios de red móvil se ocupará principalmente de los datos de los usuarios móviles, mientras que una empresa financiera dependerá en gran medida de los datos de los servicios financieros. Por lo tanto, los científicos de datos de ambas empresas se ocuparán de datos pero de naturaleza variada.

Las principales responsabilidades de un científico de datos en cada configuración siguen siendo las mismas.

Habilidades y herramientas:

R, Scala, Apache Spark, Hadoop, Machine Learning, Python, etc.

Siga leyendo aquí para saber qué hacen los científicos de datos: http://bit.ly/2h156dm

http://bit.ly/2haJyda

Cómo convertirse en un científico de datos:

Para ser un Científico de Datos, antes que nada debes mirar tu formación académica. Necesitas una formación en Matemáticas y estadística. Además, debe ser bueno en razonamiento lógico, aptitud y habilidades de comunicación. Además, ser imaginativo y curioso para aprender más es la cualidad básica de los científicos de datos. Puede tomar cursos de certificación en línea sobre ciencia de datos, aprendizaje automático, programación y codificación, etc. y obtener la certificación. Coursera y edX son útiles para tales cursos. Pero tenga en cuenta que tomar estos cursos no garantiza ninguna colocación, aunque es posible que lo contraten, pero es solo una posibilidad.

Estas son algunas de sus opciones si desea inscribirse en un curso de ciencia de datos:

  • Manipal ProLearn
  • AnalytixLabs
  • Edureka
  • Upgrad
  • IMS Pro School
  • INSOFE
  • Simplilearn

Puede optar por el programa residencial de 11 meses ofrecido por Manipal ProLearn. Se brindan oportunidades de pasantía junto con asistencia de colocación para completar con éxito el curso.

Dada la inmensidad de Data Science, siempre recomendó formar una base sólida. Por mi parte, creo firmemente en el dicho. “Más profundas las raíces, más altos crecen los árboles”. Matemáticas, estadísticas y programación forman la base de la ciencia de datos. Por lo tanto, a menudo se recomienda conocer estos temas en profundidad para formar una base sólida. Una vez que tenga suficiente experiencia en estos temas, puede ascender a un instituto para aprender ciencia de datos y aprender lo siguiente.

Fundación

  • Python Básico, Intermedio y Avanzado
  • Estadística, probabilidad y álgebra lineal
  • Regresión lineal, series de tiempo y función de costo
  • Análisis exploratorio de datos
  • Tipos de datos
  • Recopilación, extracción, consulta, limpieza y agregación de datos para análisis
  • Fuentes de datos, limpieza y disputas
  • Trabajando con API
  • Raspado web

Avanzado

  • Árboles de decisión, árboles condicionales
  • Técnicas de conjunto
  • Big Data y Hadoop Ecosystem y Spark
  • Arquitectura HDFS
  • Colmena QL
  • Cerdo
  • Cuentacuentos con datos
  • Codificación Visual
  • Cuadro
  • Bayes ingenuos
  • PNL / Agrupación de texto / NLTK
  • PCA y reducción de dimensiones
  • Implementación de productos de Data Science

El objetivo principal de la ciencia de datos es ayudar a resolver problemas comerciales complejos con la ayuda de datos. Para ser precisos, si no trabaja en problemas reales de la industria, no podrá prepararse como un científico de datos exitoso.

Siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica.

Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo.

Algunos puntos a considerar al elegir una institución / curso

  1. El énfasis está más en la práctica y no solo en la teoría.
  2. El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
  3. Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
  4. Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

Y en mi opinión, las certificaciones son una prueba de que ha completado un curso o un programa y no una prueba de lo que ha hecho. ¡Debes haber leído muchos artículos sobre desempleo educado o incluso haber encontrado algunas experiencias personales en las que muchos estudiantes tienen una maestría pero aún no tienen trabajo!

¿Porque?

Bueno, porque hay una gran brecha de habilidades entre lo que la industria quiere y lo que hay en oferta. El sistema educativo se ha convertido en gran medida en un juego de negocios de solo vender certificados. Por lo tanto, no siempre es necesario confiar en las certificaciones. La información teórica se puede impartir fácilmente. ¡Pero lo que importa es la IMPLEMENTACIÓN!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

Algunos enlaces rápidos

Sugeriría comenzar con el aprendizaje de conceptos matemáticos como álgebra, probabilidad y estadística. MIT OCW tiene excelentes conferencias en video para todos estos temas. Después de aprenderlos a fondo, comience a aprender estructuras de datos para adquirir habilidades de codificación y acostumbrarse a las buenas prácticas de programación.

Luego, vaya al curso de aprendizaje automático en Coursera o cualquier otra plataforma de su elección. Para cambiar a python no tomará más de 3 a 4 días. Aprenda conceptos de aprendizaje automático especialmente supervisados. No solo aprenda a aplicarlos, también debe saber qué hay detrás de ellos para que pueda lograr una alta precisión en menos tiempo en sus modelos.

Después de eso, aprenda que los sistemas de administración de bases de datos como SQL o más avanzados son Hadoop y SaaS.

Todo lo mejor para el futuro.

Para comenzar a aprender habilidades de Data Scientist, le sugiero que comience con Big Data Hadoop y luego avance con otras tecnologías como Spark, R, etc. que se requieren para convertirse en Data Scientist.

Si no sabe si se necesitan habilidades para convertirse en un científico de datos perfecto, vea mi respuesta quora en el siguiente enlace:

La respuesta de Radhika K a ¿Qué habilidades necesito para ser un científico de datos en Google o Facebook?

Para comenzar a aprender Hadoop, vea el video introductorio de Big Data Hadoop a continuación para comenzar ahora:

Si planea aprenderlo en línea, le sugiero que continúe con DataFlair, ya que son uno de los principales proveedores del curso Hadoop y han ayudado a miles de personas a colocarse en las empresas de sus sueños en esta tecnología.

Detalles del curso Hadoop de DataFlair

More Interesting

¿Cuáles son algunas falacias comunes que todo científico de datos debe evitar? ¿Qué es un concepto socavado en ciencia de datos y para un científico de datos? ¿Dónde puedo encontrar recursos que me ayuden a descifrar una entrevista de ciencia de datos?

¿Son inútiles las especializaciones MOOC de ciencia de datos para comenzar un trabajo en el campo de ciencia de datos?

Quiero convertirme en científico de datos. Un amplio campo extendido. Tengo conocimiento sobre ML. ¿Cuáles son otros temas / materias requeridos que debo aprender?

Cómo convertirse en un científico de datos del desarrollador de software

¿Podría un ingeniero eléctrico convertirse en un científico de datos?

¿Ganaría más dinero como científico de datos o como ingeniero de software?

¿Cómo puede un programador con un título de ingeniería y varios años de experiencia convertirse en un científico de datos?

¿Pueden algunos científicos de datos aquí encontrarnos con el trabajo real y los pros y contras involucrados en los trabajos de proyectos de Big Data y guiarnos con qué cursos, paquetes de pago, etc., elegir?

Como científico de datos, ¿cómo aprendo a 'escribir código de producción'?

¿Habrá algún aumento en los salarios de los ingenieros y científicos de Big Data?

Cómo prepararse para la entrevista de caso de uso de ciencia de datos

¿Qué es lo emocionante de Big Data?

¿Cuánto tiempo lleva convertirse en científico de datos?

Estoy haciendo el curso a tiempo parcial de ciencia de datos de la Asamblea General (Londres) en 5 meses. ¿Qué puedo hacer de antemano para estar lo más preparado posible?

Cuando los científicos de datos tienen su propio equipo, ¿cómo las empresas les ayudan efectivamente a comunicarse y contribuir a los equipos de características y productos?