¿Qué curso debo tomar para obtener un trabajo de ciencia de datos?

No sé si es un curso, pero me vienen a la mente varias habilidades necesarias (este es un extracto de una publicación de blog que escribí hace un tiempo). Puede completarlos con cursos y recursos individuales (algunos de ellos enumerados).

Divulgación completa: trabajo para Springboard. Recientemente lanzamos el primer campo de entrenamiento en línea con mentores para garantizarle un trabajo de ciencia de datos o le devolvemos su dinero: el Data Science Career Track. Tal vez esa sea la mejor opción para ti.

Habilidades de ciencia de datos

La mayoría de los científicos de datos utilizan una combinación de habilidades todos los días, algunas de las cuales se han enseñado en el trabajo o no. También provienen de diversos orígenes. No hay ninguna credencial académica específica que los científicos de datos tengan que tener.

Todas las habilidades discutidas en esta sección pueden ser autoaprendidas. Hemos presentado algunos recursos para ayudarlo a comenzar ese camino. Considérelo una guía sobre cómo convertirse en un científico de datos.

Una mente analítica

Cómo convertirse en un científico de datos con una mente analítica

Necesitará una mentalidad analítica para que le vaya bien en la ciencia de datos. Gran parte de la ciencia de datos implica resolver problemas con una mente aguda y aguda.

Recursos

Mantenga su mente aguda con libros y rompecabezas. Un sitio como Lumosity puede ayudarlo a asegurarse de que sea cognitivamente inteligente en todo momento.

Matemáticas

Cómo convertirse en un científico de datos con matemáticas

Las matemáticas son una parte importante de la ciencia de datos. Asegúrese de conocer los conceptos básicos de matemáticas universitarias, desde cálculo hasta álgebra lineal. Cuantas más matemáticas conozcas, mejor.

Cuando los datos se hacen grandes, a menudo se vuelven difíciles de manejar. Tendrá que usar las matemáticas para procesar y estructurar los datos con los que está tratando.

No podrás dejar de conocer el cálculo y el álgebra lineal si te perdiste esos temas en la universidad. Necesitará comprender cómo manipular matrices de datos y tener una idea general detrás de las matemáticas de los algoritmos.

Recursos

Esta lista de 15 cursos MOOC de Matemáticas puede ayudarlo a ponerse al día con las habilidades matemáticas. El MIT también ofrece un curso abierto específicamente sobre las matemáticas de la ciencia de datos.

Estadística

Cómo convertirse en un científico de datos con estadísticas

Debe conocer las estadísticas para inferir ideas de conjuntos de datos más pequeños en poblaciones más grandes. Esta es la ley fundamental de la ciencia de datos. Las estadísticas allanarán su camino sobre cómo convertirse en un científico de datos.

Necesitas conocer estadísticas para jugar con datos. Las estadísticas le permiten comprender mejor los patrones observados en los datos y extraer la información que necesita para sacar conclusiones razonables. Por ejemplo, comprender las estadísticas inferenciales lo ayudará a sacar conclusiones generales sobre todos en una población de una muestra más pequeña.

Para comprender la ciencia de datos, debe conocer los conceptos básicos de las pruebas de hipótesis y diseñar experimentos para comprender el significado y el contexto de sus datos.

Recursos

Nuestro blog publicó un manual sobre cómo el Teorema de Bayes, la probabilidad y las estadísticas se cruzan entre sí. La publicación constituye una buena base para comprender la base estadística de cómo convertirse en un científico de datos.

Algoritmos

Cómo convertirse en un científico de datos con algoritmos

Los algoritmos son la capacidad de hacer que las computadoras sigan un cierto conjunto de reglas o patrones. Comprender cómo usar máquinas para hacer su trabajo es esencial para procesar y analizar conjuntos de datos demasiado grandes para que la mente humana los procese.

Para que pueda hacer un trabajo pesado en la ciencia de datos, tendrá que comprender la teoría detrás de la selección y optimización de algoritmos. Tendrá que decidir si su problema requiere o no un análisis de regresión o un algoritmo que ayude a clasificar diferentes puntos de datos en categorías definidas.

Querrás conocer muchos algoritmos diferentes. También querrás aprender los fundamentos del aprendizaje automático. El aprendizaje automático es lo que le permite a Amazon recomendarle productos basados ​​en su historial de compras sin ninguna intervención humana directa. Es un conjunto de algoritmos que utilizarán la potencia de la máquina para descubrir ideas para usted.

Para lidiar con conjuntos de datos masivos, necesitará usar máquinas para ampliar su pensamiento.

Recursos

Esta guía de KDNuggets ayuda a explicar diez algoritmos comunes de ciencia de datos en inglés simple. Aquí hay 19 conjuntos de datos públicos gratuitos para que pueda practicar la implementación de diferentes algoritmos en los datos.

Visualización de datos

Cómo convertirse en un científico de datos con visualización de datos

Terminar su análisis de datos es solo la mitad de la batalla. Para generar impacto, tendrá que convencer a los demás para que crean y adopten sus ideas. Así es como te conviertes en un científico de datos.

Los seres humanos son criaturas visuales. Según 3M y Zabisco, casi el 90% de la información transmitida a su cerebro es de naturaleza visual, y las imágenes se procesan 60,000 veces más rápido que el texto .

La visualización de datos es el arte de presentar información a través de gráficos y otras herramientas visuales, para que el público pueda interpretar fácilmente los datos y obtener información de ellos. ¿Qué información se presenta mejor en un gráfico de barras y qué tipos de datos deberíamos presentar en un diagrama de dispersión?

Los seres humanos están conectados para responder a las señales visuales. Cuanto mejor pueda presentar sus conocimientos de datos, más probable es que alguien tome medidas basadas en ellos.

Recursos

Tenemos una lista de 31 herramientas gratuitas de visualización de datos con las que puede jugar. El blog FlowingData de Nathan Yau está lleno de consejos y trucos de visualización de datos que lo llevarán al siguiente nivel.

Conocimiento del negocio

Cómo convertirse en un científico de datos con conocimiento empresarial

Los datos significan poco sin su contexto. Tienes que entender el negocio que estás analizando. La claridad es la pieza central de cómo convertirse en un científico de datos.

La mayoría de las empresas dependen de sus científicos de datos no solo para extraer conjuntos de datos, sino también para comunicar sus resultados a varios interesados ​​y presentar recomendaciones sobre las que se pueda actuar.

Los mejores científicos de datos no solo tienen la capacidad de trabajar con conjuntos de datos grandes y complejos, sino que también entienden las complejidades de la empresa u organización para la que trabajan .

Tener un conocimiento general del negocio les permite hacer las preguntas correctas y encontrar soluciones y recomendaciones perspicaces que sean realmente factibles dadas las restricciones que el negocio pueda imponer.

Recursos

Esta lista de cursos de negocios gratuitos puede ayudarlo a obtener el conocimiento que necesita. Nuestro curso de Data Analytics for Business puede ayudarlo a mejorar esta dimensión con un mentor.

Experiencia en el campo

Cómo convertirse en un científico de datos con experiencia en dominios

Como científico de datos, debe conocer el negocio para el que trabaja y la industria en la que vive.

Además de tener un conocimiento profundo de la empresa para la que trabaja, también tendrá que comprender el campo en el que funciona para que sus ideas comerciales tengan sentido. Los datos de un estudio de biología pueden tener un contexto drásticamente diferente que los datos obtenidos de un estudio de psicología bien diseñado. Debe saber lo suficiente como para cortar la jerga de la industria.

Recursos

Esto dependerá en gran medida de la industria. ¡Tendrá que encontrar su propio camino y aprender lo más posible sobre su industria!

¡Los cursos que mencionas parecen increíbles! Parece que ya ha trabajado mucho para conseguir un trabajo en ciencia de datos, pero es difícil juzgar sin saber qué temas se trataron en todos estos cursos.

Tengo algunas preguntas y consejos para usted que podrían ayudarlo a llevar sus esfuerzos al siguiente nivel:

  • ¿Has considerado aprender más lenguajes de programación además de Java? La mayoría de los trabajos en la industria de la ciencia de datos requieren que las personas sean multilingües (en lenguajes de programación). Sin duda, aumentará sus posibilidades si puede demostrar que tiene experiencia adicional en Python, R, … Consulte: El lenguaje más popular para el aprendizaje automático y la ciencia de datos es …, los idiomas más populares para científicos / ingenieros de datos, 2016 Data Science Encuesta salarial
  • ¿Cuánto material has aprendido de forma aplicada? ¿Estos cursos requieren que usted también tenga acceso al material que trató en clase? Si no, mi consejo sería comenzar lo antes posible con algunos conjuntos de datos de la vida real y adquirir experiencia en la aplicación de todo el conocimiento que ha reunido sobre casos de uso. Para SQL, puede, por ejemplo, formular sus propias consultas o incrustarlas en Python (o Java). Lo mismo para Big Data: ¿alguna vez ha creado una tubería ETL o ha visto cómo puede comenzar con Hadoop, por ejemplo? Considere consultar Learn R, Python & Data Science en línea | DataCamp, que se dirige a las personas que quieren aprender ciencia de datos haciendo (descargo de responsabilidad: trabajo para DataCamp como periodista de ciencia de datos).
  • Practica habilidades todos los días . Tómese el tiempo para programar un poco todos los días o para resolver (pequeños) desafíos de la ciencia de datos. Puede comenzar en Your Home for Data Science, DrivenData, o probar los desafíos del modo de práctica diaria en Learn R, Python & Data Science Online | DataCamp. Alternativamente, también puede configurar un plan de desafío de código de 100 días y avanzar a través de sus propios desafíos de ciencia de datos todos los días.
  • El aprendizaje automático sería una gran adición a su plan de estudios si está interesado en un puesto de científico de datos. Pero, por supuesto, esto supone que ya tiene una base sólida en estadísticas. Si desea verificar la cantidad de estadísticas que necesita saber para ingresar a la ciencia de datos, considere esta publicación: más de 40 estadísticas de Python para recursos de ciencia de datos; Proporciona un resumen de los temas que debe considerar + recursos para comenzar con Python.

Más información: Learn Data Science – Infographic, The Data Science Industry: Who Does What (Infographic).

Como han dicho otros, la ciencia de datos generalmente no es solo un curso que debe tomar, sino que requiere que se concentre en múltiples campos al mismo tiempo. De lo que deduje de su pregunta, le falta algo de experiencia práctica (y tal vez algo de experiencia en ML), ¡así que trate de concentrarse en eso por ahora!

Paso 1: Aprende Python Básico

Paso 2: aprende algunas bibliotecas de Python como NumPy y Pandas

Paso 3: haz algunos ejercicios con pandas

Paso 4: visualización de datos: MatPlotLib, SeaBorn, PlotLy y Gemelos

Paso 5: Realice algunos proyectos combinando pandas, NumPy y herramientas de visualización de datos …

Paso 6: Comience a aprender algoritmos y fortalecerse en matemáticas de ingeniería

Paso 7: comience a aprender machine learning y PNL.

Paso 8: aprendizaje profundo y ANN

Paso 9: Realice algunos proyectos sobre aprendizaje automático y aprendizaje profundo

Paso 10: aprenda tecnologías de big data como spark, hive, pig, etc.,

Nota: Cualquiera puede aprender Herramientas y Tecnologías, pero el científico de datos reales dará soluciones, predecirá cosas, imitará cerebros humanos y hará maravillas.

Todo D mejor … ¡Feliz aprendizaje!

En general, diría que ya tomó la mayoría de los cursos que lo prepararían para un trabajo de ciencia de datos.

La educación por sí sola generalmente no consigue un trabajo de nivel superior a menos que haya realizado algunas pasantías o tenga experiencia laboral previa. ¿Tal vez buscar una pasantía con algo de tiempo libre?

Sin embargo, si tiene que tomar un curso, las estadísticas aplicadas pueden ser buenas si desea actualizar sus regresiones y varias pruebas estadísticas. Supongo que tenías mucho de eso en la universidad.

El aprendizaje automático no es el principio de la ciencia de datos, ya que a menudo puedes hacer mucho con menos que eso, pero también es bueno tener esa exposición, ya que inevitablemente la usarás algún día.

De los cursos de CS, lo principal en lo que puedo pensar sería un curso en Python o algo en administración de sistemas donde habrá una gran cantidad de secuencias de comandos. Solo algo para ensuciarte las manos con eso.

A partir de ahí, todo lo que se me ocurre sería algo así como ingeniería de software o un curso de proyectos en el que un equipo haga algo. Mi antigua Uni tenía un curso donde se podía consultar sobre un problema comercial real de una empresa local para obtener una calificación. La escuela ganó un poco de dinero haciendo eso, y es genial para los estudiantes obtener ese tipo de experiencia.

Bien, felicidades, estás en el camino correcto. Y las estadísticas definitivamente te serán útiles. La mayoría de las personas con antecedentes no estadísticos o aquellas que son débiles en matemáticas en general enfrentan algunas dificultades: mi experiencia personal. Aunque para un principiante tiene suficiente en su plato, pero es posible que desee aprender R o Python o SAS, luego Tableau para una visualización más hermosa e interactiva. Además, te sugiero que tomes un curso de aprendizaje automático si puedes. Espero que esto te ayudará.

Siéntase libre de toda otra pregunta del ejército.

Gracias

Ningún curso por sí solo le conseguirá un trabajo de ciencia de datos. Te iniciarán en el campo de la ciencia de datos, y hay respuestas en Quora con sugerencias sobre los cursos y los MOOC. En su caso, parece que podría ser útil obtener más antecedentes sobre Analytics, R y Python.

Si cree que tiene suficientes antecedentes, debe crear su cartera, demostrar su competencia con los proyectos (pruebe DataKind o Data para siempre). Además, contribuya al código abierto (R, Python, etc.), ya que será evaluado de forma independiente, y esto demostrará a su empleador que no plagió las respuestas a los proyectos inventados. Asegúrese de publicar sus contribuciones en GitHub y anótelo en su currículum.

Hiciste una licenciatura en estadística. Bueno.

Estás en un programa de maestría CS. Bueno.

Has tomado cursos relevantes. Bueno.

Es posible que desee considerar el aprendizaje automático, pero en el fondo, gran parte se basa en matemáticas y estadísticas.

No te preocupes y piensa mucho en los cursos … haz cosas. Hacer proyectos Por su cuenta, como pasante, lo que sea. Necesita producir un buen código, comprender las matemáticas y las estadísticas, y tener una buena comprensión de los datos (eso solo viene con la práctica). Tienes, al menos, el del medio. Ve por los otros dos.

Estás en camino

Tienes que pasar un mínimo de 2 años y medio con matemáticas, DS y ML. Con libros y proyectos del mundo real para estar listos

More Interesting

¿Tengo que aceptar un trabajo como desarrollador de Hadoop primero para convertirme en científico de datos?

¿Cuál es su trabajo diario como científico de datos sénior?

¿Cómo consiguió el candidato más nuevo con habilidades intermedias relacionadas con la ciencia de datos el trabajo de científico de datos si no tenía experiencia?

¿Cuáles son los mejores trabajos de analista de datos de nivel de entrada / Big Data / análisis de datos que existen? Específicamente, ¿qué compañías ofrecen la mejor compensación y prestigio?

Quiero trabajar como científico de datos y hacer del mundo un lugar mejor. Tengo un doctorado en ingeniería y estoy casi parcialmente calificado como contador público. ¿Qué podría hacer y dónde puedo encontrar trabajos interesantes?

¿Cuáles son las mejores reuniones de ciencia de datos / big data en el área de la Bahía de San Francisco?

¿Cuál es la demanda de científicos de datos?

Como científico de datos o ingeniero de aprendizaje automático, ¿cuánto tiempo dedicas a los algoritmos?

¿Cómo es realizar una pasantía en SpaceX como científico de datos?

¿Es el científico de datos de McKinsey un rol de consultoría?

¿Convertirse en un científico de datos es una tarea difícil?

¿Cuál es la mejor manera de prepararse para un trabajo como científico de datos a tiempo completo?

¿Morirá el trabajo de científico de datos en unos años?

¿Cómo podemos realmente saber que las vacunas son buenas para la sociedad? ¿Cómo podemos confiar en los datos, los científicos y las personas detrás de nuestros gobiernos?

Cómo convertirse en científico de datos después de hacer ingeniería civil