¿Cuáles son las habilidades necesarias para convertirse en un buen científico de datos? ¿Qué cursos debe dominar uno?

Es realmente bueno que quieras convertirte en científico de datos. La mayoría de la gente piensa que es muy difícil convertirse en un científico de datos.

Pero, déjenme aclarar que no es difícil, si trabajarán de manera muy inteligente en la dirección correcta, pueden convertirse fácilmente en científicos de datos.

Para convertirse en un científico de datos, primero comprenda quiénes son los científicos de datos, luego aprenda qué habilidades se requieren para el científico de datos y luego vea sus roles y responsabilidades. Por último, de acuerdo con sus roles y responsabilidades, intente agregar esas habilidades en usted mismo.

En primer lugar, háganos saber quiénes son los científicos de datos.

Los científicos de datos son una nueva generación de expertos en datos analíticos que tienen las habilidades técnicas para resolver problemas complejos y la curiosidad de explorar qué problemas deben resolverse.

Los científicos de datos son grandes expertos en datos. Toman una gran cantidad de puntos de datos desordenados (no estructurados y estructurados) y los limpian, masajean y organizan con sus formidables habilidades en matemáticas, estadísticas y programación. Luego aplican todos sus poderes analíticos para descubrir soluciones ocultas a los desafíos del negocio y presentarlo al negocio.

Data Scientist necesita tener habilidades técnicas y no técnicas para realizar su trabajo de manera efectiva.

Las habilidades técnicas están involucradas en 3 etapas en Data Science. Incluyen:

  • Captura de datos y preprocesamiento
  • Análisis de datos y reconocimiento de patrones
  • Presentación y visualización

Algunas tareas laborales de los científicos de datos:

  • Transformar datos rebeldes en un formato más utilizable.
  • Resolver problemas relacionados con el negocio utilizando técnicas basadas en datos.
  • Trabajando con una variedad de lenguajes de programación.
  • Tener una sólida comprensión de las estadísticas, incluidas las pruebas estadísticas y las distribuciones.
  • Mantenerse al tanto de las técnicas analíticas como el aprendizaje automático, el aprendizaje profundo y la analítica de texto.
  • Comunicándose y colaborando con TI y negocios.
  • Buscar el orden y los patrones en los datos, así como detectar tendencias que pueden ayudar a los resultados de una empresa.

Ahora, veamos las habilidades requeridas para Data Scientist:

Habilidades necesarias para convertirse en científico de datos

  • Conocimiento profundo de la codificación Python. Es el lenguaje más común, incluido Perl, Ruby, etc.
  • Conocimiento sólido de SAS / R
  • Es necesario que el científico de datos pueda trabajar con datos no estructurados. Ya sea que provenga de videos, redes sociales, etc.
  • Habilidad de sonido en la codificación de bases de datos SQL.
  • Data Scientist debería tener una buena comprensión de varias funciones analíticas. Por ejemplo rango, mediana, etc.
  • Se requiere un conocimiento profundo del aprendizaje automático.
  • Un científico de datos debe estar familiarizado con Hive , mahout, redes bayesianas , etc. En ciencia de datos, el conocimiento de MySQL es como una ventaja adicional.

Ahora, veamos los roles y responsabilidades del científico de datos:

a) Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial. Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio.
  • Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

Para saber más sobre las habilidades y responsabilidades de Data Scientist, consulte el siguiente enlace:

Roles y responsabilidades de un científico de datos

Aquí hay algunas tendencias laborales de los científicos de datos.

Para realizar 3 etapas de Data Scientists, se necesitan 3 categorías de herramientas: herramientas para extraer datos, herramientas para analizar los datos y herramientas para presentar los resultados.

Diferentes herramientas para realizar las 3 etapas de los científicos de datos:

1. Herramientas para extracción de datos y preprocesamiento

a. SQL

Esta es una habilidad imprescindible para todos los científicos de datos, independientemente de si está utilizando datos estructurados o no estructurados. Las empresas están utilizando los últimos motores SQL como Apache Hive, Spark-SQL, Flink-SQL, Impala, etc.

si. Tecnologías de Big Data

Esta es la necesidad de las habilidades necesarias para convertirse en un científico de datos. El científico de datos necesita saber sobre las diferentes tecnologías de Big Data: tecnologías de primera generación como Apache Hadoop y su ecosistema (colmena, cerdo, canal, etc.), como Next Gen: Apache Spark y Apache Flink (Apache Flink está reemplazando Apache Spark rápidamente como Flink es un motor de Big Data de propósito general, que también puede manejar transmisiones en tiempo real, para más detalles sobre Flink siga este tutorial completo).

C. UNIX

Como la mayoría de los datos sin procesar se almacenan en un servidor UNIX o Linux antes de ponerlos en un almacén de datos, es bueno poder acceder a los datos sin la dependencia de una base de datos. Entonces, el conocimiento de Unix es bueno para los científicos de datos. Siga esta guía de comandos para practicar los comandos de Linux.

re. Pitón

Python es el lenguaje más popular para el científico de datos. Python es un lenguaje de programación orientado a objetos interpretado con semántica dinámica. Es un lenguaje de alto nivel con enlace dinámico y escritura.

2. Herramientas para análisis de datos y coincidencia de patrones

Esto depende de su nivel de conocimiento estadístico. Algunas herramientas se utilizan para estadísticas más avanzadas y otras para estadísticas más básicas.

a. SAS

Muchas empresas usan SAS, por lo que es bueno tener un conocimiento básico de SAS. Puedes manipular ecuaciones fácilmente.

si. R

R es más popular en el mundo estadístico. R es una herramienta de código abierto y un lenguaje orientado a objetos, por lo que puede usarlo en cualquier lugar. Es la primera opción de cualquier científico de datos, ya que la mayoría de las cosas se implementan en R. Para obtener la comparación entre las principales herramientas de análisis de datos, siga esta guía de comparación entre R vs SAS y SPSS.

C. Máquina inclinada

El aprendizaje automático es la herramienta más exigente y útil que los científicos de datos deben tener. Los algoritmos de aprendizaje automático se utilizan para análisis de datos avanzados, análisis predictivo, coincidencia de patrones avanzada.

Para obtener más herramientas para realizar 3 etapas de visita de Data Scientist: Habilidades necesarias para convertirse en Data Scientist

Puede ir a través de este enlace para conocer las certificaciones para científicos de datos: varias certificaciones para científicos de datos

¡¡Espero eso ayude!!

Los científicos de datos son responsables del análisis de datos con el objetivo de descubrir ideas que a su vez pueden proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Su función es analizar datos desde diferentes ángulos, determinar qué significa y luego recomendar formas de aplicar esos datos. Emplean sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y prescriptivos. También son responsables de comunicar las predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos.

Me alegra mucho saber que está interesado en Data Science y que ya comenzó a hacerlo. Ahora, ser un Científico de Datos no es pan comido, requiere muchas habilidades y prácticas involucradas en el dominio. Para eso se requiere ser entrenado adecuadamente por un experto en la industria con la experiencia adecuada. Debe estar familiarizado y tener experiencia en Estadística, Programación R, Modelado predictivo, Algoritmos de aprendizaje automático y Minería de texto.

Dicho esto, en línea encontrará muchos cursos que cubren el tema de la ciencia de datos.

Proporcionan contenido fantástico en línea y han revolucionado el ecosistema de muchas maneras más. Pero todavía hay un vacío que debe llenarse para garantizar que sea lucrativo en cualquier mercado laboral.

Cuando su enfoque es la habilidad única, aprender de los cursos en línea funciona mejor. Pero el dominio que exige habilidades donde uno tiene que orquestar herramientas, técnicas, procesos en múltiples niveles (matemático, computacional, algorítmico), aprender en línea sin tutoría activa sería un desafío. Los programas basados ​​en persona sin conexión son más adecuados.

En GreyAtom ponemos énfasis en el aprendizaje inmersivo que en realidad significaría:

  • Replicando posibles escenarios de trabajo
  • Aprendizaje interactivo
  • Enseñar habilidades o técnicas particulares
  • aprender = hacer trabajo real
  • Aprendizaje práctico
  • Trabajando en equipo, aprendiendo del instructor
  • Menos basado en el aula
  • Más proyecto / estudio de caso basado
  • Manejo de problemas reales, datos reales, escenarios reales, flujo de trabajo real
  • Herramientas que reflejan la industria, herramientas y estructuras alineadas a la industria.
  • Imitando una situación o escenario que enfrentan la industria / empresas
  • O llevar a cabo proyectos basados ​​en escenarios reales de trabajo.
  • Juego de roles y realización de una tarea como se hace en el lugar de trabajo.
  • Capacitación para la industria antes de ser contratado.
  • Buscando alternativas para la gestión tradicional de proyectos / escenarios / problemas
  • Fases cortas de trabajo, reevaluación frecuente, adaptación de planes.
  • Scrum sprints: evaluación colaborativa, agradable y rápida, entrega de productos en ciclos cortos, retroalimentación rápida, mejora continua,
  • Scrum sprints: creación de lugares de trabajo alegres y sostenibles
  • Los sprints ágiles mejoran la comunicación, el trabajo en equipo y la velocidad.

Full Stack Data Science Engineer es uno de los trabajos más solicitados en este momento. GreyAtom se enfoca en crear ingenieros de ciencia de datos de Full Stack y le brinda todas las herramientas, técnicas y conceptos básicos necesarios para lograr un impacto.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa en el sitio de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos que “Aprender = hacer trabajo real”

Aprenda y practique tecnologías del futuro con datos REALES: programa desarrollado por académicos de clase mundial en colaboración con profesionales de la industria.

Dé el primer paso hacia su viaje en Data Science, programe una sesión de asesoramiento en persona o en video en su momento conveniente, haga clic aquí https://calendly.com/greyatom/co

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Primero escucha esto: Heavens Choir Sound Effect

Ahora, aquí vamos!

Habilidades: Analítica

  1. Educación : los científicos de datos son altamente educados: el 88% tiene al menos un título de maestría y el 46% tiene doctorados, y aunque hay excepciones notables, generalmente se requiere una formación académica muy sólida para desarrollar la profundidad del conocimiento necesario para ser un científico de datos. Sus campos de estudio más comunes son Matemáticas y Estadística (32%), seguido de Ciencias de la Computación (19%) e Ingeniería (16%).
  2. SAS y / o R : conocimiento profundo de al menos una de estas herramientas analíticas, para la ciencia de datos se prefiere generalmente R.

Habilidades técnicas: informática

  1. Codificación de Python : Python es el lenguaje de codificación más común que normalmente veo requerido en los roles de ciencia de datos, junto con Java, Perl o C / C ++.
  2. Plataforma Hadoop : aunque esto no siempre es un requisito, es muy preferido en muchos casos. Tener experiencia con Hive o Pig también es un fuerte punto de venta. La familiaridad con herramientas en la nube como Amazon S3 también puede ser beneficiosa.
  3. Base de datos / codificación SQL : aunque NoSQL y Hadoop se han convertido en un gran componente de la ciencia de datos, aún se espera que un candidato pueda escribir y ejecutar consultas complejas en SQL.
  4. Datos no estructurados : es fundamental que un científico de datos pueda trabajar con datos no estructurados, ya sea de redes sociales, videos o audio.

Habilidades no técnicas

  1. Curiosidad intelectual : sin duda, has visto esta frase en todas partes últimamente, especialmente en lo que respecta a los científicos de datos. Frank Lo describe lo que significa y habla sobre otras “habilidades blandas” necesarias en su blog invitado publicado hace unos meses.
  2. Perspicacia comercial : para ser un científico de datos, necesitará una sólida comprensión de la industria en la que está trabajando y saber qué problemas comerciales está tratando de resolver su empresa. En términos de ciencia de datos, es fundamental poder discernir qué problemas son importantes de resolver para el negocio, además de identificar nuevas formas en que el negocio debería aprovechar sus datos.
  3. Habilidades de comunicación : las empresas que buscan un científico de datos sólido buscan a alguien que pueda traducir sus hallazgos técnicos de manera clara y fluida a un equipo no técnico, como los departamentos de Marketing o Ventas.

Recursos : Udacity, Udemy, Coursera, Bootcamps etc.

Fuente- kdnuggets.com

Data Scientist es considerado como “El trabajo más sexy del siglo XXI”

Los científicos de datos son responsables del análisis de datos con el objetivo de descubrir ideas que a su vez pueden proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Su función es analizar datos desde diferentes ángulos, determinar qué significa y luego recomendar formas de aplicar esos datos. Emplean sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y prescriptivos. También son responsables de comunicar las predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos.

Estoy muy contento de saber que está interesado en Data Science, pero ser un Data Scientist no es pan comido, requiere muchas habilidades y prácticas involucradas en el dominio. Para eso se requiere ser entrenado adecuadamente por un experto en la industria con la experiencia adecuada. Debe estar familiarizado y tener experiencia en Estadística, Programación R, Modelado predictivo, Algoritmos de aprendizaje automático y Minería de texto.

Aparte de eso, le sugiero que haga muchos proyectos y tareas para tener éxito y practicar lo que ha aprendido a lo largo de todo el proceso, y que alguien de la industria lo valide.

Además, otro problema que surge es al momento de la contratación porque, aparte de la ubicación en el campus, es raro que las empresas que contratan a Data Scientist contraten de manera más reciente y busquen candidatos con experiencia.

edWisor es una de esas plataformas que proporciona una combinación de capacitación en vivo y en línea de Data Scientist de profesionales con experiencia en la industria.

¡Todo lo mejor!

Gracias.

Gracias por A2A. Hay una serie de habilidades que necesita para convertirse en un buen científico de datos:

  • Habilidades de programación: por lo general, Python, R, pero también es deseable un conocimiento cada vez mayor de herramientas de big data, como spark, scala y hadoop.
  • Matemáticas / Estadística: es crucial comprender las matemáticas y la teoría que sustentan los algoritmos y métodos utilizados por los científicos de datos. El tema útil incluye: álgebra lineal, probabilidad, cálculo, pruebas de hipótesis, estadísticas bayesianas, etc. Recomiendo encarecidamente el libro Introducción al aprendizaje estadístico.
  • Habilidades de base de datos: SQL.
  • Habilidades de comunicación: debe poder presentar sus hallazgos y hacerlos relevantes para la industria / negocio.
  • Habilidades de visualización: python (matplotlib), R (ggplot2), tableau, D3.js,
  • Cursos: hay varios cursos buenos en Coursera, Udemy, EDX, Uudacity. El curso más adecuado dependerá en gran medida de sus antecedentes. Siéntase libre de explorar y elegir. Yo personalmente recomendaría el curso de análisis de análisis ofrecido por MIT / edX. Puede leer Mi revisión del MOOC “Analytics Edge” del MIT (15.071x) para obtener más información. Además, recomendaría la Introducción del MIT a la informática y la programación usando Python. Udemy (Cursos en línea de Udemy – Aprenda cualquier cosa, según su horario) tiene algunos cursos realmente buenos y le enseñan científicos de datos reales (no solo académicos).
  • Proyectos: La mejor manera de involucrarse es participar en proyectos de ciencia de datos donde pueda encontrar y resolver problemas reales. Kaggle es particularmente bueno. Su hogar para la ciencia de datos.

Ya hay muchos recursos disponibles, siéntase libre de navegar:

  • ¿Cómo puedo convertirme en un científico de datos?
  • ¿Cuáles son las habilidades más valiosas para aprender para un científico de datos ahora?

More Interesting

Estoy haciendo el curso a tiempo parcial de ciencia de datos de la Asamblea General (Londres) en 5 meses. ¿Qué puedo hacer de antemano para estar lo más preparado posible?

¿Los científicos de datos viven cómodamente?

¿Cuáles son los 10 principales desafíos para las aplicaciones de ciencia de datos en el sector de exploración de petróleo y gas?

¿Es Accenture un buen lugar para comenzar su carrera si desea ingresar a Data Science en el futuro?

¿Cómo son las oportunidades para las pruebas de big data en el mercado?

¿Cuál es el salario de un científico de datos en Hong Kong?

Quería ser microbiólogo, con suerte en Cornell. Pero ni siquiera soy tan atractivo. ¿Se enfrenta la materia para convertirse en científico?

¿Se paga más a los científicos de datos que a los ingenieros de datos?

¿Cuáles son algunas falacias comunes que todo científico de datos debe evitar? ¿Qué es un concepto socavado en ciencia de datos y para un científico de datos? ¿Dónde puedo encontrar recursos que me ayuden a descifrar una entrevista de ciencia de datos?

¿Morirá el trabajo de científico de datos en unos años?

¿Qué viene primero para un científico de datos: los datos o la idea?

Con las nuevas tecnologías y el aumento de Hadoop, ¿se volverán obsoletos los científicos de datos?

¿Por qué es Apache Spark popular entre los científicos de datos?

¿Puedo ser un científico de datos después de graduarme de matemáticas en una especialización en computación en UCLA?

Cómo convertirse en un científico de datos del desarrollador de software