¿Qué debo saber si quiero convertirme en científico de datos?

Aquí hay una lista de todas las habilidades que necesitaría para convertirse en Data Scientist:

Habilidades técnicas.

Las habilidades matemáticas como álgebra lineal, cálculo y probabilidad juegan un papel básico. Además, entre los requisitos básicos se encuentran las estadísticas, principalmente temas como pruebas de hipótesis y estadísticas resumidas.

Las herramientas de aprendizaje automático, como los vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc., juegan un papel vital. Nuevamente, necesitaría habilidades básicas de ingeniería de software como computación distribuida, algoritmos y estructuras de datos.

Luego vienen varias técnicas de minería de datos, limpieza de datos y munging de datos, junto con herramientas de visualización e informes de datos como ggplot y d3.js.

Además, también necesitaría adquirir técnicas de datos no estructurados. Para la codificación, Python es el más común. Sin embargo, el conocimiento de C / C ++, Java y Perl también sería útil.

Debería aprender también bases de datos SQL y lenguajes de consulta de bases de datos, junto con los idiomas R y / o SAS.

Se necesitarían plataformas de Big Data como Hadoop, Hive & Pig para operaciones especiales y análisis de datos en su mayoría no estructurados.

Para mayor versatilidad, las herramientas en la nube como Amazon S3 resultarían útiles.

Habilidades para los negocios.

Además de las habilidades técnicas mencionadas anteriormente, un Científico de Datos también debe poseer habilidades analíticas para abordar problemas desafiantes de la manera correcta, debe tener habilidades de comunicación fluidas para poder comunicar los hallazgos y observaciones correctamente y una curiosidad intelectual definitiva para deducir soluciones inusuales a problemas.

Además, es muy esencial contar con una sólida empresa y el conocimiento de la industria laboral elegida.

Yo trabajo para COSO IT . Somos consultores y formadores de Data Science, Big Data, Inteligencia Artificial, Aprendizaje automático y análisis. Después de trabajar con varios proyectos en varias tecnologías más recientes, también compartimos nuestro conocimiento a través de la capacitación en varias tecnologías más recientes. Nuestra capacitación es casi en tiempo real con desafíos reales que enfrentamos mientras trabajamos en el proyecto.

¡La mejor de las suertes!

La ciencia de datos es un campo vasto y necesita mucho tiempo y energía para explorar esta área. Pero para empezar, puedo sugerirle algunos pasos iniciales dentro de esta área. Primero, comprenda algunos de los siguientes escenarios comúnmente manejados por los científicos de datos.

  • Agrupamiento
  • Regresión
  • Clasificaciones
  • Recomendaciones

    Debe desarrollar una comprensión básica de estos conceptos y en qué escenarios son útiles. Lo siguiente es comprender los conceptos de aprendizaje supervisado y aprendizaje no supervisado. La clasificación y la regresión (y supongo que las recomendaciones) son aprendizaje supervisado, mientras que el agrupamiento es aprendizaje no supervisado.

Luego vienen diferentes algoritmos para cada una de las categorías anteriores. Por ejemplo, KMeans es uno de los algoritmos para Clustering. Concentre los conceptos básicos, no entre en detalles matemáticos si no tiene antecedentes. Puede ir sin matemáticas simplemente concentrándose en el uso de estos algoritmos

Por lo general, los algoritmos anteriores le darán un modelo que puede usar para sus predicciones

Luego viene cómo evaluar su modelo. Existen varias técnicas y las más destacadas son

  • Error medio cuadrado
  • Error cuadrático medio cuadrado
  • Área bajo curva
  • Recesión y retiro del mercado

Estos son solo algunos que puedes explorar más. Nuevamente, comprenda sus conceptos y evite las matemáticas subyacentes.

Luego viene una selección de herramientas para implementar los algoritmos anteriores. Sugeriré Apache Spark (Apache Spark ™ – Lightning-Fast Cluster Computing) que tiene una biblioteca de aprendizaje automático MLlib (MLlib | Apache Spark)

Solo te muestro una forma de entrar en estas vastas áreas. Una vez que desarrolle la comprensión de lo anterior, puede aventurarse más.

Software de gestión de casos legales

Habilidades que necesitará : Conocimiento de algoritmos, estadísticas, matemáticas y amplio conocimiento de lenguajes de programación como R y Python. Amplio conocimiento de cómo estructurar un problema de datos, desde formular las preguntas correctas hasta comunicar los resultados de manera efectiva.

El servicio de capacitación en habilidades de TI Data Science Training ha sido estructurado para aquellos que desean desarrollar el conocimiento avanzado y las habilidades necesarias para trabajar como científico de datos. Obtenga su certificación de ciencia de datos y destaque, ya sea que esté buscando cambiar de trabajo, obtener una promoción o mejorar sus habilidades actuales.

Los estadísticos que se centran en la implementación de enfoques estadísticos de los datos, y los gerentes de datos que se centran en ejecutar equipos de ciencia de datos tienden a caer en el papel de científico de datos.

Los científicos de datos son el puente entre la programación y la implementación de la ciencia de datos, la teoría de la ciencia de datos y las implicaciones comerciales de los datos.

Salarios : los científicos de datos deben tener un amplio conjunto de habilidades que cubran la teoría, la implementación y la comunicación de la capacitación en ciencias de datos . También tienden a ser el grupo mejor remunerado con un salario promedio superior a $ 115,000 USD.

  • El trabajo es a menudo divertido pero a veces tedioso
  • Pasará mucho tiempo limpiando datos
  • Pasará mucho tiempo convenciendo a su jefe / cliente del valor de su análisis. Las buenas habilidades de comunicación son de suma importancia.
  • La programación es importante: no es necesario ser ingeniero de software, pero debe poder escribir scripts listos para producción.
  • Hacer que su trabajo sea reproducible es imprescindible, especialmente si trabaja dentro de un equipo.
  • Use las herramientas adecuadas siempre que sea ​​posible, no reinvente la rueda.
  • Pasará mucho tiempo trabajando solo , frente a una computadora. Deberías sentirte cómodo con eso.

¡Disfrutar!

Primero: mira este mapa ebic, te dará una idea de lo que realmente se ve muy lejos de la visión romántica de cosas como enseñarte x en 15 días y también para guiarte en el camino.

Nota: esto no es para frustrarte, es solo para ser real y honesto, y esto será muy útil cuando sigas aprendiendo.

Luego vea las respuestas en esta pregunta ¿Cómo puedo convertirme en un científico de datos? .

Espero que esto te ayude.

Agregando a la lista de Janarthanan:

6. Análisis de series temporales

7. Modelado no lineal

8. Optimización

9. Experiencia en el dominio

10. SQL

11. Programación en Python, R y / o Matlab.

Mi empresa requiere un doctorado con antecedentes en biología o antecedentes médicos para nuestros científicos de datos. Además, también se requieren las habilidades de R, python y machine learning.

También se necesita una sólida base estadística. Por supuesto, una gran cartera de proyectos ya completados es extremadamente útil.

Deberías revisar el mercado. Esto significa que mira a las empresas y su demanda de trabajo. También lees las descripciones de trabajo y las expectativas. Debería reunirse con amigos, estudiantes o profesionales para analizar la posición del científico de datos y el estudio académico relevante. También puede discutir experiencias profesionales o reunirse en conferencias para la ciencia de datos. Si ve su educación, experiencia e inversión como una aplicación, puede concentrar parte de su atención para cumplir con las expectativas realmente demandadas. Significa que si elige postularse para tales equipos y empresas, ya ha leído o escuchado sus expectativas. Te lleva a cumplir sus expectativas desarrollando tu trabajo para ellos. Una forma de aprovechar equipos y empresas específicos requiere que abstraiga las publicaciones de trabajo de los científicos de datos entre las empresas. Encuentra las expectativas comunes y las habilidades requeridas para que puedas postularte en varias compañías.

Lee mi respuesta [1] a una pregunta similar.

Notas al pie

[1] La respuesta de Karthik Arumugham a ¿Qué necesito para ser competente y sobresalir en el campo de la ciencia de datos?

More Interesting

Cómo convertirse en un científico de datos desde un nivel principiante absoluto a un nivel avanzado

¿Cuáles son algunos algoritmos avanzados que usan los científicos de datos para limpiar y dar sentido a los datos?

¿Cuál es la profesión de científico de datos? ¿Cómo difiere de las profesiones relacionadas?

¿Puedo convertirme en un científico de datos sin conocer ningún software?

¿Qué camino debo tomar para convertirme en un científico de datos empleable como un graduado de derecho de 26 años para alcanzar este objetivo de manera realista?

Cómo convertirse en un científico de datos como estudiante de doctorado en estadística

¿Las nuevas tecnologías ya están matando a los científicos de datos?

¿Los científicos independientes se ven más afectados por los recortes en la financiación científica que los científicos que trabajan en universidades?

¿SAS es realmente importante para un trabajo de ciencia de datos?

¿Debo ingresar a consultoría tecnológica, análisis de datos, desarrollo de software o gestión de productos?

¿Qué es el aprendizaje automático o la ciencia de datos? ¿Qué tipo de trabajo haces como científico de datos todos los días?

¿Qué lenguajes de bases de datos se deben aprender para convertirse en científicos de datos?

¿Es posible hacer un cambio de carrera a analista de datos?

¿Qué hacen los científicos de datos en Microsoft?

¿Son inútiles las especializaciones MOOC de ciencia de datos para comenzar un trabajo en el campo de ciencia de datos?