¿Realmente puede convertirse en un científico de datos sin una matemática / estadística formal o un título en ciencias duras?

Sí tu puedes … !

Una simple búsqueda en el linkedin lo llevará a través de muchos talentos de ingeniería que practican la ciencia de datos sin un título formal.

Recuerde, los títulos son solo certificados auténticos aprobados para una persona que tiene conocimiento de un campo específico. Pero no todos los titulados son personas capacitadas.

Además, no tener un título no es un espectáculo para los aspirantes. El trabajo sincero y los esfuerzos para mejorar su base en matemáticas formales, estadísticas y ciencia sólida pueden dar buenos resultados. Sin embargo, lo que básicamente se espera de usted para convertirse en un científico de datos es

  1. Conocimiento de Matemáticas y Estadística.
  2. Conocimiento de programación
  3. Comprender el contexto empresarial

Para ir en detalle, las siguientes son las habilidades necesarias para aventurarse en la ciencia de datos

  • Habilidades técnicas
  • Matemáticas (por ejemplo, álgebra lineal, cálculo y probabilidad)
  • Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
  • Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)
  • Habilidades de ingeniería de software (por ejemplo, computación distribuida, algoritmos y estructuras de datos)
  • Minería de datos
  • Limpieza de datos y munging
  • Visualización de datos (por ejemplo, ggplot y d3.js) y técnicas de informes
  • Técnicas de datos no estructurados.
  • Lenguajes R y / o SAS
  • Bases de datos SQL y lenguajes de consulta de bases de datos
  • Python (más común), C / C ++ Java, Perl
  • Grandes plataformas de datos como Hadoop, Hive y Pig
  • Herramientas en la nube como Amazon S3
  • Habilidades para los negocios
  • Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
  • Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.
  • Curiosidad intelectual: explorar nuevos territorios y encontrar formas creativas e inusuales para resolver problemas.
  • Conocimiento de la industria: comprender la forma en que funciona la industria elegida y cómo se recopilan, analizan y utilizan los datos.

Si tiene las habilidades mencionadas anteriormente en gran medida, es bueno. Pero, ¿cómo puede la industria ver las habilidades que posee? A menos que y hasta que no muestre las habilidades al mundo exterior, nadie sabrá sobre usted y sobre los complejos modelos y datos en los que ha trabajado.

Aquí viene el punto de tener un perfil en GitHub, Stack Overflow, Kaggle, etc. Estas son plataformas y comunidades en línea en las que puede exhibir su trabajo trabajando en proyectos, contribuir a otros proyectos, mostrar su trabajo anterior, hacer preguntas, escribir blogs y ser parte de la comunidad.

La presencia en dichas plataformas lo ayudará a aprender las mejores prácticas de codificación. Además, construyó una cartera demostrable a medida que trabaja en diferentes proyectos / desafíos. Recuerde, los posibles empleadores contratan HABILIDAD DEMOSTRADA en lugar de pedigrí O certificaciones.

Si está planeando aprender ciencia de datos, le sugiero que asista a un programa que se base en el aula, esté muy orientado a la práctica y dirigido por un instructor

  • Pocos puntos básicos a considerar al elegir un programa son
  • El énfasis está más en la práctica y no solo en la teoría.
  • El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
  • Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
  • Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes construyeron proyectos sobre el conjunto de datos REAL y las declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

  • Programa – http://www.greyatom.com/full-sta…
  • Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

Sí, pero requerirá un esfuerzo serio. Necesita aprender y practicar (y practicar y practicar) muchos conceptos y habilidades diferentes (estadística, ingeniería de datos, computación, visualización, discusión de datos y más), y poder usarlos todos juntos para resolver problemas reales. También debe aprender cómo aprender rápidamente sobre un nuevo dominio de tareas y formular problemas que puedan resolverse adecuadamente en ese dominio.

La educación de posgrado puede ayudarlo a aprender esas habilidades y brindarle oportunidades estructuradas (y tutoría) para practicarlas, pero es posible hacerlo fuera de la escuela de posgrado (aunque será aún más difícil). Si no vas a ir a la escuela, te aconsejo encarecidamente que encuentres un buen mentor, al menos.

Hagamos una cosa bien: hacer ciencia de datos no es lo mismo que hacer ciencia.

Sí, la ciencia de datos implica el uso de modelos estadísticos, modelos probabilísticos, aprendizaje automático y modelos predictivos, y sí implica la generación de hipótesis, la recopilación y la gestión de datos para comprender estas hipótesis y validarlas. Estas habilidades se pueden aprender de varias fuentes, ya sean títulos en ingeniería o ciencias, estadística o matemáticas o ciencias de la computación. Estas habilidades también pueden ser aprendidas en el trabajo, por personal motivado que tiene una educación de nivel de licenciatura en ingeniería, ciencias, matemáticas, estadística o ciencias de la computación. Los aspirantes a científicos de datos no necesariamente tienen que tener una maestría o un doctorado para adquirir estas habilidades, aunque tener tales calificaciones solo puede ayudarlo a llegar más rápido.

En otras respuestas sobre Quora, he enfatizado algunas de las habilidades requeridas para hacer ciencia de datos y para ser un buen científico de datos.

Sí, pero necesita una forma de obtener las matemáticas necesarias para comprender los métodos. Esto incluye cálculo, álgebra lineal y estadística (preferiblemente curso de nivel superior). Eso es un curso adicional de 5-6 cursos dependiendo de la secuencia de cálculo de su escuela, que definitivamente es factible con cualquier especialidad universitaria. Dicho esto, probablemente querrás obtener un título de posgrado. A menos que sea un ingeniero de software en California, la mayoría de los trabajos de ciencia de datos requerirán una maestría o doctorado con habilidades en cálculo y estadísticas.

Puede ser difícil, principalmente en el trato con los burócratas de recursos humanos que forman parte de su carrera. Para realmente hacer el trabajo, la comprensión de algunas matemáticas y / o estadísticas es importante, sin importar cómo la haya adquirido. Con esta comprensión, puedes hablar con los científicos de datos en su idioma, y ​​si eres bueno, ¡te guiarán a través de los recursos humanos!

Siendo realistas, el campo no existía formalmente, hasta hace poco.