Sí tu puedes … !
Una simple búsqueda en el linkedin lo llevará a través de muchos talentos de ingeniería que practican la ciencia de datos sin un título formal.
Recuerde, los títulos son solo certificados auténticos aprobados para una persona que tiene conocimiento de un campo específico. Pero no todos los titulados son personas capacitadas.
- ¿Hay algún científico de datos o un estadístico que trabaje en Google, India? En caso afirmativo, ¿cuál es su paquete?
- ¿Qué desean los matemáticos que los científicos de datos supieran?
- ¿Qué es lo que más te gusta de ser un científico de datos en el día a día?
- ¿Qué algoritmos generales (no estadísticos o de aprendizaje automático) debe conocer un científico de datos?
- ¿Cuáles son algunas cosas que debe saber como científico de datos pero que la mayoría descuida?
Además, no tener un título no es un espectáculo para los aspirantes. El trabajo sincero y los esfuerzos para mejorar su base en matemáticas formales, estadísticas y ciencia sólida pueden dar buenos resultados. Sin embargo, lo que básicamente se espera de usted para convertirse en un científico de datos es
- Conocimiento de Matemáticas y Estadística.
- Conocimiento de programación
- Comprender el contexto empresarial
Para ir en detalle, las siguientes son las habilidades necesarias para aventurarse en la ciencia de datos
- Habilidades técnicas
- Matemáticas (por ejemplo, álgebra lineal, cálculo y probabilidad)
- Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
- Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)
- Habilidades de ingeniería de software (por ejemplo, computación distribuida, algoritmos y estructuras de datos)
- Minería de datos
- Limpieza de datos y munging
- Visualización de datos (por ejemplo, ggplot y d3.js) y técnicas de informes
- Técnicas de datos no estructurados.
- Lenguajes R y / o SAS
- Bases de datos SQL y lenguajes de consulta de bases de datos
- Python (más común), C / C ++ Java, Perl
- Grandes plataformas de datos como Hadoop, Hive y Pig
- Herramientas en la nube como Amazon S3
- Habilidades para los negocios
- Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
- Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.
- Curiosidad intelectual: explorar nuevos territorios y encontrar formas creativas e inusuales para resolver problemas.
- Conocimiento de la industria: comprender la forma en que funciona la industria elegida y cómo se recopilan, analizan y utilizan los datos.
Si tiene las habilidades mencionadas anteriormente en gran medida, es bueno. Pero, ¿cómo puede la industria ver las habilidades que posee? A menos que y hasta que no muestre las habilidades al mundo exterior, nadie sabrá sobre usted y sobre los complejos modelos y datos en los que ha trabajado.
Aquí viene el punto de tener un perfil en GitHub, Stack Overflow, Kaggle, etc. Estas son plataformas y comunidades en línea en las que puede exhibir su trabajo trabajando en proyectos, contribuir a otros proyectos, mostrar su trabajo anterior, hacer preguntas, escribir blogs y ser parte de la comunidad.
La presencia en dichas plataformas lo ayudará a aprender las mejores prácticas de codificación. Además, construyó una cartera demostrable a medida que trabaja en diferentes proyectos / desafíos. Recuerde, los posibles empleadores contratan HABILIDAD DEMOSTRADA en lugar de pedigrí O certificaciones.
Si está planeando aprender ciencia de datos, le sugiero que asista a un programa que se base en el aula, esté muy orientado a la práctica y dirigido por un instructor
- Pocos puntos básicos a considerar al elegir un programa son
- El énfasis está más en la práctica y no solo en la teoría.
- El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
- Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
- Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes construyeron proyectos sobre el conjunto de datos REAL y las declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
- Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…