Pregunta perfecta Yo y muchos de mis amigos somos nuevos, quienes son contratados como científicos de datos por algunas de las compañías bien conocidas y bien pagadas con una cultura increíble.
Pero recuerde, la mayoría de las empresas que actualmente contratan a científicos de datos tienen una necesidad inmediata de hacer el trabajo. Conozco empresas que tienen publicaciones vacías durante 6 meses, pero no pueden encontrar candidatos adecuados. Data Science es un campo vasto y complejo y proporcionar capacitación en la oficina es muy costoso. Por lo tanto, debe estar listo para contribuir antes de unirse.
Data Science no es un campo de estudio o dominio de experiencia. En realidad es un término general que se compone de varias habilidades. Divido el proceso en tres partes: Teoría, Herramientas y Técnicas. Déjame explicarte cada componente.
- Cómo convertirse en un científico de datos como ingeniero de almacenamiento de datos con habilidades matemáticas y estadísticas pobres
- Cómo proceder para convertirse en un Científico de Datos después de graduarse de una rama no CSE / IT
- ¿Cuáles son las bibliotecas de Python que usan los científicos de datos?
- ¿Prefieres ser científico de datos o ingeniero de aprendizaje automático?
- ¿Un científico de datos gana más que un analista de negocios?
Teoría
Necesitas un buen conocimiento matemático. Debe sentirse cómodo con Estadística, Probabilidad y Álgebra lineal. Tener conocimiento de la optimización es una ventaja. Además, puede profundizar en un dominio particular como Procesamiento del lenguaje natural, Extracción de información, Visión por computadora, Bioinformática, Procesamiento del habla, etc. Encuentre buenos cursos que enseñen Estadística, Probabilidad y Álgebra lineal y luego pase a otras secciones cuando lo desee. .
Entonces necesitas estudiar Reconocimiento de patrones y Aprendizaje automático. Hay numerosos cursos en línea ofrecidos de forma gratuita. Únase al curso de Andrew Ng en Coursera. Las alternativas son cursos similares en Udacity y EdX. Debe comprender las matemáticas detrás de los algoritmos cubiertos y debe poder implementar los más simples.
Herramientas
Las herramientas comprenden lenguajes de programación y herramientas de software reales. Debe conocer al menos un lenguaje matemático como Matlab, R, Python y un lenguaje de programación regular como Java (también se puede usar Python). La mayoría de los científicos de datos que conozco conocen más de 4-5 idiomas como estos.
No te preocupes mucho por las utilidades de software. Existen numerosos institutos de capacitación cuyo negocio funciona con el último despliegue publicitario en la industria de TI. Te alejarían de todo lo demás y te harían concentrarte en una sola herramienta. Cada mes aparecen nuevas herramientas, y al menos una de ellas se convierte en estándar. Tendrá que sentirse cómodo con Frameworks como Hadoop, Spark, etc. Necesitará motores de base de datos NOSQL como Cassandra, MongoDB, Neo4J, etc. Luego hay herramientas de propiedad como las de SAS. Vaya a las herramientas después de que ya sea bueno con los idiomas.
Tecnicas
Las técnicas vienen con experiencia práctica y exploran cómo otros están haciendo las cosas. Debes haber trabajado en proyectos realistas. Kaggle es una plataforma perfecta para eso. Ve y pasa tiempo trabajando en Titanic Dataset. Pruebe diferentes algoritmos y enfoques. Intenta romper tus mejores puntajes. Pase a otros problemas como la Clasificación de sentimientos o el Reconocimiento de caracteres. La inscripción en el programa de Maestría en un instituto de primer nivel ayuda aquí: tales proyectos serán parte de sus cursos allí y habrá un entorno en el que seguirá aprendiendo de los demás.
Leer papeles Leer blogs Leer libros. Vea lo último en el campo. Estuvimos trabajando en métodos de kernel hace dos años, y ahora de repente los algoritmos de aprendizaje profundo están rompiendo los límites y produciendo excelentes resultados. Hay muchas cosas nuevas.
Extra:
Únete a este grupo: https://www.facebook.com/groups/…
Estoy activo allí y planeo comenzar una breve serie de videos dirigida a principiantes en Data Science. Habrá un par de otros científicos de datos y expertos en aprendizaje automático allí también.
Agrégame en Twitter: Aditya Joshi (@ adityajoshi5) | Gorjeo
Publico sobre los últimos eventos en los campos.
Puedes leer mis otras respuestas como seguimiento:
¿Cómo es el futuro de big data / data science? ¿Es difícil conseguir un trabajo de nivel de entrada? ¿Cuál es el salario esperado en la India?
¿Cuáles son los programas de maestría en línea gratuitos en análisis / ciencia de datos?
La respuesta de Aditya Joshi a ¿Qué tipo de proyectos realizan los científicos de datos?
¿Cuáles son las expectativas de un recién graduado contratado para un trabajo de científico de datos?
¡Lee y vota!
Si tiene alguna otra pregunta, no dude en publicar un comentario.