Bueno, es importante tener ciertos conocimientos de programación para comenzar su carrera en Data Science. Es más importante tener los conceptos de Estadística / Matemáticas y uno puede aprender las habilidades del lenguaje de programación.
Te puedo sugerir algunos puntos para comenzar tu carrera en ciencia de datos:
1. Construir bases de estadísticas / aprendizaje automático
- ¿Puede la creciente cultura de la toma de decisiones basada en datos en la industria tecnológica fusionar los roles de gerente de producto y científico de datos?
- ¿Las empresas de Silicon Valley contratan a especialistas en ciencia de datos o expertos específicos para el procesamiento del lenguaje natural, la conducción automatizada, etc.?
- ¿Puedo ser científico si estudio una licenciatura en química?
- ¿Qué tan preocupado estaría su empresa / organización por poner datos en la nube?
- Estoy trabajando como científico de datos por $ 100K en Chattanooga. Tengo una oferta por $ 160K en San Francisco. Con el ajuste de COLA, ¿es esta una oferta justa?
- Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
- Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
- Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
- Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.
2. Adquirir habilidades técnicas en análisis
- En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara a la industria por sorpresa. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
- Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
- Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlo en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
- Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.
3. Lea sobre las aplicaciones comerciales de Data Science
- Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de este y también conoce varios casos de uso exitosos.
- Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
- Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.
4. Participar en varios concursos de ciencia de datos.
- Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com. Incluso analyticsvidhya.com organiza concursos de ciencia de datos.
Pero sugeriría pasar por algunas de las competencias pasadas en kaggle y replicar algunos de los guiones para comprender el modus-operandi. El nivel de competencias en kaggle es alto y uno puede aprender a manejar conjuntos de datos desafiantes y encontrar soluciones.
Además, la discusión en los foros con entusiastas de la ciencia de datos con ideas afines puede ser útil.
En la escuela de ciencias de datos GreyAtom, equiparamos la educación con la Realidad. Aprendemos y practicamos tecnologías futuras con datos REALES proporcionados por Industry Partners. Nuestro programa es desarrollado por académicos de clase mundial en colaboración con profesionales de la industria. Nuestros instructores y desarrolladores de planes de estudios se encuentran entre los mejores institutos a nivel mundial y en India, a saber, IIT, IIM, la Universidad Estatal de Nueva York en Buffalo, el Instituto Max-Planck de Informática en Alemania y muchos más.
Nuestro programa permite a un alumno aplicar técnicas de resolución de problemas y pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos. Además, desarrollará un perfil sólido de contribuciones de código abierto que ayudarán a la comunidad más amplia de ingeniería de software a través de Github, StackOverflow y Kaggle.
Además, puede verificar los detalles del programa haciendo clic en este enlace: –
Programa in situ de GreyAtom: ciencia de datos, aprendizaje automático, Big Data
Le invitamos a compartir todas sus dudas e inseguridades prestando atención a lo que nuestro Consejero Académico hará todo lo posible para guiarlo hacia su camino profesional hacia el éxito. Programe una sesión de asesoramiento según su conveniencia en:
Calendly – GreyAtom
Descargo de responsabilidad: soy cofundador de @GreyAtom y mi pasión es ayudar a las personas a encontrar carreras sostenibles en Data Science.