¿Cuánta codificación se requiere para el trabajo de analista de datos y científico de datos? ¿Puede un no programador hacerlo?

Bueno, es importante tener ciertos conocimientos de programación para comenzar su carrera en Data Science. Es más importante tener los conceptos de Estadística / Matemáticas y uno puede aprender las habilidades del lenguaje de programación.

Te puedo sugerir algunos puntos para comenzar tu carrera en ciencia de datos:

1. Construir bases de estadísticas / aprendizaje automático

Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.

2. Adquirir habilidades técnicas en análisis

En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara a la industria por sorpresa. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlo en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.

3. Lea sobre las aplicaciones comerciales de Data Science

Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de este y también conoce varios casos de uso exitosos.
Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.

4. Participar en varios concursos de ciencia de datos.

Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com. Incluso analyticsvidhya.com organiza concursos de ciencia de datos.

Pero sugeriría pasar por algunas de las competencias pasadas en kaggle y replicar algunos de los guiones para comprender el modus-operandi. El nivel de competencias en kaggle es alto y uno puede aprender a manejar conjuntos de datos desafiantes y encontrar soluciones.

Además, la discusión en los foros con entusiastas de la ciencia de datos con ideas afines puede ser útil.

En la escuela de ciencias de datos GreyAtom, equiparamos la educación con la Realidad. Aprendemos y practicamos tecnologías futuras con datos REALES proporcionados por Industry Partners. Nuestro programa es desarrollado por académicos de clase mundial en colaboración con profesionales de la industria. Nuestros instructores y desarrolladores de planes de estudios se encuentran entre los mejores institutos a nivel mundial y en India, a saber, IIT, IIM, la Universidad Estatal de Nueva York en Buffalo, el Instituto Max-Planck de Informática en Alemania y muchos más.

Nuestro programa permite a un alumno aplicar técnicas de resolución de problemas y pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos. Además, desarrollará un perfil sólido de contribuciones de código abierto que ayudarán a la comunidad más amplia de ingeniería de software a través de Github, StackOverflow y Kaggle.

Además, puede verificar los detalles del programa haciendo clic en este enlace: –

Programa in situ de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Le invitamos a compartir todas sus dudas e inseguridades prestando atención a lo que nuestro Consejero Académico hará todo lo posible para guiarlo hacia su camino profesional hacia el éxito. Programe una sesión de asesoramiento según su conveniencia en:

Calendly – GreyAtom

Descargo de responsabilidad: soy cofundador de @GreyAtom y mi pasión es ayudar a las personas a encontrar carreras sostenibles en Data Science.

Análisis de datosCiencia de datosEmpleos y carreras en Ciencia de datos

Cómo convertirse en un científico de datos del desarrollador de software

¿Cuáles son los marcadores de los equipos de ciencia de datos altamente efectivos?

¿Es posible que un ingeniero civil con 10 años de experiencia en el campo central y una edad de 37 años pueda convertirse en un científico de datos?

¿Cuál es el mayor problema para un científico de datos?

¿Cómo logran los científicos de datos aprender todas las habilidades necesarias?

Tomé la ingeniería mecánica como mi rama en BE y no puedo entender CAED. ¿Qué tengo que hacer?

La primera pregunta es ¿quieres ser un científico de datos o un analista de datos? La diferencia es el foco. Un científico de datos tiene más habilidades entremezcladas como programación, estadísticas, minería de datos y se enfoca en crear modelos para inferir o predecir el uso de datos. A menudo, esto se convierte en un producto de datos. Un analista de datos está más preocupado por comprender las ideas de los datos y por informar a las partes que lo necesitan. Un científico de datos viene más del lado de la ingeniería y un analista de datos viene más del lado de los negocios.

Estas diferencias también se traducen en el conocimiento requerido para la programación. Por lo general, en los negocios, un analista de datos realiza mucha menos programación, si es que lo hace. En muchas empresas, el trabajo se realiza en Excel o Minitab y luego se visualiza utilizando un software de visualización como Qlikview o Tableau. Microsoft Power BI también se ha convertido en una buena herramienta para los analistas de datos. Además, muchas compañías ofrecen sus propios paquetes de BI, como OBIEEE de Oracle. Como analista de datos, querrás ser bueno en estas tecnologías. Estas herramientas requieren poca programación y un no programador puede pasar. El enfoque en un analista es elaborar una historia de datos y presentar datos. También puede haber algunos requisitos para aprender un poco de SQL para obtener datos de las bases de datos.

Un científico de datos confía en mucha más programación. La razón es porque la ciencia de datos es mucho más técnica y, en cierta medida, más artística. El científico de datos necesita programar para tener la mayor flexibilidad posible. Parece contrario a la intuición que la programación es mejor que el software de apuntar y hacer clic, pero nuevamente se reduce a la flexibilidad. Si está programando, puede hacer y probar casi cualquier cosa que desee. Se mejora la creatividad y la calidad de las respuestas que obtendrá son mejores cuando puede ajustar un algoritmo a sus necesidades. Esto es especialmente cierto con el aprendizaje automático y la predicción. Existen herramientas que eliminan algunas necesidades de programación, como Microsoft Azure Machine Learning, pero de nuevo poder modificar algoritmos e incluso escribir sus propios algoritmos es más poderoso. Además, la programación proporciona una mejor investigación reproducible porque es fácil ver qué se hizo con los datos para obtener la respuesta presentada.

Espero que este desglose ayude. ¡Hay muchas opiniones por ahí y estos campos están cambiando día a día! Es menos complicado, entonces podría pensar en aprender ciertos lenguajes de programación. Si desea obtener más información sobre análisis y ciencia de datos, visite nuestro sitio web en http://www.bizscisolutions.com y lea nuestro blog, regístrese en nuestro boletín y esté atento a más contenido, incluidos libros electrónicos, seminarios web, seminarios ¡y más!

Kajal Puri

Como analista de datos, estará codificando en R o Tableau, lo que es fácil de aprender, implementar y usar.

Como Data Scientist, DEBE conocer la programación probabilística / estadística porque el trabajo de Data Scientist está muy inspirado en las ecuaciones matemáticas de probabilidad y estadística. Además, depende del tipo de organización para la que esté trabajando. Algunas grandes organizaciones contratan a científicos de datos para resolver problemas matemáticos y codificarlos en algún idioma, mientras que las pequeñas empresas emergentes les piden que también se implementen en la web. Por lo tanto, varía de una organización a otra, pero sí, la codificación es una parte importante del trabajo del Data Scientist.

Shweta Doshi

En lo que respecta a la parte de analista, no necesita ninguna habilidad de codificación específica como python, pero realmente necesita tener conocimiento de la herramienta de análisis como Tableau y R también es útil en el análisis, lo que no es una parte difícil de adivinar. Y tampoco podemos ignorar la perspectiva y el dominio al que están vinculados. Para ser un científico de datos que realmente necesita tener una buena comprensión de los algoritmos de ML, una sólida programación y habilidades analíticas, la estadística es una de las claves y la experiencia sí cuenta aquí.

Espero que esto ayude..

Kajal Puri

Conocer R y Python es bastante esencial para un analista de datos y un científico de datos porque estos lenguajes proporcionan una gran cantidad de funcionalidad requerida por las aplicaciones de ciencia de datos. Hay un blog en Intellipaat que establece que el conocimiento en Python es responsable de salarios más altos. Cuanto mayor sea la cantidad de codificación realizada por los científicos de datos, mayor será su salario. La visualización de datos y la manipulación de datos deben ser sobresalientes por los científicos y analistas. Trabajando alrededor de la biblioteca ggplot2 que proporciona excelentes visualizaciones gráficas, los profesionales de datos requieren dplyr, que se utiliza para la manipulación de datos.

Un no programador no podrá hacer frente a estos requisitos de codificación, aunque puede sobresalir en la transmisión de historias de negocios que también es bastante importante. Para construir arquitecturas de datos competentes, el científico de datos debe tener conocimientos de codificación y el analista también debe poder codificar de manera experta para ser bueno en análisis. Es posible que desee considerar la capacitación de Intellipaat en ciencia de datos. Por ahora visite su sitio web:

Curso de formación en certificación de ciencia de datos – Intellipaat

Shweta Doshi

More Interesting

¿Qué tipo de ingeniero de software tendrá más demanda en el valle? IOS / C ++ / Científico de datos?

¿Qué tan difícil es para un científico de datos cambiar de la academia a la industria?

¿Cuál es la mejor manera de convertirse en un científico de datos para alguien con experiencia en comercio y 3.5 años de experiencia corporativa?

¿Cuál es la mejor ruta de transición del usuario operativo de SAP al científico de datos?

¿Cuál es el mejor trabajo para alguien a quien le encanta construir interfaces que interactúan con los sistemas de datos y está en el proceso de adquirir habilidades de ciencia de datos?

¿Cuáles son los requisitos esenciales para ser un científico de datos?

¿Debería continuar mejorando mis habilidades de JavaScript y Jquery si estoy interesado en convertirme en un Científico de Datos?

¿Los mejores científicos de datos tienen una maestría en Estadística o CS?

Cómo realizar prácticas como científico de datos en startups