¿Qué debería uno aprender a ser un científico de datos?

No hay como requisito específico necesario. Sin embargo, le sugiero que reconsidere su enfoque. Si está comenzando con la ciencia de datos, entonces no debería preocuparse sobre qué grado obtener. Creo que deberías pensar en qué aprender si tienes una razón para convertirte en un científico de datos. Expondré la importancia del grado desde el punto de vista del aspirante y el punto de vista del empleador, y ambos concluyen en una sola cosa, mientras que un título puede ser útil para aprender ciencia de datos, pero no es todo lo que puede hacer que un científico de datos tenga éxito.

Visión del empleador: hubo un momento a fines de los años 80 hasta principios de la década de 2000 en el que las personas contrataban solo los primeros de un lote, personas con más y más títulos y certificados. Pero para nuestro mejoramiento, la situación ahora ha cambiado. A mi modo de ver, los certificados y títulos son solo una prueba de que ha completado un curso en particular. No habla de tu conocimiento de habilidades. Durante la contratación, vi una brecha significativa entre nuestras necesidades como industria y los académicos que le enseñan. De alguna manera, después de entrevistar a 45 candidatos, seleccionamos a 6 personas. Así que creo que esta es la era del talento.

Visión del aspirante: si usted es un aspirante a científico de datos y tiene el entusiasmo suficiente para aprender ciencia de datos, no creo que un título haga una gran diferencia. Aunque un título le daría peso a su currículum, no puede evitar que se convierta en un científico de datos. Si tiene suficiente conocimiento y dedicación, la falta de certificados y títulos no puede detenerlo.

Aquí hay algunas cosas que debe saber para aprender ciencia de datos. Si tienes un amplio conocimiento de ellos, estoy seguro de que conseguirías un trabajo.

Fundación

  • Python Básico, Intermedio y Avanzado
  • Estadística, probabilidad y álgebra lineal
  • Regresión lineal, series de tiempo y función de costo
  • Tipos de datos y análisis exploratorio de datos
  • Recopilación, extracción, consulta, limpieza y agregación de datos para análisis
  • Fuentes de datos, limpieza y disputas
  • Trabajando con API
  • Raspado web

Avanzado

  • Árboles de decisión, árboles condicionales
  • Técnicas de conjunto
  • Big Data y Hadoop Ecosystem y Spark
  • Arquitectura HDFS
  • Colmena QL
  • Cerdo
  • Contar historias con datos
  • Codificación Visual
  • Cuadro
  • Bayes ingenuos
  • PNL / Agrupación de texto / NLTK
  • PCA y reducción de dimensiones
  • Implementación de productos de Data Science

El objetivo principal de la ciencia de datos es ayudar a resolver problemas comerciales complejos con la ayuda de datos. Para ser precisos, si no trabaja en problemas reales de la industria, no podrá prepararse como un científico de datos exitoso.

Siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica.

Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo.

Algunos puntos a considerar al elegir una institución / curso

  1. El énfasis está más en la práctica y no solo en la teoría.
  2. El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
  3. Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
  4. Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

Y en mi opinión, las certificaciones son una prueba de que ha completado un curso o un programa y no una prueba de lo que ha hecho. ¡Debes haber leído muchos artículos sobre desempleo educado o incluso haber encontrado algunas experiencias personales en las que muchos estudiantes tienen una maestría pero aún no tienen trabajo!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

Algunos enlaces rápidos

  • Programa – http://www.greyatom.com/full-sta…
  • Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

(A2A – ¡gracias!)

Bueno, parece que tienes muchos de los conceptos básicos cubiertos: ¡felicidades!

Mire, la ciencia de datos es en realidad una definición bastante fluida , y cambia ligeramente entre organizaciones. En mi opinión, ya tiene los conocimientos suficientes para solicitar un puesto de interno / junior en al menos algunas empresas, y eso es lo que debe hacer: tiempo para una experiencia en el mundo real.

Dicho esto, aquí hay dos pensamientos:

  • Termina tus cursos de Python y adquiere fluidez en Python, y posiblemente en otro idioma (R es probablemente una buena opción): descubrirá que gran parte de su trabajo será acceder a datos, limpiarlos y extraer características de ellos, y que su desempeño en estas tareas dependerá principalmente de sus habilidades de codificación.
  • Haz al menos un curso introductorio a Machine Learning. Esto es importante, porque (a) se requiere conocimiento en muchos (¿la mayoría?) De los roles para los que se entrevistará, y (b) le proporciona herramientas valiosas para su conjunto de herramientas como científico de datos. Yo personalmente recomiendo el aprendizaje de los datos de CalTech. Es un curso en línea gratuito.

Como señala Tinashe Michael Tapera en su respuesta, Kaggle siempre es un buen lugar para poner a prueba sus habilidades, ya que ofrece muchos problemas del mundo real de diferentes dificultades para resolver.

Gracias por el A2A.

Si está buscando una carrera en análisis de datos, le sugiero que tome un trabajo en una de las compañías de análisis: Mu Sigma, asociados de ZS, Fractal, Tredence, etc. Estas compañías en su mayoría no necesitan requisitos previos para ingresar. realizar trabajos de analista de nivel y brindar grandes oportunidades para aprender las habilidades desde cero

Si eso no es posible para usted, le sugiero que tome la siguiente progresión para aprender análisis de datos en cada una de las áreas clave:

Matemáticas

  1. Parámetros básicos de estadísticas y resumen de datos como media, mediana, moda, tendencias centrales, distribuciones, etc.
  2. Integridad de datos, pruebas de comparación y tendencia como prueba t, prueba z, prueba f
  3. Regresión: lineal, logística, GLM, mixta en ese orden
  4. Técnicas avanzadas como modelado predictivo y métodos prescriptivos.

Tecnología

  1. Microsoft Excel: este es el Santo Grial de la analítica. Aprende esto dentro y fuera. Desde fórmulas simples hasta la herramienta de análisis de datos y el tablero, debe aprenderlo todo
  2. VBA: esta es una extensión de Excel y, aunque no se usa mucho, puede ayudar a facilitar muchas tareas en Excel
  3. SQL: esta es la progresión lógica de Excel para manejar volúmenes de datos más grandes y también para estandarizar procesos y crear módulos de código para uso repetido
  4. SAS / R: el siguiente paso será una de estas herramientas, ya que pueden ayudarlo a realizar un procesamiento más complejo como la regresión y el modelado
  5. Tableau: este es casi el estándar en este momento para la visualización de datos y el tablero
  6. Tecnologías avanzadas como Shiny, Hadoop, Hive, etc.

Negocio

  1. Trabajo de diferentes verticales como Tecnología, Farmacia, Salud, Retail, Banca, etc.
  2. Aplicaciones de análisis en cada una de estas verticales.

Algunos recursos útiles y gratuitos:

  1. Libro de estadísticas gratis
  2. Su hogar para la ciencia de datos – Kaggle
  3. Tutorial SQL – W3Schools
  4. SQLZOO – Práctica SQL
  5. SAS Customer Support Knowledge Base and Community – El mejor lugar para aprender sobre muchas de las características
  6. Tableau Training & Tutorials – Videos de capacitación gratuitos de Tableau
  7. Aprenda Excel, trazando en línea – Chandoo
  8. Inicio – Analytics Vidhya – Manténgase actualizado

Espero que esto ayude.

DataCamp publicó recientemente una guía visual de 8 pasos que debe seguir para aprender ciencia de datos. Puede encontrarlo aquí: Learn Data Science – Infographic.

En resumen, los ocho pasos son:

Paso 1. Sé bueno en estadísticas, matemáticas y aprendizaje automático

Este primer paso es realmente importante y le proporciona la base sólida que necesita para hacer ciencia de datos.

Paso 2. Aprende a codificar

¡Conozca los fundamentos de la informática (algoritmos, tipos de datos, …), comprenda cómo funciona el desarrollo de extremo a extremo, elija un idioma y comience a codificar!

Paso 3. Comprender las bases de datos

Debe comprender cómo funcionan las bases de datos y los almacenes de datos, cómo se modelan los datos y cómo puede consultar las bases de datos. Aprenda a trabajar con SQL y NoSQL.

Paso 4. Explore el flujo de trabajo de ciencia de datos

Comprenda cómo funciona el flujo de trabajo de la ciencia de datos e intente realmente recorrerlo: aprenda a trabajar con los diferentes paquetes y bibliotecas o herramientas que existen para comprender lo que debe hacer. Comprenda también que este es un proceso circular que realmente no termina pronto.

Paso 5. Sube de nivel con Big Data

Comprenda por qué Big Data es diferente de otro procesamiento de datos. Familiarícese con los marcos Hadoop y Spark.

Paso 6. Crecer, conectarse y aprender

Después de estos pasos, principalmente teóricos, es hora de seguir creciendo. Participe en un desafío, reúnase con sus compañeros, configure su propio proyecto favorito y desarrolle su intuición y capacidad para hacer preguntas críticas sobre sus datos, su enfoque y su análisis.

Paso 7. Sumérgete por completo

Es hora de sumergirse por completo. Ingrese a un campamento de entrenamiento, obtenga una pasantía u obtenga un trabajo (dependiendo de lo competente que ya sea).

Paso 8. Comprometerse con la comunidad

No se olvide de interactuar con la comunidad de ciencia de datos: siga y participe en Facebook, LinkedIn, Google+, Reddit, … Grupos. No olvide contribuir siempre que pueda o hacer preguntas que puedan ayudar a otros. Siga a las personas clave de la industria de la ciencia de datos y suscríbase a algunos boletines. Escuche podcasts, … Las posibilidades son infinitas.

¿Cómo me convierto en un científico de datos? Creo que la respuesta corta es: como con cualquier rol técnico, no es necesariamente fácil o rápido, pero si eres inteligente, comprometido y dispuesto a invertir en aprendizaje y experimentación, entonces, por supuesto, puedes hacerlo.

En una publicación anterior, describí mi punto de vista sobre “¿Qué es un científico de datos?”: Es un papel híbrido que combina el “científico aplicado” con el “ingeniero de datos”. Muchos desarrolladores, estadísticos, analistas y profesionales de TI tienen algunos antecedentes parciales y buscan hacer la transición a la ciencia de datos.

Y entonces, ¿cómo se hace eso? Su enfoque probablemente dependerá de su experiencia previa. Estas son algunas perspectivas a continuación, desde desarrolladores hasta analistas de negocios.

Desarrolladores Java

Si eres un desarrollador de Java, estás familiarizado con los principios de ingeniería de software y prosperas en la creación de sistemas de software que realizan tareas complejas. La ciencia de datos se trata de construir “productos de datos”, esencialmente sistemas de software basados ​​en datos y algoritmos.

Un buen primer paso es comprender los diversos algoritmos en el aprendizaje automático: qué algoritmos existen, qué problemas resuelven y cómo se implementan. También es útil aprender a usar una herramienta de modelado como R o Matlab. Las bibliotecas como WEKA, Vowpal Wabbit y OpenNLP proporcionan implementaciones bien probadas de muchos algoritmos comunes. Si aún no está familiarizado con Hadoop: aprender a reducir mapas, Pig and Hive y Mahout serán valiosos.

Desarrolladores de Python

Si es un desarrollador de Python, está familiarizado con el desarrollo de software y las secuencias de comandos, y es posible que ya haya utilizado algunas bibliotecas de Python que a menudo se usan en ciencia de datos, como NumPy y SciPy.

Python tiene un gran soporte para aplicaciones de ciencia de datos, especialmente con bibliotecas como NumPy / Scipy, Pandas, Scikit-learn, IPython para análisis exploratorio y Matplotlib para visualizaciones.

Para lidiar con grandes conjuntos de datos, obtenga más información sobre Hadoop y su integración con Python a través de la transmisión.

Estadísticos y científicos aplicados.

Si proviene de un entorno de estadísticas o de aprendizaje automático, es probable que ya haya estado utilizando herramientas como R, Matlab o SAS durante años para realizar análisis de regresión, análisis de agrupamiento, clasificación o tareas similares de aprendizaje automático.

R, Matlab y SAS son herramientas sorprendentes para el análisis estadístico y la visualización, con implementaciones maduras para muchos algoritmos de aprendizaje automático.

Sin embargo, estas herramientas generalmente se usan para la exploración de datos y el desarrollo de modelos, y rara vez se usan de forma aislada para crear productos de datos de grado de producción. En la mayoría de los casos, debe mezclar varios otros componentes de software como Java o Python e integrarlos con plataformas de datos como Hadoop, al crear productos de datos de extremo a extremo.

Naturalmente, familiarizarse con uno o más lenguajes de programación modernos como Python o Java es su primer paso. Me resultó muy útil trabajar en estrecha colaboración con ingenieros de datos experimentados para comprender mejor la mentalidad y las herramientas que utilizan para crear productos de datos de calidad de producción.

Analistas de negocios

Si su experiencia es SQL, ha estado utilizando datos durante muchos años y comprende muy bien cómo utilizar los datos para obtener información comercial. Es probable que el uso de Hive, que le brinda acceso a grandes conjuntos de datos en Hadoop con primitivas SQL familiares, sea un primer paso fácil para usted en el mundo de los grandes datos.

La ciencia de datos a menudo implica el desarrollo de productos de datos que utilizan aprendizaje automático y estadísticas a un nivel que SQL no puede describir bien o implementar de manera eficiente. Por lo tanto, el siguiente paso importante hacia la ciencia de datos es comprender este tipo de algoritmos (como motores de recomendación, árboles de decisión, PNL) a un nivel teórico más profundo, y familiarizarse con las implementaciones actuales de herramientas como Mahout, WEKA o Scikit de Python. -aprender.

Desarrolladores de Hadoop

Si es desarrollador de Hadoop, ya conoce las complejidades de los grandes conjuntos de datos y la informática en clúster. Probablemente también esté familiarizado con Pig, Hive y HBase y tenga experiencia en Java.

Un buen primer paso es obtener una comprensión profunda del aprendizaje automático y las estadísticas, y cómo estos algoritmos se pueden implementar de manera eficiente para grandes conjuntos de datos. Un buen primer lugar para buscar es Mahout, que implementa muchos de estos algoritmos sobre Hadoop.

Otra área a considerar es la “limpieza de datos”. Muchos algoritmos asumen una cierta estructura básica para los datos antes de que comience el modelado. Desafortunadamente, en la vida real los datos son bastante “sucios” y prepararlos para el modelado tiende a ocupar una gran parte del trabajo en ciencia de datos. Hadoop es a menudo una herramienta de elección para la limpieza y preprocesamiento de datos a gran escala, antes del modelado.

Pensamientos finales

El camino hacia la ciencia de datos no es un paseo por el parque. Tienes que aprender muchas disciplinas nuevas, lenguajes de programación y lo más importante: adquirir experiencia en el mundo real. Esto requiere tiempo, esfuerzo y una inversión personal. Pero lo que encuentras al final del camino es bastante gratificante.

¿Qué es la ciencia de datos?

Todos los días, creamos 2.5 quintillones de bytes de datos, tanto que el 90% de los datos en el mundo de hoy se han creado solo en los últimos dos años. Estos datos provienen de todas partes: sensores utilizados para recopilar información climática, publicaciones en sitios de redes sociales, imágenes y videos digitales, registros de transacciones de compra y señales GPS de teléfonos celulares, por nombrar algunos. Estos datos son datos grandes y constituyen principalmente los datos no estructurados. Este Big Data ofrece un desafío en términos de almacenamiento y análisis posteriores en tiempo real. Uno puede cavar una mina de oro si somos capaces de dar sentido a los grandes http://data.En un mundo global y altamente interconectado en el que vivimos, la mayor potencia es la información correcta. Data Science, Big Data y Business Analytics es, por lo tanto, la herramienta principal para cualquier organización, sociedad, gobierno. buscar la ventaja competitiva y la optimización del ecosistema existente. Una carrera en Business Analytics, Big Data y Data Science promete muchos desafíos, oportunidades y recompensas.

¿Qué hacen los científicos de datos?

Los científicos de datos son súper hombres que cuentan historias a partir de los datos, respectivamente del tamaño de los datos: grandes o pequeños. Responden preguntas como lo que está sucediendo. ¿Lo que sucederá? ¿Qué deberíamos hacer ahora? Estos se denominan comúnmente BI, análisis predictivo y análisis prescriptivo. Utilizan estadísticas, aprendizaje automático, PNL, R, Python, Hadoop, Spark para crear Crystal Ball para predecir el futuro, resolver problemas de negocios o descubrir las oportunidades que faltan. ¿Cuál es el proceso para convertirse en un científico de datos? ¿Programa de posgrado? La Maestría en Ciencia de Datos, Business Analytics y Big Data (PGP-BA-Big Data) es el primer programa de ciencia de datos de alta gama de la India diseñado y entregado por la Escuela de Negocios, Ciencia de Datos y Telecomunicaciones Aegis en asociación con IBM y para capacitar a la nueva generación de datos -profesionales profesionales. Este programa de 11 meses le brinda capacitación práctica intensiva para desarrollar el conjunto de habilidades necesarias y únicas requeridas para una carrera exitosa en los campos de más rápido crecimiento e intelectualmente estimulantes de Data Science, Big Data, Business Analytics, Predictive Analytics, NLP, ML y Cognitive Informática. Los estudiantes que obtienen un PGP desarrollan capacidades cuantitativas profundas y experiencia técnica y están equipados para crear valor comercial y social mediante la extracción de conocimientos útiles y su aplicación en diversas industrias al desempeñar un papel de científico de datos o analista comercial moderno. Este programa se imparte en el Centro por Excelencia “IBM Business Analytics Lab” y “IBM Cloud Computing Lab” en Mumbai, Pune y Bangalore.

Estructura de crédito globalmente aceptable

Este programa sigue 45 unidades de crédito globalmente aceptables para maestría. En América del Norte, cualquier maestría es un mínimo de 36 unidades de crédito. Este programa se extiende por 9 meses más 2-3 meses de pasantía o asignación de consultoría.

Habilidad para diversas industrias y áreas funcionales.

El plan de estudios satisface los requisitos de habilidades en diversas industrias como comercio electrónico, telecomunicaciones, bancos, servicios informáticos, educación, atención médica, seguros, manufactura, venta minorista y otras industrias

Modelos de entrega

Programa de postgrado a tiempo completo en ciencia de datos, análisis de negocios y big data.

Programa Ejecutivo de Posgrado en Ciencia de Datos, Business Analytics y Big Data. ( Modelo de fin de semana , especialmente diseñado para profesionales que trabajan)

Para cualquier asistencia, contacte a:

Shaikh Juned Afzal – Asesor de Ciencia de Datos y Evangelista,

MOB: 9986563087 Correo: [email protected]

Gracias por la A2A

Te sugiero que sigas el camino a continuación:

TEP 1 : aumente sus habilidades matemáticas, especialmente el cálculo y las estadísticas de múltiples variables, así como el aprendizaje automático.

  1. Álgebra Lineal (MIT OCW)
  2. Pista de Matemáticas (Academia Khan)
  3. Estadísticas -Udacity / Introducción abierta
  4. Aprendizaje automático (Stanford Online / Coursera (John Hopkins))

PASO 2 – Aumente sus conocimientos de informática y habilidades de programación

  1. CS50x – EDX
  2. Elija su idioma: recomendaría elegir dos y aumentar sus habilidades con ellos en lugar de hacerlo todo: R / SAS o Python / SPSS (Esta es solo una combinación recomendada R y SAS no son lo mismo \ U0001f61b)
  3. Aprende el idioma \ U0001f602 \ U0001f602 (Academia de códigos y Datacamp (R)

PASO 3 – Aprenda bases de datos (este es un paso muy esencial) Debe aprender –

  1. MongoDb
  2. Cassandra
  3. MySql
  4. Apache CouchDb
  5. PostGreSql

PASO 4 – Aprenda munging de datos y visualización de datos

  1. Aprender a usar herramientas como Datawrangler.
  2. Herramientas de aprendizaje como ggvis.
  3. Informes de datos a través de: Tableau, Spitfire, etc.

PASO 5 – Sube de nivel con Big Data

  1. Aprenda y comprenda análisis de big data.
  2. Aprende MapReduce, Hadoop y Apache Spark.

PASO 6 – Práctica y experiencia

  1. Participa en competiciones de Kaggle
  2. Pasante en empresas
  3. Conozca a otros científicos de datos

Data Scientist es considerado como “El trabajo más sexy del siglo XXI”

Los científicos de datos son responsables del análisis de datos con el objetivo de descubrir ideas que a su vez pueden proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Su función es analizar datos desde diferentes ángulos, determinar qué significa y luego recomendar formas de aplicar esos datos. Emplean sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y prescriptivos. También son responsables de comunicar las predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos.

Me alegra mucho saber que está interesado en Data Science y que ya comenzó a hacerlo. Ahora, ser un Científico de Datos no es pan comido, requiere muchas habilidades y prácticas involucradas en el dominio. Para eso se requiere ser entrenado adecuadamente por un experto en la industria con la experiencia adecuada. Debe estar familiarizado y tener experiencia en Estadística, Programación R, Modelado predictivo, Algoritmos de aprendizaje automático y Minería de texto.

Aparte de eso, le sugiero que haga muchos proyectos y tareas para tener éxito y practicar lo que ha aprendido a lo largo de todo el proceso, y que alguien de la industria lo valide.

Además, otro problema que surge es al momento de la contratación porque, aparte de la ubicación en el campus, es raro que las empresas que contratan a Data Scientist contraten de manera más reciente y busquen candidatos con experiencia.

edWisor es una de esas plataformas que proporciona una combinación de capacitación en vivo y en línea de Data Scientist de profesionales con experiencia en la industria.

¡Todo lo mejor!

Gracias.

Data Scientist es considerado como “El trabajo más sexy del siglo XXI”

Los científicos de datos son responsables del análisis de datos con el objetivo de descubrir ideas que a su vez pueden proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Su función es analizar datos desde diferentes ángulos, determinar qué significa y luego recomendar formas de aplicar esos datos. Emplean sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y prescriptivos. También son responsables de comunicar las predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos.

Me alegra mucho saber que está interesado en Data Science y que ya comenzó a hacerlo. Ahora, ser un Científico de Datos no es pan comido, requiere muchas habilidades y prácticas involucradas en el dominio. Para eso se requiere ser entrenado adecuadamente por un experto en la industria con la experiencia adecuada. Debe estar familiarizado y tener experiencia en Estadística, Programación R, Modelado predictivo, Algoritmos de aprendizaje automático y Minería de texto.

Aparte de eso, le sugiero que haga muchos proyectos y tareas para tener éxito y practicar lo que ha aprendido a lo largo de todo el proceso, y que alguien de la industria lo valide.

Además, otro problema que surge es al momento de la contratación porque, aparte de la ubicación en el campus, es raro que las empresas que contratan a Data Scientist contraten de manera más reciente y busquen candidatos con experiencia.

edWisor es una de esas plataformas que proporciona una combinación de capacitación en vivo y en línea de Data Scientist de profesionales con experiencia en la industria.

¡Todo lo mejor!

Gracias.

Las matemáticas, matemáticas bastante avanzadas, son un comienzo. Entonces estadísticas.

Hay una razón para esto. Para cuando califique, habremos alcanzado la singularidad. Las máquinas serán más inteligentes que los humanos para muchas tareas. Se necesitará un nivel cada vez mayor de humanos para resolver lo que acaban de aprender o resolver, ya sea que haya hecho una suposición o error fundamental y cómo ayudarlo a retomar el camino, sin desaprender lo que acaba de aprender.

En la próxima década, Datascientist está a punto de convertirse en un trabajo frustrante que conducirá al fracaso final.

Pero esa es la posición de vanguardia. La posición de cero a uno.

También hay una posición de 1 a N: extender la ciencia de datos a las muchas organizaciones que lo necesitan.

“Los planes comerciales de las próximas 10,000 nuevas empresas son fáciles de pronosticar: tome X y agregue IA. Esto es un gran problema, y ​​ahora está aquí “. Kevin Kelly

Esto pronto no requerirá mucha ciencia de datos. Programas como TensorFlow se están generalizando y un programador competente puede hacer gran parte del trabajo.

Así que decide dónde encajas. ¿Serás como Lee Sedol, el mejor del mundo en Go, que está jugando el programa AlphaGo de DeepMind hoy y si no pierde este año, seguramente perderá el próximo?

¿O pretendes entrar como un nuevo participante contra todos los análisis de datos, inteligencia empresarial, programadores y otros que se renuevan frenéticamente como datascientíficos para aprovechar la oportunidad 1 a N?

De cualquier manera, como nuevo participante, probablemente haya perdido el bote.

Es demasiado corto para caber en una respuesta de Quora, pero hay una gran publicación de Medium de un reclutador de científicos de datos que cubre todo lo que necesita hacer para convertirse en un científico de datos. Aquí hay un extracto:

“Partí con el objetivo de responder dos preguntas muy amplias:

  • ¿Qué habilidades se requieren para la ciencia de datos, y cómo debe tomarlas? (Capítulos uno, dos y tres)
  • Desde una perspectiva del mercado laboral, ¿qué pasos puede tomar para maximizar sus posibilidades de obtener empleo en ciencia de datos? (Capítulo cuatro)

¿Por qué estoy calificado para escribir esto? Bueno, hablo con científicos de datos todos los días y para ser un reclutador eficaz, necesito comprender las trayectorias profesionales, lo que hace a un buen científico de datos y lo que los empleadores buscan al contratar. Así que ya poseo algunos conocimientos al respecto. Pero también quería saber directamente de aquellos que han recorrido este camino, así que comencé a hablar con científicos de datos de diferentes orígenes para ver qué podía descubrir. Y esto me llevó a un viaje a través de ex ingenieros de software, un ex astrofísico e incluso un ex físico de partículas que, para mi entusiasmo, había estado involucrado en uno de los mayores avances científicos del siglo XXI “.

Aquí hay un enlace a la publicación de Medium. He trabajado como científico de datos desde 2015, y esta es la mejor descripción que he visto hasta ahora sobre los pasos que debe seguir.

Guía especialmente útil para aquellos que no solo quieren aprender cómo adquirir las habilidades técnicas, sino también aprender a ser un candidato empleable.

A2A. Las descripciones de trabajo de ciencia de datos le indicarán el requisito de título para el trabajo, por lo general, es una licenciatura en cualquier materia y capacitación en ciencia de datos que puede variar desde especializaciones MOOC, certificaciones o nano grados que están disponibles a través de Coursera, edX o Udacity (respectivamente ) a UIUC Master of Computer Science in Data Science (MCS-DS) | Coursera.

Antes de tomar una decisión sobre un título, le recomiendo leer 5 cosas que debe saber antes de obtener un título en ciencias de datos.

La imagen a continuación muestra lo que se conoce como diagrama de venn de un científico de datos. Como puede ver, hay muchos sabores y muchos caminos.

Por ejemplo, puede ser un programador o un hacker o un profesor de informática. Ubicarte en el diagrama de Venn te da claridad sobre qué más necesitas aprender y cuál es tu progresión.

Por ejemplo, una combinación de habilidad de programación con conocimiento estadístico lo lleva al área del Equipo R Core sugiriendo que si un Programador quiere usar R, un conocimiento de estadísticas es esencial. De esta manera, se pueden desarrollar muchas ideas ubicándose en el diagrama y trabajando hasta el centro de la imagen.

Echa un vistazo a la nueva serie de tutoriales. Hit Suscribir

Programming_in_R: Análisis de datos

Haga clic en el enlace de abajo

Programación en R – YouTube

Si te gustó el video, no olvides SUSCRIBIRTE. Nunca te pierdas una actualización.

HABILIDADES DE UN CIENTÍFICO DE DATOS

Habilidades estadísticas

Habilidades computacionales

Python, SQL, Hive, Pig, SAS, R o al menos algunos de estos son necesarios para convertirse en un analista de datos.

Habilidades para resolver problemas

Conocimiento de la industria objetivo

Habilidades de comunicación

No es de extrañar hoy que Data Scientist (o roles relacionados, como Data Manager, Statistician, Data Analyst, etc.) sea una de las carreras profesionales más buscadas. En respuesta a esta tendencia intersectorial, varias universidades importantes han comenzado programas dedicados a la ciencia de datos.

Seducidos por las tremendas oportunidades, la gran compensación y la visibilidad para los líderes empresariales, muchas personas se están moviendo hacia la carrera profesional de Data Scientist sin una evaluación exhaustiva y cuidadosa de las responsabilidades diarias de dicho rol, la actitud requerida; y equilibrio de habilidades técnicas y comerciales.

Dada la oportunidad de rehacer la licenciatura, me especializaría en Ciencias de la Computación y menor en Estadística. Los estudiantes de Ciencias de la Computación trabajan en proyectos durante la licenciatura, por lo que obtendrás una sólida formación en programación. También tienen cursos introductorios decentes en Machine Learning para que entres por la puerta. El conocimiento de las estadísticas ayudaría a comprender mejor las matemáticas detrás del análisis de datos, el modelado estadístico, las pruebas de hipótesis y una gran cantidad de otros campos en la tubería de Machine Learning.

También podría recomendar una especialización en estadísticas y una especialización en informática: siempre que haya algo de “informática”. Algunos tipos de estadísticas que conozco son brillantes, pero les resulta difícil poner sus conocimientos en código. El conocimiento tanto de estadística como de informática es lo mejor.

Trabaja en tus habilidades de Hadoop, aprendizaje automático y minería de datos. Tome algunos cursos en línea para mejorar o ampliar su conjunto de habilidades.

¡Comienza a aprender estadísticas y matemáticas ampliamente!

¡Es posible que desee comenzar a trabajar como ingeniero de datos o analista de datos!

Una vez que crea que conoce todas las estadísticas y las matemáticas que necesitará, puede solicitar un trabajo real de “Científico de datos”.

Gracias por el A2A! 🙂

La ciencia de datos es un deporte de equipo.

Al menos, ese es el consenso de una encuesta realizada por Bob Hayes de Business Over Broadway (BOB) y Analytics Week preguntando a los científicos de datos sobre sus habilidades y la composición del equipo. El setenta y seis por ciento de los encuestados dijeron que habían trabajado con una o más personas en sus proyectos de análisis.

estas 9 habilidades son necesarias para convertirse en científico de datos

Habilidades técnicas: análisis

  1. Educación : los científicos de datos son altamente educados: el 88% tiene al menos un título de maestría y el 46% tiene doctorados, y aunque hay excepciones notables, generalmente se requiere una formación académica muy sólida para desarrollar la profundidad del conocimiento necesario para ser un científico de datos. Sus campos de estudio más comunes son Matemáticas y Estadística (32%), seguido de Ciencias de la Computación (19%) e Ingeniería (16%).
  2. SAS y / o R : conocimiento profundo de al menos una de estas herramientas analíticas, para la ciencia de datos se prefiere generalmente R.

Habilidades técnicas: informática

  1. Codificación Python
  2. Plataforma Hadoop
  3. Base de datos SQL / Codificación
  4. Datos no estructurados

Habilidades no técnicas

  1. Curiosidad intelectual
  2. Visión para los negocios
  3. Habilidades de comunicación

Formación en línea del científico de datos en EE. UU. | India | reino unido | australia

llámenos: -9052699906

http://www.rstrainings.com

Aprenda álgebra lineal + análisis real + técnicas de optimización + probabilidad + computación estadística + inferencia estadística + análisis multivariante (incluidas técnicas de regresión) + aprendizaje automático (clasificación de patrones y redes neuronales).

Luego solicite el puesto de Data Scientist.

He analizado 350 descripciones de trabajo con el título de trabajo “Científico de datos”, principalmente de Bay Area CA, Nueva York

para averiguar qué tipos de educación son más exigentes para un científico de datos. Hay algunos puestos de trabajo en los que los requisitos de educación son aprendizaje automático, ciencia de datos o inteligencia artificial. Como son una combinación perfecta para el puesto de científico de datos (buena suerte), no los consideré.

Las principales habilidades basadas en las ofertas de trabajo actuales son las siguientes, pero es un gran campo donde puedes encontrar un nicho. Echa un vistazo a este mapa de habilidades a continuación de jobmego. Podría ayudar.

  1. aprendizaje automático
  2. R
  3. python (lenguaje de programación)
  4. sql
  5. Minería de datos
  6. apache hadoop
  7. SAS
  8. base de datos
  9. java (lenguaje de programación)
  10. desarrollo de software
  11. chispa (lenguaje de programación)

De jobmego

More Interesting

Como analista de datos, ¿qué pasos debo seguir para convertirme en científico de datos?

¿Cómo es beneficioso para un científico de datos aprender tecnologías de big data?

Una empresa lo contrató como científico de datos para crear un sistema de recomendación de restaurantes. ¿Cuáles son las tareas del científico de datos para lograr su objetivo?

Soy un graduado en ciencias de la computación. ¿Puedo convertirme en un científico de datos?

¿Qué piensan los codificadores, matemáticos y científicos de alto nivel sobre la eficiencia de tiro de Steph Curry?

¿Qué es lo emocionante de Big Data?

¿Qué pueden aprender los economistas de los científicos de datos?

¿Cuáles son las mejores empresas en la India para trabajar como Data Scientist? ¿Qué tan buenos son los salarios?

¿Hay empresas que ofrezcan trabajos de formación remunerados en ciencia de datos?

Estoy en tercer año de ingeniería y quiero ser científico de datos. Pero estoy completamente confundido por dónde empezar. Entonces, ¿cómo debo hacerlo?

¿Qué startups o empresas tienen vacantes para ingenieros de aprendizaje automático o científicos de datos en Bangalore?

¿Cómo convertirse en un científico de datos sin un título?

Actualmente soy un ingeniero de control de calidad que aspira a convertirse en científico de datos. ¿Qué tan práctico es hacer la transición?

¿Los científicos independientes se ven más afectados por los recortes en la financiación científica que los científicos que trabajan en universidades?

Cómo presentar su investigación de doctorado en una entrevista con un científico de datos, especialmente si su tema de investigación se encuentra en un campo muy específico (no relevante)