¿Qué libros debe dominar un gran programador para convertirse en un científico de datos respetado?

En primer lugar, gracias A2A

Puede comenzar con estos materiales y, paso a paso, encontrará otros para convertirse en un Data Scientist profesional.

  • Big Data (para empezar):
    • Big Data For Dummies muy buen libro.
    • Hadoop para tontos.
    • Guía para principiantes de Hadoop
  • Estadística:
    • Amazon.com: Estadísticas conceptuales para principiantes (9780761833451): Isadore Newman, Carole Newman, Russell Brown, Sharon McNeely: Libros
    • Pensamiento estadístico para ciencia de datos y análisis Pensamiento estadístico para ciencia de datos y análisis (curso Edx)
  • R
    • Arrancador instantáneo R
    • Aprendizaje de minería de datos con R
  • Para ver los tutoriales, consulte la respuesta de Abdelbarre Chafik a ¿Podría aprender a ser un científico de datos mediante tutoriales en línea?

Leer sin practicar no es muy útil para conseguir trabajo, pero si realiza algún proyecto Your Home for Data Science, manejará más temas y también tendrá una gran oportunidad de conseguir un trabajo más rápido.

Espero que ayude 🙂

Aquí hay algunos buenos libros con los que puedes comenzar. Algunos de ellos pueden comenzar de manera muy simple, pero luego retomarlo.

Libros de resumen de ciencia de datos

R para ciencia de datos: Importar, ordenar, transformar, visualizar y modelar datos (9781491910399): Hadley Wickham, Garrett Grolemund: Libros

Ciencia de datos desde cero: primeros principios con Python 1, Joel Grus, eBook

Estadísticas

Estadísticas prácticas para científicos de datos: 50 conceptos esenciales (9781491952962): Peter Bruce, Andrew Bruce: Libros

R

Recetas probadas para análisis de datos, estadísticas y gráficos (O’Reilly Cookbooks): Paul Teetor: 8601400898512: Amazon.com: Libros

Aprendizaje automático

Conceptos, herramientas y técnicas para construir sistemas inteligentes: Aurélien Géron: 9781491962299: Amazon.com: Libros

Python Machine Learning eBook: Sebastian Raschka: Tienda Kindle

Amazon.com: Machine Learning con R

Amazon.com: Fundamentos del aprendizaje automático para el análisis de datos predictivos: algoritmos, ejemplos trabajados y estudios de casos (MIT Press) (9780262029445): John D. Kelleher, Brian Mac Namee, Aoife D’Arcy: Libros

Redes neuronales

Haga su propio libro electrónico de red neuronal: Tariq Rashid: Tienda Kindle

Martin T Hagan, Howard B Demuth, Mark H Beale, Orlando De Jesús: 9780971732117: Amazon.com: Libros

No estoy seguro de qué camino desea explorar dentro de la ciencia de datos, pero estos libros serán un buen comienzo para que comprenda los fundamentos de la ciencia de datos.

gran pregunta y si se domina, un fantástico / lucrativo temblor de habilidades.

Esto es lo que creo que captura sobre todo:

Análisis matricial de Horn

Los elementos del aprendizaje estadístico Segunda edición por Hastie et al.

Optimización convexa por Boyd

Esos tres abarcan muchas de las herramientas y el conocimiento matizado para tener éxito en la OMI dado que probablemente esté familiarizado con NLP, IR, estructuras de datos y algoritmos.

Realmente me gusta Mining Massive Data Sets donde nuestro amigo Anand Rajaraman es uno de los autores … los capítulos sobre minhash y hashing sensible a la localidad son imprescindibles para un ingeniero / científico de datos moderno.

No hay tales “libros” que deba dominar para convertirse en un Científico de Datos. En cambio, yo diría, domina las “habilidades”. Eso te convertiría en un respetado científico de datos.

Hay muchas capacitaciones en línea disponibles que pueden ayudarlo a aprender las diversas técnicas necesarias para convertirse en un científico de datos. Hay muchos entrenamientos diseñados para enseñarle Big Data, Hadoop, etc. que pueden resultar inmensamente útiles en su carrera de Data Science.

Incluso para todas las demás necesidades de programación suyas, hay muchos recursos disponibles en línea que pueden ayudarlo. Haga una lista de las herramientas y tecnologías que desea dominar y apúntelas. Ir a través de video conferencias, cursos en línea, cualquier recurso disponible. Presta atención al adquirir la habilidad en sí.

La razón por la cual un tutorial en línea sería beneficioso en este sentido es porque: un tutorial le enseña de manera sistemática. Dado que los expertos en el campo le enseñan, saben mejor lo que necesita aprender primero y lo que sigue.

Yo trabajo para COSO IT . Somos consultores y formadores de Data Science, Big Data, Inteligencia Artificial, Aprendizaje automático y análisis . Después de trabajar con varios proyectos en las últimas tecnologías , también compartimos nuestro conocimiento a través de la capacitación en varias tecnologías más recientes. Nuestra capacitación es casi en tiempo real con desafíos reales que enfrentamos mientras trabajamos en el proyecto.

¡La mejor de las suertes!

¡Aquí hay algunos recursos gratuitos para comenzar!

  • Libro electrónico gratuito sobre ciencia de datos con R
  • Comenzando con Python para Data Science
  • Python para análisis de datos
  • Un Python indispensable: el abastecimiento de datos para la ciencia de datos.
  • Tutorial SQL
  • Estadísticas prácticas para científicos de datos: 50 conceptos esenciales (9781491952962): Peter Bruce, Andrew Bruce: Libros

    ______________________________________________________________________

  • Datos: gobierno, estado, ciudad, local y público
  • Datos: API, Hubs, Marketplaces y Plataformas
  • Conjuntos de datos públicos gratuitos

Vea la respuesta del usuario de Quora a ¿Cómo aprendo minería de datos en un mes?

No tengo ninguna posición como esta, pero he leído un poco y he tomado algunos MOOC y he pagado cursos en línea.

  1. Aprendiendo de los datos, Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin
  2. Teoría de la información, inferencia y algoritmos de aprendizaje, David JC MacKay [pdf gratuito]
  3. Todas las estadísticas, Larry Wasserman
  4. Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción, Trevor Hastie, Robert Tibshirani, Jerome Friedman [pdf]
  5. Modelos gráficos probabilísticos: principios y técnicas, Daphne Koller, Nir Friedman

No, pero sé qué libros leer.

1. R Cookbook por Paul Teetor
2. Aprendizaje automático para hackers por Drew Conway y John Myles White
3. Libro de cocina de gráficos R de Winston Chang
4. Programación de inteligencia colectiva por Toby Segaran (conocido popularmente como PCI)
5. Python para el análisis de datos por Wes McKinney para los usuarios avanzados, si ya conoce a los pandas, debe mirar esta presentación de Wes sobre cuáles son las deficiencias de los pandas.
6. Ciencia de datos ágil por Russell Jurney

Hay más pero estos son buenos. Además, conviértete en un mejor investigador.

Creo que no hay ninguno. Ninguna compañía respetará que usted conozca ciencia de datos simplemente leyendo un libro de programación o simplemente yendo a una clase de MooC. Debe crear proyectos, publicarlo en GitHub y compartir sus proyectos para demostrar que conoce estadísticas, modelado de datos, programación, visualización, etc. Las 2 herramientas de programación utilizadas en Data Science son R y Python.

Aprende estadísticas y aprendizaje automático.

R (todas las cosas estadísticas), Python (numpy) y Lua / torch (si desea profundizar en las redes neuronales), Java y Scala (para Spark y MLlib) son algunos de los lenguajes recomendados. Pero para las estadísticas, Sas y Spss también podrían ayudar.

Mira a Kaggle y prueba algunas de las competiciones.

Práctica práctica práctica.

Necesitarás matemáticas y estadísticas. Recomendaría una base sólida en cálculo, álgebra lineal y estadística. Si no los tiene, aplicará ciegamente algoritmos y hará inferencias incorrectas.

Amigo, ¿por qué necesitas libros? Internet está lleno de esas cosas. Mira este sitio:

Escuchar datos

Cómo ingresar al campo de Analytics

Para obtener estadísticas, puede borrar los conceptos básicos de Khan’s Academy. Aprendizaje automático de algos que puede aprender de Coursera o Datacamp.

More Interesting

¿Qué recomienda para un estudiante de primer año de EE y CS para poder obtener un trabajo como científico de datos? ¿Y qué hacen realmente los científicos de datos junior?

¿Es posible que una persona que ha trabajado durante tres años en soporte de TI se mueva a la ciencia de datos? En caso afirmativo, ¿cómo comenzar y avanzar?

¿Cuánto conocimiento de programación se requiere para un analista de datos o un científico de datos?

Cómo aprender ciencia de datos como estudiante de matemáticas

Como científico de datos o ingeniero de aprendizaje automático, ¿cuánto tiempo dedicas a los algoritmos?

¿Debo ser un científico computacional en lugar de un ingeniero de software si prefiero aprender matemáticas en lugar de lenguajes de programación?

Quiero cambiar mi carrera a científico de datos. Soy ingeniero quimico. ¿Qué tengo que hacer?

¿Qué es lo que más te gusta de ser un científico de datos en el día a día?

¿Qué tan raros son los científicos de datos?

¿Cuáles son las oportunidades de salida para analistas de negocios y científicos de datos?

¿Es la industria de la ciencia de datos / aprendizaje automático propensa al espectáculo y a los charlatanes? ¿Existen roles en la industria que sean adecuados para personas que no creen que tengan buenas habilidades sociales o de presentación / presentación (pero buenas habilidades técnicas)?

¿Cómo trabajan juntos los científicos de datos y los ingenieros de aprendizaje automático en una aplicación industrial ML / NLP / CV de extremo a extremo en una gran empresa tecnológica?

¿Qué piensan los científicos de datos experimentados sobre 'El proceso de ciencia de datos' descrito en Harvard CS 109 (2013) (ver imagen)?

¿Puedo ser un científico de datos sin aprender Python?

¿Puedo ser científico si estudio una licenciatura en química?