¿Cuáles son los buenos libros para ‘científico de datos’ y ‘análisis de datos’ para principiantes?

Gracias por A2A,

Esta pregunta no da más luz sobre qué tipo de libros está buscando el autor de la pregunta.

¿Está buscando libros sobre científicos de datos? ¿O está buscando libros sobre innovación científica de datos y personalidades de ciencia de datos?

Primero déjenme ser claro aquí, el científico de datos no es un término único para tener libros. El científico de datos es en realidad un término amplio.

Definamos la ciencia de datos con la ayuda de la siguiente ecuación,

Ciencia de datos = Matemáticas + Estadística + Conocimiento de programación + Estructura de datos + Algoritmos + Aprendizaje automático + PNL + Recuperación de información.

  • El concepto matemático de hecho se requiere cuando se trata de cálculos. La ciencia de datos tiene que ver con el cálculo de datos. En matemáticas, requerimos conocimientos básicos sobre ‘Álgebra lineal, cálculo, matrices y determinantes. Aquellos que quieran actualizar su concepto matemático para ellos, hay un buen libro llamado ‘Matemáticas para los negocios’

Aquí puedes comprar este libro: https://www.amazon.com/Mathemati…

  • Las estadísticas se conocen como ciencia de la incertidumbre. A menudo se considera como ‘Alma’ de la ciencia de datos. Sin tener conocimiento de estadísticas, no puede ser un científico de datos. Puede dominar bien las cosas refiriéndose a un libro llamado ‘Head First: Statistics’

Compre aquí: http://shop.oreilly.com/product/…

Los usuarios indios lo compran aquí: http://www.amazon.in/Head-First-…

  • Para manipular los datos necesita tener conocimientos de lenguajes de programación. Si no tienes experiencia en TI, aún así estaría bien. Necesitas tener conocimiento de Python & R.

Para python, siga este enlace para obtener más información: la respuesta de Akash Dugam a ¿Cómo debo comenzar a aprender Python?

Para el lenguaje de programación R, es bueno tener el libro llamado ‘R for dummies’. Puedes comprarlo aquí: https://www.amazon.com/R-Dummies…

Los usuarios indios lo compran aquí: http://www.amazon.in/R-Programmi…

  • Una vez que aprenda Python, le sugiero que aprenda la estructura de datos y los algoritmos con el lenguaje de programación Python. Recomiendo un libro llamado ‘Estructura de datos y pensamiento algorítmico con Python’. Cómpralo aquí: https://www.amazon.com/Data-Stru…

Los usuarios indios lo compran aquí: http://www.amazon.in/Data-Struct…

  • Aprendizaje automático, la PNL será fácilmente comprensible una vez que tenga suficiente exposición en Python. Cómpralo aquí: Python Machine Learning: Sebastian Raschka: 9781783555130: Amazon.com: Libros

Los usuarios indios lo compran aquí: http://www.amazon.in/Python-Mach…

  • Para recuperar información, compre este libro: https://www.amazon.com/Introduct…

Los usuarios indios lo compran aquí: Amazon.in: Compre el libro de introducción a la recuperación de información del sur de Asia en línea a precios bajos en India

Nota al pie: si ha observado con atención, habría llegado a saber que Python es un lenguaje muy importante de la ciencia de datos. He creado un artículo completo sobre python y cómo debería aprenderlo. Siga este enlace para obtener más detalles: la respuesta de Akash Dugam a ¿Cómo debo comenzar a aprender Python?

Los amantes de R por favor aterrizan aquí: la respuesta de Akash Dugam a ¿Cómo aprendo la programación de R?

Actualizaré esta respuesta si encuentro más libros útiles en el futuro. Estén atentos 🙂

Gracias 🙂

Data Science es un término muy amplio. Tratemos de dividir y luego cotejar para obtener su respuesta.

Ciencia de datos = lenguaje de base de datos + estadística / aprendizaje automático + conocimiento de programación + herramienta estadística

Lenguaje y administración de bases de datos : puede aprender conceptos de DBMS en línea y W3Schools es el mejor lugar para aprender SQL. SQL es la madre de los lenguajes de bases de datos.

Estadísticas / Aprendizaje automático : puede seguir el sitio web de UCLA para aprender Estadísticas e inscribirse en varios cursos en Cousera para aprender ML. Para obtener más información sobre libros de estadísticas, siga mi enlace.

La respuesta de Paritosh Gupta a ¿Cuál es el mejor libro de estadísticas para principiantes?

Lenguaje de programación y herramienta estadística : puede aprender idiomas SAS / R. Estos lenguajes tienen su propia herramienta para programar.

Encuentre el enlace a continuación para libros y pautas de preparación para SAS-

La respuesta de Paritosh Gupta a ¿Cuánto tiempo lleva prepararse para la certificación del programador base SAS? ¿Cuáles son los recursos más útiles?

Aprender para Data Analytics es una habilidad y es la fusión de los tres puntos mencionados anteriormente. Debes estar bien versado con todo, pero la debilidad en uno puede compensarse con el comando en otro.

Big Data Eco System

  • Guía para principiantes de Hadoop.
  • Big Data para Dummies
  • Hadoop para tontos.

Estadística:

  • Amazon.com: Estadísticas conceptuales para principiantes (9780761833451): Isadore Newman, Carole Newman, Russell Brown, Sharon McNeely: Libros
  • Probabilidad de R?

R

  • Arrancador instantáneo R
  • Aprendizaje de minería de datos con R

Visialuzation de datos

  • Tableau For Dummies (Para Dummies (Computadora / Tecnología)): Molly Monsey, Paul Sochan: 9781119134794: Amazon.com: Libros
  • Cuadro de aprendizaje

Espero que tu inicio sea exitoso, si logras tu objetivo pronto 🙂

Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos: Victor-Mayer Schonberger y Kenneth Cukier

Analiza las ventajas y desventajas de Big Data, la influencia que tiene en el mundo moderno.

Big Data en el trabajo: disipando los mitos descubriendo oportunidades – Thomas H. Davenport

Discute sobre el uso de Big Data en el mundo empresarial moderno y la influencia que tiene.

Doing Data Science: Straight Talk From The Front Line – Cathy O’Niel y Rachel Schutt.

Este libro contiene conferencias de destacados científicos de datos que trabajan en Google, Microsoft, etc. El libro contiene estudios y algoritmos muy efectivos.

R Cookbook – Winston Chang

Te enseña todo lo que necesitas para comenzar con Big Data usando la programación R.

Pyhon para el análisis de datos: lucha de datos con pandas, NumPy e IPython – Wes McKinney

Te enseña todo lo que necesitas para comenzar con Big Data usando Python

Ciencia de datos ágil: creación de aplicaciones de análisis de datos con Hadoop – Russell Jurney

Enseña cómo usar el entorno Hadoop de manera efectiva.

Varios libros me vienen a la mente
Minería de datos: herramientas y técnicas prácticas de aprendizaje automático: Ian Witten, Eibe Frank y Mark Hall
Principios de minería de datos | Springer – Max Bramer
Introducción a la minería de datos – Pang-Ning Tan et al.

Recomiendo encarecidamente el primero de la lista, pero todos son buenos, en mi opinión.

Introducción al aprendizaje estadístico de Hastie y Tibshirani es un buen libro para comenzar. Puedes descargarlo gratis de internet. http://web.stanford.edu/~hastie/

Recomiendo The Signal and the Noise de Nate Silver, ya que explora en qué circunstancias el análisis basado en datos puede o no tener éxito en el mundo real.