Cómo pasar de un programador de computadoras a un científico de datos

  1. Aprende algunas matemáticas . Tal vez soy parcial, pero considero que esto es una parte muy importante de la ciencia de los datos y la informática, que a menudo se pasa por alto o simplemente se olvida. Las estadísticas y la probabilidad son una necesidad absoluta , por supuesto, pero también recomendaría aprender álgebra lineal (factorizaciones matriciales, etc.), así como familiaridad con las ecuaciones diferenciales . La optimización y el análisis numérico también son increíblemente útiles. Eso es solo un comienzo, pero una comprensión sólida de estos lo pondría cabeza y hombros por encima de muchos otros. Sin embargo, muchos analistas de datos provienen de un entorno matemático, por lo que cuanto mejor pueda manejarlo, mejores serán sus posibilidades de ser competitivo. Creo que si me contaras un campo de las matemáticas, puedo decirte cómo sería útil en el análisis de datos.
  2. NO hablas … quiero decir … APRENDE ALGUNAS MATEMÁTICAS.
  3. Siguiendo directamente el primer punto, gane algo de experiencia en un lenguaje como R. Un científico de datos que no conoce las estadísticas Y cómo lidiar computacionalmente con las estadísticas es como una bicicleta sin ruedas: inútil. Ahora, no todos los científicos de datos necesitan saber R específicamente, pero es necesario un lenguaje que pueda hacer manipulaciones matemáticas y estadísticas. También mire en Python , si aún no lo sabe. Se está volviendo más popular en la escena. Demonios, incluso Matlab podría ser útil.
  4. Aprenda sobre computación distribuida y paralela . Como todo, diferentes personas te dirán diferentes cosas sobre por qué la plataforma ‘tal y tal’ es genial, o por qué la plataforma ‘tal y tal’ es terrible, pero al principio, simplemente ahogar eso. Hadoop es un buen lugar para comenzar ( especialmente estar familiarizado con MapReduce ), y no estaría de más conocer algunos CUDA u OpenCL .
  5. Vea algunos algoritmos e implementaciones de Machine Learning. No iría tan lejos como para afirmar que necesita un dominio completo sobre el tema, pero es realmente útil.

El análisis de datos es un campo enorme y complicado, por lo que no hay forma de que esto (o el de cualquier otra persona) sea una lista completa. Realmente, lo que podría hacer es sentarse con un par de amigos, pensar en qué tipo de datos / información les interesaría a las personas y encontrar una manera de comenzar a obtenerlos. Cosas como descubrir hábitos de acceso al sitio web de ciertas personas y crear algoritmos / ecuaciones para clasificar y definir los tipos de personas que visitan sitios web específicos. Por supuesto, la mayoría de los sitios ya lo están haciendo, pero siempre podrías encontrar algo interesante. O, para practicar, cree un sitio web con encuestas en línea y use los datos ingresados ​​para intentar obtener algún tipo de información (“X cantidad de personas de la región Y, como la opción Z. ¿Qué nos dice esto?”).

More Interesting

Al elegir entre convertirse en un científico de datos y un ingeniero de software, ¿cuál tiene el mejor futuro?

¿Cómo fue tu viaje como científico de datos? ¿Cómo puedo convertirme en un científico de datos (perplejo, no estudiante de CS)?

¿Cómo debo comenzar a tener un buen trabajo de nivel de entrada en Big Data?

¿Cuáles son las mejores charlas de ciencia de datos (por ejemplo, Pydata, seminarios, etc.)?

¿Hay empresas que ofrezcan trabajos de formación remunerados en ciencia de datos?

Acabo de solicitar estudios de posgrado en CS pero no tengo conocimiento previo. ¿Qué habilidad debo aprender para prepararme para una carrera como científico de datos?

¿Cómo se promueven los científicos de datos en Facebook?

¿Cuáles son los 3 errores comunes que comete Data Scientist?

¿En qué se parecen o difieren los deberes de los investigadores cuantitativos de la experiencia del usuario con los deberes de los científicos de datos que se centran en el análisis (en lugar de los científicos de datos que se centran en la construcción)?

¿Cuáles son las habilidades matemáticas que necesita un científico de datos?

¿Está bien seguir una carrera en ciencia de datos si soy un asco en el "cálculo"?

¿Cuál es la mejor universidad para un científico de datos?

Con muchos años de experiencia en análisis de datos y generación de informes, ¿qué herramienta de visualización de datos debo aprender a trabajar en el mundo de los científicos de datos?

¿Qué tipo de habilidades necesito como científico de datos, especialmente como cuantitativo en la industria financiera?

¿Cuál es el alcance de la nube HPC + o el análisis de big data + cloud? ¿Cuál tiene un futuro mejor?