¿Debo aprender más sobre algoritmos (en general, no sobre aprendizaje automático) para convertirme en un buen científico de datos?

Puede hacer la misma pregunta sobre matemáticas y otras áreas utilizadas por la ciencia de datos como un área amplia.

Yo diría que encuentre su “interés principal”. Que otras cosas sean secundarias a eso. Por ejemplo, mi interés principal es, al menos por ahora, en 4 funciones generales de ML: clasificación, regresión, agrupamiento, reducción de dimensionalidad. Estoy interesado en construir mecanismos que aprendan tales funciones, es decir: modelos, evaluadores (qué tan bueno es un modelo específico, también llamado función objetivo), optimizadores y medidas de desempeño. En cuanto a los tipos de datos, no me limito a ningún tipo de datos en particular, digamos imágenes. Porque, puede reducir todos los tipos de datos a “variables (cuantitativas o cualitativas) organizadas de varias maneras”. Por ejemplo, una imagen es una cuadrícula de variables discretas. El texto es una cadena de variables discretas. Para construir buenos mecanismos de aprendizaje realmente necesito las matemáticas, así que eso es algo muy importante e interesante para mí. Por otro lado, no me importa demasiado la eficiencia de los algoritmos, puedo aprender cosas nuevas a medida que avanzo. Además, no me importa ser un experto en un lenguaje de programación como R o Python, puedo recoger más según sea necesario.

Perdón por el largo mensaje, pero espero haber pintado un buen cuadro. En resumen, encuentre su “interés principal” y luego deje que otras cosas sean secundarias y recójalas según sea necesario, pero mantenga su enfoque principal en su interés principal. También el término “científico de datos” es muy amplio. Tal vez intente encontrar un tipo particular de datos que le interesen (por ejemplo, datos del genoma), y luego encuentre preguntas particulares que le gustaría responder sobre dichos datos. Una vez que haya resuelto estos problemas de alto nivel, puede recoger las cosas de bajo nivel como las matemáticas y los algoritmos a medida que avanza según sea necesario. Sugiero un enfoque de arriba hacia abajo. Calcule sus intereses de alto nivel, luego elija las mecánicas de bajo nivel que son necesarias para satisfacer sus intereses de alto nivel. No salte a cosas de bajo nivel como matemáticas y algoritmos sin ninguna motivación. Encuentre el tipo de datos que le encanta, encuentre las preguntas que le apasionan, luego divida y conquiste, y pregúntese, de acuerdo, qué algoritmos y matemáticas suelen usar las personas para hacer estas cosas. Pero de nuevo, NO salte a las matemáticas y los algoritmos solo porque escuchó en línea que esa pieza de matemática o agloritmo es “genial”. “Coolness” es relativo 🙂 … Encuentra tu interés y encuentra lo que es genial PARA TI.

En general, diría que no, a menos que encuentre una necesidad específica de ellos. En otras palabras, es una buena idea aprender a aprender sobre algoritmos para que, cuando surja la necesidad, pueda aprender uno nuevo fácilmente. Por supuesto, si planea implementar algoritmos de Machine Learning (ML), esa es otra historia. Muchos de estos requieren algoritmos numéricos, que son bastante diferentes a la clase de algoritmos estándar.

Existen algoritmos de áreas específicas del dominio que serían útiles, como los algoritmos de procesamiento del lenguaje natural (PNL).

En mi humilde opinión, es más importante conocer las diversas bibliotecas de ML y cómo aplicarlas.

Además, son más importantes las diversas técnicas y programas de análisis de datos, como R. Plus, programas de presentación y bibliotecas como ggplot o Matplotlib.

Por supuesto, más estadísticas y modelos matemáticos siempre es bueno.

Si planea ejecutar trabajos grandes, entonces es útil comprender Map-Reduce y las bibliotecas relacionadas.

También es bueno aprender los diversos lenguajes comúnmente utilizados con ML, como Python y R. Luego, también es bueno conocer un lenguaje compilado como Java o C ++.

Saber trabajar con AWS.

Básicamente, mire muchas publicaciones de trabajo de Data Science y vea cuáles son sus requisitos.

[adicional]

Al reflejar aún más mi carrera …

Ahora me doy cuenta de que una de las fortalezas que aporto a un problema es mi conocimiento de las estadísticas y cómo modelar el comportamiento de los datos. Con este conocimiento, puedo extraer características de los datos que nadie sospecha que estén allí. Esto es mucho más importante que conocer (por ejemplo) los algoritmos de búsqueda y clasificación.

No, ya que no te estás especializando en algoritmos de ML. Además, convertirse en un buen científico de datos es mucho más que un enfoque simplificado solo en algoritmos y Clem Wang ha hecho justicia a eso.

Salud.

Hola, creo que deberías.

Una cosa es simplemente ejecutar un código y otra es poder crear sus propios algoritmos. Mi creencia, y sé que no todos están de acuerdo, es que para ser un científico de datos real, debe ser capaz de crear los algoritmos manualmente, poder combinar algoritmos y, en última instancia, eso le permitirá contribuir al conocimiento de ds y crear nuevos algoritmos.

More Interesting

¿Cómo es ser un científico de datos en Instacart?

¿Cuál es el camino correcto para convertirse en un científico de datos?

¿Cuál es la diferencia entre trabajar en Walmart y Walmart Labs desde la perspectiva de un científico de datos?

En mi búsqueda de convertirme en científico de datos, elegí aprender R. Sin embargo, ¿es importante elegir el campo de especialización antes de aprender algún paquete?

¿Cómo aprender adecuadamente sobre big data y cursos para convertirse en un científico de datos? Por encima de eso, qué idiomas son imprescindibles para convertirse en un científico de datos profesional

¿Cómo puede un estadístico convertirse en un científico de datos?

Cómo usar de manera óptima los próximos seis meses si tengo que ser mejor en Data Science

¿Cómo saben las cosas los científicos?

Como novedad, ¿cuál es el alcance de comenzar una carrera en big data como científico de datos en India?

¿Qué algoritmos generales (no estadísticos o de aprendizaje automático) debe conocer un científico de datos?

¿Cuáles son las desventajas de ser un analista de datos o un científico de datos?

¿Es el campamento de entrenamiento de Zipfian Academy / Galvanize Data Science un campamento de alta calidad?

Cómo convertirse en un científico de datos en las Naciones Unidas

¿Hay un científico de datos que no tiene un título de CS?

Análisis de datos, ciencia de datos, análisis web, análisis de negocios: ¿Cuáles son los salarios típicos de los "científicos de datos" para las nuevas empresas en el Área de la Bahía?