¿Cómo y dónde aprendo el aprendizaje automático? ¿Cómo puedo comenzar como científico de datos?

Para aprender el aprendizaje automático, debes ser mejor que el promedio en matemáticas. Estas son las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

Álgebra lineal-Álgebra lineal– MIT 18.06 Álgebra lineal por Gilbert Strang
Teoría de la probabilidad-Probabilidad y estadística – MIT 6.041 Análisis de sistemas probabilísticos y probabilidad aplicada por John Tsitsiklis
Cálculo
Cálculo de variaciones.
Teoría de grafos
Métodos de optimización (multiplicadores de Lagrange)
Cualquier lenguaje de programación ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como lenguaje y recomendaría los siguientes enlaces:

Aprendizaje automático con texto en scikit-learn (PyCon 2016)
Aprendizaje automático en Python con scikit-learn

Una vez cumplidos estos requisitos, puede por fin comenzar a considerar Machine Learning.

¿6 PASOS FÁCILES para utilizar el APRENDIZAJE DE MÁQUINAS?

Este es el lugar donde comienza la diversión. Ahora, se espera que la base comience a echar un vistazo a algunas informaciones. La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrica tus fundamentos de aprendizaje automático estudiando material relacionado con el tema:

a.) Las conferencias de Andrew Ng’s Machine Learning son un gran comienzo:

Colección de conferencias | Aprendizaje automático: YouTube

b.) Certificado de aplicaciones y minería de datos de Stanford:

Certificado de Posgrado en Minería de Datos y Aplicaciones

c.) Escuela de verano de aprendizaje automático:

https://www.youtube.com/playlist…

d.) Un enlace a la lista de reproducción completa está aquí (Lecture Collection | Machine Learning)
https://www.youtube.com/view_pla…

e.) “Pase la mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Tome un curso en línea

Lo principal que aconsejo a alguien que necesita ingresar al aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente directo y excepcionalmente eficiente, por lo que es un conocimiento extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando las personas me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”. En el caso de que me revelen que solicito que aclaren el contraste entre la Regresión logística y el SVM, PCA lineal frente a la factorización matricial, regularización o descenso de gradiente. He hablado con aspirantes que afirmaron años de encuentros de LD que no sabían la respuesta a estas preguntas. En su mayor parte, se aclaran claramente en el curso de Ng. Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros

Mi siguiente paso sugerido es obtener un libro de ML decente (mi lectura más abajo), leer las principales secciones de introducción, y después de eso rebotar a cualquier parte que incorpore un algoritmo, usted está interesado. Cuando haya descubierto ese algo, salte a él, vea cada uno de los puntos de interés y, en particular, impleméntelo. En el paso anterior del curso en línea, a partir de ahora habría actualizado algunos algoritmos en Octave. Sea como fuere, aquí estoy buscando ejecutar un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada L2, o k-means, pero también debe conducirse a actualizar todos los más intrigantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de obtener resultados equivalentes.

El razonamiento bayesiano y el aprendizaje automático de David Barber
El aprendizaje automático de Kevin Murphy: una perspectiva probabilística
Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
Reconocimiento de patrones y aprendizaje automático de Bishop
Aprendizaje automático de Mitchell

También hay numerosos libros excelentes que llaman la atención sobre un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplo antes de ser distribuido. Sea como fuere, necesita un par de esos libros para reunir una comprensión equilibrada y hasta cierto punto del campo.

Vea mi publicación anterior 10 eBooks gratuitos de lectura obligatoria sobre conceptos básicos de aprendizaje automático.

También puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y salte a él.

PASO 4.) Algoritmos más esenciales

Se confía en usted para conocer los aspectos básicos de un algoritmo esencial.

Vea mi anterior post 15 algoritmos que los ingenieros de aprendizaje automático deben saber.

PASO 5.) Juega con algunos conjuntos de datos enormes que son de acceso abierto.

Descubra un conjunto de datos que le parezca especialmente interesante o sobre el que tenga hipótesis y compruebe si tiene razón.

Datos del gobierno de EE. UU. Http://www.data.gov/

Ferrocarril Catering y Turismo Corporación http://www.irctc.co.in

PASO 6.) Participa con un equipo de personalización o aprendizaje automático centrado en el producto.

El grupo que busca debe estar cargado de ingenieros a quienes desea instruir y aprender. Esto lo mejorará para convertirse en un buen ingeniero de aprendizaje automático. Del mismo modo, al dividir un grupo de productos, descubrirá rápidamente cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

aprendizaje automáticoCiencia de datosEmpleos y carreras en Ciencia de datos

¿Qué busca Google en un candidato para un puesto de científico de datos? ¿Los criterios difieren si alguien obtiene el trabajo internamente?

¿Puedes convertirte en un científico de datos después de hacer biotecnología B.Tech?

Cómo ganar dinero como científico de datos sin estar empleado

¿Puede ser un científico de datos que nunca aprende sistemas de gestión de bases de datos como SQL?

¿Qué debo hacer para mejorar mis habilidades y conseguir un trabajo como científico de datos?

Actualmente soy un ingeniero de control de calidad que aspira a convertirse en científico de datos. ¿Qué tan práctico es hacer la transición?

Aprendizaje automático, hay prácticamente cuatro subáreas en las que debe centrarse:

Inferencia difusa

Redes neuronales

Programación evolutiva

Estadística

Hay sub algoritmos para cada tipo de área, por ejemplo, para la programación evolutiva puede tener algoritmos evolutivos normales, evolución diferencial, optimización de enjambre de partículas que es inteligencia de enjambre, algoritmos meméticos y estrategias de evolución, los algoritmos evolutivos tradicionales no vienen en un solo formato tan diferente Se pueden utilizar estrategias evolutivas para hacer que el algoritmo sea efectivo.

En las redes neuronales, puede tener la red neuronal Pertrontron que es un clasificador lineal, la red Pertrontron multicapa o la red neuronal de avance que es un clasificador no lineal, capaz de clasificar problemas donde los conjuntos de datos en los problemas no son linealmente separables. hace esto usando una capa de entrada y una capa de salida y capas ocultas entre estas capas en la topología. Luego se aplica la propagación hacia atrás para determinar los pesos y el número de neuronas en las capas ocultas, esto es solo un pase hacia adelante en la fase de entrenamiento seguido de un paso hacia atrás, el paso hacia atrás minimiza el error por comapring el resultado obtenido con el resultado esperado y Ajuste de los pesos de las neuronas y el número de neuronas (la red no necesita estar saturada)

La estadística es básicamente la teoría de la probabilidad utilizada para inferir ciertos eventos y usando la probabilidad para anticipar la probabilidad de ciertos resultados, utilizo Bayes bastante para mi propio trabajo, principalmente en la construcción de mapas probabilísticos que el robot usaría para realizar deducciones.

Si puede comenzar y enfocarse en estas áreas, debería estar bien y trabajar hasta el punto de contratar habilidades capaces en cada una de estas áreas.

Vivek Kumar

Sugiero siempre ir con material de código abierto. Se pueden comprar libros dados o puede hacer uso de pdf gratuito en línea.

Comience con “Introducción al aprendizaje estadístico con aplicaciones para R”.

Una vez terminado, aprenda Estadística computacional.

Avance al problema Titanic Kaggle.

En este momento obtendrá información sobre los alfabetos de ML. Más tarde, puede sumergirse en Visión por computadora, PNL o dominio relacionado para iniciar su proyecto individual / de equipo en ML.

Org. están buscando tales científicos de datos de ML como Microsoft, Samsung, etc.

Vivek Kumar

Necesitará una formación en matemáticas para comprender adecuadamente los algoritmos y poder aplicarlos correctamente a los problemas. Comenzaría con cálculo, álgebra lineal, estadística y teoría de la probabilidad. Eso debería darle una base suficiente para comenzar a aprender sobre los algoritmos. Para la ciencia de datos, recomendaría varios cursos de estadística (que cubren regresión lineal generalizada, diseños de ensayos, pruebas de hipótesis, Teorema del límite central …).

Para comenzar a aprender los algoritmos, primero intente una descripción general de alto nivel (como https://www.slideshare.net/Colle … luego, sumérjase en un libro de texto o lea documentos sobre el desarrollo de esos algoritmos. Elementos del aprendizaje estadístico es bueno , a medida que este libro repasa la teoría y proporciona problemas de práctica en R para jugar con los algoritmos.

Colleen Farrelly

Los comentarios a continuación son sugerencias bastante completas. Definitivamente, también recomendaría entender la psicología de cómo aprendes. Hay tantas opciones diferentes que tiene en línea que pueden ayudarlo en su educación, pero descubrir qué tan bien aprende es clave para asegurarse de que retiene todo a lo que está expuesto. Las clases en línea o tutoriales como otra publicación mencionada podrían ser realmente geniales para comenzar. Luego, intente leer todo lo que pueda sobre el aprendizaje automático, hay tantos lugares en línea que puede visitar para esto. Por encima de todo, asegúrese de practicar lo que aprende a medida que avanza. Pon a prueba tu comprensión aplicándolo a través de una práctica dedicada y consistente. Trabajo con una aplicación de recopilación de datos y lo mejor de la aplicación, Conseris, es que es accesible para todos los niveles de experiencia. Intenta encontrar recursos como ese también. Pase lo que pase, ¡nunca te rindas! ¡Puedes hacer cualquier cosa que te propongas! ¡Mejor!

Colleen Farrelly

More Interesting

¿Cómo logran los científicos de datos aprender todas las habilidades necesarias?

¿Cómo es beneficioso para un científico de datos aprender tecnologías de big data?

Cómo convertirse en un científico de datos de ser ingeniero mecánico

Como Data Scientist, ¿alguna vez tienes miedo de las decisiones importantes que tomas para una empresa?

¿Cómo es ser analista de datos y científico de datos en Airbnb?

¿Qué es más difícil para el científico de datos promedio, las matemáticas involucradas o la programación requerida? ¿Qué proporción del trabajo de un científico de datos se gasta en matemáticas versus programación?

¿Qué libros debe dominar un gran programador para convertirse en un científico de datos respetado?

¿Cuáles son algunas plataformas donde puedo obtener estadísticas / datos valiosos?

Soy un especialista en reclutamiento de 34 años. He hecho un pequeño análisis de mercado y tengo un don para las estadísticas. ¿Puedo convertirme en un científico de datos?

Cómo conseguir un trabajo de científico de datos en LinkedIn