¿Puedo aplicar los algoritmos de aprendizaje automático sin saber cómo funcionan realmente para resolver el problema de la ciencia de datos y convertirme en científico de datos?

Tú puedes y debes.

Déjame contarte mi historia. Todos comienzan desde algún lado. Soy un ingeniero mecánico. Sin título de CS. No hay educación formal de matemáticas / estadísticas. Conseguí un trabajo de analista de negocios. Durante los primeros tres años realizó un gran trabajo de informes, incluidos Excel / SQL, Spotfire.

Entonces se presentó la oportunidad y mi gerente me invitó a su oficina:

Gerente: Quiero que aprendas algo de Python.

Yo: Pero nunca he hecho programación en mi vida. ¿Porqué ahora?

Gerente : Hay algo llamado Algoritmo de bosque aleatorio que se está haciendo famoso. Como usted es el único desarrollador que no es PHP / Javascript, pensé que podría ayudarnos (Business Read: Dado que usted es el único que no tiene trabajo en sus manos, ¿por qué no hace algo?)

Entonces fui a google. Lea para qué se utiliza el algoritmo. Acabo de entender un poco sobre la declaración del problema de clasificación. Obtuve un blog de alguien que lo había implementado en Python. Copia pegó su código. Corrió en mi máquina local. ¡¡¡Y voilá!!! Utilizamos ese pequeño fragmento de código para ejecutarlo en un conjunto de datos de clasificación para esa compañía y lo incluimos en un producto. Mi gerente quedó impresionado.

En ese momento no conocía ninguna ciencia de datos. No sabía acerca de Entropía, árboles de decisión, validación cruzada, etc., etc. Para decirle la verdad, el modelo que creé podría haberse adaptado demasiado como el infierno. Solo sé que fue un comienzo. Y considero que ese comienzo es muy importante.

A partir de entonces comencé a probar muchos modelos para hacer la misma tarea. Empecé con Kaggle. Y cuando no pude competir, comencé a leer más. Tomé muchos MOOC abiertos. Aprendí cosas nuevas. Estaba abierto a aprender cosas nuevas. Estaba abierto a entender cosas nuevas. Y un día me di cuenta de que podía entender las matemáticas detrás si estaba dispuesto a poner esfuerzo.

Empecé con amplitud y finalmente me metí en la profundidad de las cosas.

Entonces, sí, puede comenzar a aplicar modelos de aprendizaje automático sin comprender las matemáticas. Empieza Prueba la sangre. Ensúciate las manos. Ejecuta el algoritmo. Intenta mejorarlo jugando con los parámetros y leyendo en la red. Estoy seguro de que en el proceso aprenderá mucho sobre el funcionamiento interno de los algoritmos. Y tal vez algún día estarás lo suficientemente motivado para entenderlos completamente.

Si. Un gran y audaz .

Puede resolver un problema de ciencia de datos sin siquiera tener una comprensión básica del algoritmo que utilizó para resolver el problema.

Puede emplear fácilmente un algoritmo de bosque aleatorio para resolver un problema de clasificación sin siquiera comprender los dos niveles de aleatoriedad que tiene el algoritmo, o sin siquiera saber qué es el empaquetamiento.

El motivo es obvio. Hay paquetes que se han desarrollado (tanto en R como en Python) que implementa estos algoritmos para usted sin que usted sepa todos y cada uno de los matices que tienen lugar detrás de escena. Todo lo que tiene que hacer es ejecutar un fragmento de código.

Pero la pregunta es ¿estará satisfecho con este tipo de comprensión? ¿Estarás orgulloso de lo que acabas de hacer? Si su respuesta es sí, no lea más .

Siempre es una buena práctica comprender para qué están destinados los pequeños fragmentos de código y los parámetros del modelo. Le ayuda a comprender mejor el tema, mejora su confianza y lo hace mejorar en el aprendizaje automático.

¿Pero debería esperar para comprender el concepto por completo y luego solo tratar de codificarlo? Yo diría que no.

Cuando aprendo un nuevo concepto en el aprendizaje automático, me acerco al aprendizaje utilizando un enfoque de amplitud primero en lugar de profundidad primero. La razón es que tengo que implementarlo rápido. Leía muchos blogs, leía muchos tutoriales en lugar de centrarme en uno solo, guardaba un marcador de los mejores tutoriales y los visitaba de nuevo.

Aprenda los pequeños conceptos y luego intente fusionarlos todos para tener una idea justa del panorama general. Comience con el uso del paquete. Obtenga el fragmento de código más simple para hacer su trabajo. Ahora, busque formas de mejorar la precisión, intente comprender qué significan cada uno de los parámetros, cómo se relacionan entre sí y otras preguntas importantes.

Visite los tutoriales nuevamente y esta vez comprenderá los conceptos mucho mejor que la última vez. Aprendo usando un enfoque iterativo.

Me aseguro de entender los pequeños matices y comprender perfectamente cómo funcionan a largo plazo.

Escribo ocasionalmente sobre aprendizaje automático aquí. Conseguir.

Hola:

Puede aplicar algunos algoritmos sin conocer el concepto subyacente y también puede tener un éxito moderado, sin embargo, su crecimiento a largo plazo en la industria puede ser limitado. Trabajará con personas que son excelentes para realizar múltiples tareas y trabajar con diferentes herramientas y técnicas con facilidad. Además, serán expertos en análisis estadístico, conocimiento de dominio y habilidades técnicas.

Muy pronto tendrá que ser similar a ellos o se quedará atrás.

En mi opinión, las siguientes son las habilidades que debe tener para una carrera exitosa en ciencia de datos:

  • Amor por los números y las cosas cuantitativas.
  • Grit para seguir aprendiendo
  • Alguna experiencia en programación (preferida)
  • Enfoque de pensamiento estructurado
  • Pasión por resolver problemas
  • Voluntad de aprender conceptos estadísticos.

Espero que esto ayude.

¡Salud!

Gracias por sus votos a favor de antemano. Me mantienen en marcha! ¡Gracias!

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

Esto es como pedir construir un edificio sin saber usar cemento, arena, agua, etc. Incluso si sabe de cemento, se debe usar arena y se construye el edificio sin saber qué proporción usar, el resultado es un desastre. esperando. Del mismo modo, incluso si aplica algoritmos ML sin saber lo que hacen y cómo funcionan, está condenado a fallar miserablemente. Debe tener conocimiento de diferentes técnicas, al menos saber que este tipo de algoritmos existen y se utilizan en este tipo de escenarios. Conocer los escenarios y dónde y cuándo aplicar vendrá por experiencia. No puede saber todo de antemano, ha intentado seguir aplicando estos conceptos para fortalecerse en estas áreas.

  1. ¿Puedo aplicar los algoritmos de aprendizaje automático sin saber cómo funcionan realmente para resolver el problema de la ciencia de datos? : – SI.
  2. y convertirse en científico de datos?
  1. Probablemente no.
  2. Razón más importante: si no sabe cómo funcionan realmente, no puede mejorar los resultados del algoritmo .
  3. Otra razón importante: tampoco podrá realizar cambios específicos de la aplicación en los algoritmos para resolver problemas específicos del dominio. Los ejemplos de dominio incluyen atención médica, seguros, etc.
  4. También hay otros factores que contribuyen a convertirse en científicos de datos , no se tratan aquí, como las habilidades de ingeniería de características, habilidades de programación, matemática y bases estadísticas para interpretar los resultados del algoritmo ML y también para modificar los algoritmos de aprendizaje automático.

Gracias por leer.

Parth Gadoya.

Sí, puede aplicarlos sin tener su conocimiento previo (obviamente, tener algunos requisitos previos como la diferencia entre clasificación y regresión, etc.).
También puede resolver el problema de la ciencia de datos, pero no estará satisfecho con la precisión de su algoritmo.

Si tiene la suerte y acierta con el algoritmo adecuado para su problema, tampoco se convertirá en científico de datos.

Sí, puede aplicar algoritmos ML para resolver un problema de ciencia de datos, debe saber de qué manera se debe dar la entrada al algoritmo y qué tipo de salida esperar de él. También debe saber cómo ajustar su algo / modelo.

PERO siempre es bueno saber cómo funciona el modelo / algo, da una gran idea de si el modelo es adecuado para resolver su problema o no. Además, si alguien le pregunta cómo resolvió el problema y le dice que acaba de aplicar el modelo de algún paquete y que no sabía cómo funciona, solo le causaría vergüenza.

El desarrollo de algoritmos y el desarrollo de modelos predictivos son 2 áreas temáticas diferentes y requieren una sartén y competencia diferentes. En la vida de un científico de datos, gran parte del trabajo consiste en identificar y asimilar datos que pueden ayudar a resolver su problema. El modelo predictivo y la aplicación de algoritmos son las últimas 20 millas. Echa un vistazo a estos libros sobre contar historias usando datos

Programación extrema en R y … por datasigntist [PDF / iPad / Kindle]

Machine Learning eBook: datasigntist: Amazon.in: Kindle Store

More Interesting

¿Por qué las personas que se especializan en informática y se convierten en científicos de datos están tan poco capacitadas en análisis, estadísticas y aprendizaje automático?

¿Cómo aprender adecuadamente sobre big data y cursos para convertirse en un científico de datos? Por encima de eso, qué idiomas son imprescindibles para convertirse en un científico de datos profesional

¿Debo ingresar a consultoría tecnológica, análisis de datos, desarrollo de software o gestión de productos?

¿Cuál es la vida de un 'científico de datos' en la India que tenía experiencia de 5 años o más? ¿Me refiero a la carga de trabajo diaria en las bases diurnas?

Como científico de datos, ¿puedo crear empleo en lugar de trabajar para algún empleador?

¿Qué tipo de análisis hace el científico de datos en tiempo real?

Cómo convertirse en un científico de datos en informática y programación o desarrollo de juegos

¿Cuáles son los mejores algoritmos que todo científico de datos debería tener en su caja de herramientas?

¿Cuáles son los diferentes tipos de 'científicos de datos' en Facebook?

Cómo solicitar el puesto de científico de datos en McKinsey

Cómo ser científico si tengo 13 años y soy de la India

Siento que no soy lo suficientemente inteligente como para estar en el campo de la ciencia de datos. No me veo desarrollando algoritmos nuevos o volviéndome excepcional, pero quiero ser excelente en lo que hago. ¿Debo cambiar de carrera?

¿Cuál es la mejor manera de ingresar a Data Science para un no programador?

¿Qué clases debo tomar en BITS Pilani si quiero ser un científico de datos?

Cómo cambiar mi carrera de urbanista a científico de datos a los 39 años