Siento que no soy lo suficientemente inteligente como para estar en el campo de la ciencia de datos. No me veo desarrollando algoritmos nuevos o volviéndome excepcional, pero quiero ser excelente en lo que hago. ¿Debo cambiar de carrera?

La ciencia de los datos no se trata de rigor matemático o de enfoques de análisis reduccionistas profundos. De hecho, aquellos que se centran en tales cosas a menudo son científicos de datos pobres. Esto se debe a que Data Science se trata de crear productos del mundo real que aprovechan el poder del aprendizaje automático para producir los resultados predictivos y explicativos necesarios para impulsar la innovación. El aprendizaje automático que funciona en el “mundo real” no son los algoritmos que exprimen un 1% adicional de precisión predictiva de los datos, o superan a los humanos en los juegos y reconocen cuándo los perros se ríen. El aprendizaje automático del mundo real consiste en incorporar el desarrollo de software y la experiencia de dominio en el flujo de trabajo del aprendizaje automático para convertir datos empresariales imperfectos en un producto que se adapte a su entorno. Se trata de saber cómo obtener su sofisticación a través de la iteración en lugar del diseño inicial y la elegancia matemática.

Escribir ecuaciones en la pizarra o sumergirse sin cesar en revistas académicas es casi siempre un síntoma de poca “conciencia de paquete”, lo que significa que no tiene una comprensión sólida de las herramientas de código abierto necesarias para crear productos de aprendizaje automático. Sin esta educación en herramientas, sus esfuerzos de pizarra están casi garantizados para reinventar la rueda. Hay más de medio siglo de investigación de aprendizaje automático detrás de nosotros, y una gran cantidad de algoritmos y técnicas de validación disponibles a través de herramientas de alto nivel. La ciencia de datos no está perjudicada por la falta de algoritmos. Los grandes científicos de datos no están resolviendo ecuaciones, están utilizando una comprensión conceptual de las matemáticas y los supuestos de sus algoritmos para resolver problemas altamente complejos, no ideales (es decir, no académicos); los que suceden fuera de las torres de marfil idealizadas.

Tienes que entender que la idea de la sociedad de “inteligente” proviene de la revolución industrial, donde las reglas codificadas, el pensamiento matemático y la adhesión a la lógica es lo que ayudó al esfuerzo de guerra. Todas las máquinas hasta ahora dependían de una lógica estricta basada en reglas para producir su comportamiento. Este ya no es el mundo en el que estás . Las máquinas que estamos construyendo tienen su comportamiento emergente de modelos que entienden su entorno a través de los datos. En otras palabras, los humanos no son los que escriben programas de computadora, sino las máquinas. Si te enfocas en reglas y lógica estricta, serás un pobre sustituto de lo que la máquina puede hacer por sí misma. Esta es la era de la información, y las habilidades que necesitamos se ven muy diferentes a las que dominaban en el pasado.

Como científico de datos, se espera que usted sepa cómo entrenar computadoras, no programarlas o dotarlas de las llamadas matemáticas sofisticadas. Los científicos de datos con una gran cantidad de “habilidades duras” pero con poca habilidad blanda no logran desempeñarse en el trabajo. Lo he visto muchas veces. La sofisticación que brindan nuestros productos se logra al enfrentar problemas desde muchos ángulos e iterar rápidamente en el flujo de trabajo de aprendizaje automático en concierto con el resto del producto. Esto es 100% imposible si te estás sumergiendo en las matemáticas e ignorando las herramientas de alto nivel que ofrece una increíble comunidad de profesionales del aprendizaje automático. El uso de las bibliotecas de aprendizaje automático es cómo te alejas del enfoque académico ingenuo (diseño inicial) y hacia el descubrimiento más realista que ocurre cuando se intentan múltiples algoritmos rápidamente; donde los datos conducen a la resolución del problema, no la suposición “inteligente” de alguien sobre qué técnica se debe utilizar.

Data Science ha sufrido el frenesí de los medios en torno a los logros que atraen la atención de grandes empresas y departamentos de investigación. Si bien estas hazañas son emocionantes desde un punto de vista académico, tienen poco que ver con el aprendizaje automático del mundo real donde se están construyendo los productos. La industria no necesita una variedad académica de habilidades duras y mejores prácticas de ingeniería obsoletas. Necesitamos de aquellos que puedan adoptar un enfoque más suave y menos ingenuo para comprender los requisitos humanos. Aquellos que pueden superar las malas hierbas técnicas y aprender a trabajar con máquinas, equilibrando la capacidad de la computadora para escribir programas con nuestra capacidad de comprender la estrategia y el valor.

El mundo está a punto de volverse muy diferente y la palabra “inteligente” está a punto de ser redefinida. Las habilidades más suaves y la capacidad de entrenar máquinas como conductistas es la gran habilidad de hoy. Si le encanta este campo, quédese con él y sepa que su confianza en las bibliotecas preempaquetadas de código abierto es la forma inteligente de hacerlo.

No creo que haya una persona mejor para juzgar tu situación que tú. En lugar de comenzar con tu cabeza, comienza con tu corazón. Enfoca los problemas con tu corazón. Cuanto más difícil es el problema, más tiene que comenzar con su corazón. Hay muchas razones para decir que no y cuando el problema se vuelve difícil, hay muchas razones para dejar de fumar.

Cuando se trata de cambiar de carrera, debes ir un poco lento. Creo que deberías tomarte más tiempo para juzgar tu situación. Ahora, cuando sientes que no eres lo suficientemente inteligente como para estar en el campo de la ciencia de datos porque no te ves desarrollando nuevos algoritmos, siento que estás siendo duro contigo mismo. Eso no es todo lo que hace un científico de datos. Llamando a ustedes mismos como científicos de datos, nos da permiso para hacer mucho más.

DJ Patil, ex científico de datos de la casa blanca cita “Data Science es un deporte de equipo”. Él dice que porque la ciencia de datos es un campo muy vasto y tiene muchas caras. Y obviamente no se espera que sepas todo sobre todo. Está bien si no eres extraordinario con los algoritmos. Las matemáticas y los algoritmos son solo una parte de la ciencia de datos.

La base de la ciencia de datos está formada por 3 cosas particulares. Matemáticas, Estadística y Programación. Si eres lo suficientemente fuerte en Estadística y programación, siempre puedes aprender matemáticas.

En el cricket, no puedes ser el mejor bateador, jugador de bolos y fildeador al mismo tiempo. Un bateador tiene su propio valor tanto como un jugador de bolos. Similar es con la ciencia de datos. Si eres bueno en un aspecto y superior al promedio en otro, aún puedes ser un gran científico de datos.

Sin embargo, enumeraré algunos algoritmos de Machine Learning que puedes aprender para facilitar tu trabajo:

  • Árbol de decisión
  • Teorema ingenuo de Bayes
  • Agrupamiento de medias K
  • Regresión logística
  • Bosque al azar
  • Impulso XG

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes construyeron proyectos sobre el conjunto de datos REAL y las declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Desarrollar nuevos algoritmos no es el trabajo de un científico de datos. Ese es el trabajo de los investigadores de aprendizaje automático en la academia y los laboratorios de investigación industrial.

El rigor matemático tampoco es importante en la ciencia de datos. Según esta excelente publicación de blog, la ciencia de datos “enfatiza los resultados prácticos (como en ingeniería), no las pruebas, la pureza matemática o el rigor característicos de la ciencia académica”. Creo que es algo con lo que todo científico de datos práctico con experiencia en la industria puede relacionarse.

Pero, ¿quién dice que necesitas alguna de esas cosas para ser bueno en lo que haces? Algunos de los mejores científicos de datos que he conocido se caracterizaron por tener una amplia experiencia y una excelente comprensión empresarial.

La ciencia de datos no es tan glamorosa como parece. Los científicos de datos se ven expuestos a una amplia variedad de problemas, pero rara vez tienen tiempo para profundizar en un algoritmo particular.

Por otra parte, la investigación de aprendizaje automático tampoco es tan glamorosa como parece. Los investigadores pueden profundizar en un área específica, pero solo están expuestos a un conjunto muy limitado de problemas.

Así que no, no creo que debas dejar de ser excelente en lo que haces. Eso viene con experiencia y pasión.

Tiene la expectativa de que un gran científico de datos invente nuevos algoritmos o aplique rigor matemático. Aunque esto puede ser cierto, para una clase de científicos de datos o los que has visto y admirado, no te hace menos grandioso porque no los has logrado. Una manera simple de pensar sobre este dilema es ver a las personas que trabajan en ciencia de datos en una organización, y más específicamente en un equipo. Con este hecho, entendemos que un equipo contrata a científicos de datos y disciplinas aliadas por sus habilidades, habilidades básicas y disposición para trabajar con un equipo. Los candidatos a largo plazo son los que aguantan y permanecen con el equipo, en los malos o buenos momentos, creciendo con la compañía y logrando un equilibrio entre una acción valiosa y un bono de reserva. Esto crea valor con el equipo y la empresa, en contraste con la puesta en marcha y el cambio rápido a otra “oportunidad”. La decisión de permanecer en la ciencia de datos se ha generalizado apresuradamente al trabajar en un inicio, donde trabaja en el aprendizaje automático y aplica bibliotecas estándar. Debe aprovechar la experiencia, el trabajo en equipo y los contactos personales lo mejor que pueda con los hechos, logros y potencial de crecimiento del trabajo. Esto prácticamente significa, en términos financieros, que comprende la inversión de un puesto de nivel de entrada, las credenciales de sus compañeros de trabajo y el poder de recomendación, y la experiencia transferible en aprendizaje automático que puede aplicar en otra empresa, si lo desea. Como disciplina, la ciencia de datos combina muchas materias cuantitativas y no depende en gran medida de ninguna materia. Esto hace que la disciplina sea versátil y, cuando se agrega a una mentalidad empresarial práctica, hace que la carrera sea indispensable. Esto aumenta el interés con las empresas que reconocen el valor de la inteligencia artificial, pero también comprenden el elemento humano con los científicos de datos que deben intermediar, asesorar y desarrollar tales avances de máquinas con la gente de negocios. En este sentido, un científico de datos arbitra entre los sistemas informáticos y las aplicaciones inteligentes, con la gerencia, el personal técnico y los principales productores y personal de servicio de la empresa en particular. Por lo tanto, si comprende su compromiso disciplinario, la fuerza impulsora de la ciencia de datos, su poder de negociación y negociación, y el valor de la ciencia de datos como una carrera y un recurso humano en la empresa, no tendrá problemas para quedarse con la inversión por mucho tiempo. término. Podrá capear los ciclos económicos de inflación, fallas de riesgo, baja rentabilidad o problemas de gestión con los compañeros de trabajo a largo plazo.

No te rindas Se necesita un montón de tiempo y esfuerzo para comprender realmente el funcionamiento interno de estas cosas. Estoy aprendiendo acerca de la probabilidad, las estadísticas, la programación y más temas todos los días y todavía me quedan toneladas. Cuanto más sabes, más entiendes lo poco que realmente sabes. Aunque desalentador, creo que esto es inspirador.

Deja de sujetarte a los estándares irrazonables. Es posible que no te veas a ti mismo “desarrollando nuevos algoritmos o volviéndote excepcional”, pero eso no significa que no puedas ser un profesional del aprendizaje automático y resolver problemas del mundo real. La existencia de bibliotecas es una conveniencia , y es su trabajo entender qué biblioteca usar y por qué. No es necesario reinventar la rueda cuando alguien ha escrito una red neuronal o una implementación de bosque aleatorio en C, la envolvió en Python y la hizo gratuita y fácil de usar. Eso no lo hace perezoso, lo hace pragmático y libre de pensar en los muchos otros problemas con su canalización de datos u opciones de modelado. 🙂

Entonces no. No cambies los campos. Todos dudamos de dónde estamos y hacia dónde vamos. Depende de usted luchar contra los pensamientos negativos y marcar la diferencia resolviendo problemas. También estoy trabajando en eso, así que te diré cómo va.

Irónicamente, me sentí atrapado donde estás.

La mayor parte de mi experiencia es en ciencia de datos “regular”, aunque tengo una sólida base matemática, especialmente en la teoría del aprendizaje automático, una buena parte de mi experiencia en la industria ha hecho lo que está haciendo ahora.

Lo que está haciendo ahora es un buen trabajo de ciencia de datos sólido . Estás en tu camino: necesitas ganar confianza y experiencia.

Sin embargo, la mayoría de las veces, lo que estás haciendo no gira mi manivela. Una (de muchas) razones por las que he estado trabajando por contrato durante los últimos 2 años es que, francamente, es más divertido. Las personas que saben que me especializo en algoritmos temporales y derivación de nuevos algoritmos matemáticamente han acudido a mí, lo suficiente como para ganarme la vida, y un poco de un nombre que ahora estoy aplicando para encontrar más contratos, o posiblemente trabajar en una empresa en un puesto Me podría divertir con

Somos diferentes en lo que hacemos y en lo que nos gusta hacer, tú y yo (suponiendo que te guste lo que haces). Eso es genial. No tienes que ser yo, y yo no tengo que ser tú.

No renuncies porque no sientes que no lo estás cortando como científico de datos: estás haciendo lo que hacen la mayoría de los científicos de datos. Si odias lo que estás haciendo, entonces piensa en otra cosa. Pero no se sienta intimidado por las personas que se parecen más a mí en el trabajo. Lo más probable es que la gerencia lo contrate para hacer lo que hace y hacerlo bien, y están perfectamente contentos con lo que está haciendo. Especialmente porque las personas como yo en el lugar donde trabajas no serían buenas en lo que haces bien, o al menos no se divierten haciéndolo, lo que a menudo equivale a lo mismo.

No hay escalabilidad de la inteligencia para convertirse en un científico de datos. Supongo que todavía estás en la curva de aprendizaje. Nunca te rindas. Intenta aprender tanto como sea posible. Tienes una increíble oportunidad de trabajar con un inicio en el aprendizaje automático. Raramente la gente tiene una oportunidad como esta. Mantenga sus esfuerzos en

La verdad es que nadie es demasiado inteligente o demasiado tonto para ser un científico de datos, su conocimiento específico de dominio juega un papel muy importante en lo lejos que llegará. Sea cual sea su formación académica o laboral, es más probable que comprenda cuál debería ser el resultado de una tarea de ciencia de datos.

Es muy imposible que no seas bueno en nada, intenta resolver problemas en esa área en la que te sientas cómodo empleando la ciencia de datos.

De esa manera, usted ha disminuido el estado de sobrecarga de la ciencia de datos y solo lo ve como un medio para un fin.

La inteligencia nunca fue el factor principal,

Los factores principales son la pasión, el trabajo duro y estar dispuesto a aprender; si tiene los tres, proceda con lo que más ama y tendrá éxito.

More Interesting

¿Es necesario el conocimiento de dominio para un científico de datos?

¿Qué es la ciencia de datos, y su alcance y trabajos?

¿Cómo es ser un científico de datos? ¿Dónde trabajas y qué haces (en tu trabajo)?

¿Qué conlleva un ROI más alto: 9 semanas de un campo de arranque de codificación que conduce a un trabajo de desarrollo web, o un programa de dos años que conduce a una maestría en ciencia de datos (y, presumiblemente, a un trabajo de análisis)?

¿Cuál es la mejor manera de ingresar a Data Science para un no programador?

¿Qué puestos gerenciales hay para los científicos de datos?

¿Recomendaría un científico de datos de nivel básico para mudarse a Austin, TX?

¿Ganaría más dinero como científico de datos o como ingeniero de software?

¿Cuáles son algunas diferencias entre un nuevo científico de datos y uno con 5 años de experiencia en la industria? ¿Cuáles son las cosas más importantes que habrán aprendido en ese momento?

¿Pueden un experto en programación y un campeón estadístico juntos desempeñar un papel de científico de datos?

¿Qué curso de carrera profesional de ciencias de datos debo tomar para la transición profesional?

¿Qué es el aprendizaje automático o la ciencia de datos? ¿Qué tipo de trabajo haces como científico de datos todos los días?

¿Los científicos de datos son 'parásitos de investigación'?

¿Qué consejo profesional me darías para convertirme en científico de datos?

¿Alguien puede ser un científico de datos tomando clases en línea?