¡Conoce tantas matemáticas como puedas!
Hace varios años, diría que esto fue absolutamente crítico. Por ejemplo, cuando creamos el sistema Aardvark, no había scikit learn o apache mahout, y básicamente tuvimos que integrar el código C académico en ruby. Hubiera sido imposible hacer esto sin poder leer la literatura académica y realmente entender los sistemas. Hubiera sido absolutamente imposible para mí hacer algo si el CEO y el fundador no tuvieran una sólida formación en física; hubo demasiado rechazo por parte de las personas que no son de matemáticas
Hoy es posible que pueda salirse con la suya simplemente ejecutando scikit learn y sin saber qué sucede debajo de lo bueno … pero
- ¿Necesito hacer un curso académico para ser un científico de datos?
- ¿Qué piensan los codificadores, matemáticos y científicos de alto nivel sobre la eficiencia de tiro de Steph Curry?
- La ciencia de datos como profesión ha sido bastante popular durante los últimos 3-5 años. ¿Cuándo alcanzaremos el equilibrio de oferta y demanda para los científicos de datos?
- ¿Cuáles son los 10 principales desafíos para las aplicaciones de ciencia de datos en el sector de exploración de petróleo y gas?
- ¿Cuál es la hoja de ruta para aprender Java como analista de datos?
Incluso después de que construimos la base de código ML en Aardvark, hubo una gran confusión sobre lo que me parecieron cosas muy elementales, y se hicieron muchas cosas tontas que podrían haberse manejado mucho más fácilmente si todo el equipo tuviera algo de experiencia en lo que está sucediendo. . (Dios te ayude si tienes que trabajar con codificadores de rubíes o lingüistas y realmente hacer aprendizaje automático. Estaba extremadamente decepcionado de que Aardvark no fuera el próximo YouTube, y en mi humilde opinión, esto fue un resultado directo de simplemente no saber suficientes matemáticas)
Del mismo modo, descubro que muchos de mis clientes, la mayoría de los cuales son muy buenos ingenieros de software, se atascan en las matemáticas, ya sea para interpretar lo que está sucediendo o para implementar soluciones complejas. Esto es especialmente cierto en los entornos de desarrollo de software basados en la mayoría de los modernos, donde los propios gerentes de producto solo tienen una comprensión superficial de la tecnología web, y ni siquiera dejan de cálculo y métodos numéricos.
El espacio de Internet se ha dado cuenta de lo que otras industrias han sabido durante mucho tiempo; si no puedes hacer matemáticas, en realidad no eres un “ingeniero”
En contraste, los clientes que son realmente buenos en matemáticas pueden tomar lo que les doy y ponerlo en producción de manera rápida y eficiente. El mejor ejemplo de esto es Demand Media. Aquí, el CTO tenía una formación universitaria en matemáticas, fue muy bien leído y persiguió agresivamente cada idea que discutimos. En unas pocas semanas, pudimos aumentar sus ingresos 5 veces y convertirlos en la primera OPI de $ 1B desde Google.
¿Por qué Google ya no le da al mundo datos de SEO?
Después del PRISM, Google confirma el movimiento silencioso para hacer que todas las búsquedas sean seguras, excepto el clic en el anuncio
No es solo PRISM, fue porque Demand Media era muy bueno en matemáticas, básicamente acorralamos el mercado en todas las búsquedas.
Entonces, supongamos que tiene una montaña de datos y necesita una nueva forma de revisarlos. Me traes. Puedo sugerirte implementar apache mahout y ejecutar algunos clústeres de kmeans simples, o podríamos reimplementar nuestro propio sistema de aprendizaje profundo (algunos clientes apenas pueden tomar el primero; otros saltarán en el segundo).
De hecho, iría tan lejos como para decir que cualquiera que dirija un equipo serio de ciencia de datos debería tener un doctorado en alguna forma de matemática aplicada (física teórica, física química, computación científica, etc.). En otras palabras, sé como Sergey Brin
Cuantas más matemáticas conozca, más oportunidades tendrá.