He trabajado como analista de datos / científico de datos en una industria de fabricación de semiconductores, y como científico de datos en la industria de servicios financieros. Puedo comparar y contrastar estas dos industrias, pero tenga en cuenta que realmente solo tengo un tamaño de muestra de dos compañías …
La principal diferencia que veo en la ciencia de datos en estas industrias se remonta al tipo de datos que manejan. En la fabricación de semiconductores, los puntos de datos son dispositivos (DUT) y / o procesos; en servicios financieros, son los clientes y sus comportamientos. Esta observación aparentemente obvia tiene ramificaciones sobre la importancia relativa de los diferentes tipos de modelos ( modelos basados en la física versus modelos basados en estadísticas )
En la fabricación de semiconductores, los modelos basados en la física, sin duda, son tratados como ciudadanos de primera clase. Utilizamos herramientas de simulación y modelos físicos para guiar el diseño de nuestro dispositivo y las hojas de ruta, y los modelos basados en estadísticas a menudo se relegan a una importancia secundaria (por ejemplo, utilice estadísticas descriptivas para resolver problemas en las excursiones de fabricación). Además, debido a que podemos controlar qué dispositivos fabricar y probar, podemos usar fácilmente el diseño de principios experimentales para descubrir la causalidad y no solo la inferencia.
- Cómo convertirse en un científico de datos con una licenciatura en CS
- Cómo convertirse en un científico de datos de ser ingeniero mecánico
- ¿Qué habilidades de programación se requieren para un científico de datos?
- ¿Cómo es beneficioso para un científico de datos aprender tecnologías de big data?
- ¿Qué hacen los expertos en productos en Palantir? ¿Son similares a los gerentes de producto de otras compañías?
Para los servicios financieros, debido a que los puntos de datos con los que tratamos son personas reales, no hay modelos basados en la física detrás de ellos. En este caso, el modelo basado en estadísticas y las estadísticas inferenciales es algo con lo que tenemos que conformarnos. Por lo tanto, es mucho más similar a los problemas de aprendizaje automático que se ven en los desafíos de kaggle.
Por la misma razón, la industria de servicios financieros tiende a poner mucho más énfasis en las herramientas de modelado estadístico, las mejores prácticas y un mejor soporte de infraestructura, porque ser capaz de construir un modelo de riesgo sólido es, literalmente, lo que hace que la empresa funcione. Escuché que la industria de los semiconductores también comenzó a investigar la ciencia de datos y los modelos basados en estadísticas. Espero que sea una transición, pero creo que la adopción total de este cambio de paradigma llevará muchos años.