¿Cuáles son las experiencias de los científicos de datos en diferentes industrias?

He trabajado como analista de datos / científico de datos en una industria de fabricación de semiconductores, y como científico de datos en la industria de servicios financieros. Puedo comparar y contrastar estas dos industrias, pero tenga en cuenta que realmente solo tengo un tamaño de muestra de dos compañías …

La principal diferencia que veo en la ciencia de datos en estas industrias se remonta al tipo de datos que manejan. En la fabricación de semiconductores, los puntos de datos son dispositivos (DUT) y / o procesos; en servicios financieros, son los clientes y sus comportamientos. Esta observación aparentemente obvia tiene ramificaciones sobre la importancia relativa de los diferentes tipos de modelos ( modelos basados ​​en la física versus modelos basados ​​en estadísticas )

En la fabricación de semiconductores, los modelos basados ​​en la física, sin duda, son tratados como ciudadanos de primera clase. Utilizamos herramientas de simulación y modelos físicos para guiar el diseño de nuestro dispositivo y las hojas de ruta, y los modelos basados ​​en estadísticas a menudo se relegan a una importancia secundaria (por ejemplo, utilice estadísticas descriptivas para resolver problemas en las excursiones de fabricación). Además, debido a que podemos controlar qué dispositivos fabricar y probar, podemos usar fácilmente el diseño de principios experimentales para descubrir la causalidad y no solo la inferencia.

Para los servicios financieros, debido a que los puntos de datos con los que tratamos son personas reales, no hay modelos basados ​​en la física detrás de ellos. En este caso, el modelo basado en estadísticas y las estadísticas inferenciales es algo con lo que tenemos que conformarnos. Por lo tanto, es mucho más similar a los problemas de aprendizaje automático que se ven en los desafíos de kaggle.

Por la misma razón, la industria de servicios financieros tiende a poner mucho más énfasis en las herramientas de modelado estadístico, las mejores prácticas y un mejor soporte de infraestructura, porque ser capaz de construir un modelo de riesgo sólido es, literalmente, lo que hace que la empresa funcione. Escuché que la industria de los semiconductores también comenzó a investigar la ciencia de datos y los modelos basados ​​en estadísticas. Espero que sea una transición, pero creo que la adopción total de este cambio de paradigma llevará muchos años.

En los videojuegos es bastante emocionante porque es algo inmaduro. Todavía hay muchas cosas por probar. Estoy escribiendo en junio de 2016 en caso de que alguien en el futuro lejano esté loco. 🙂

La ingeniería de datos es muy pesada dada la cantidad de datos generados. No puedo imaginarme que ningún juego popular bien instrumentado genere nada por debajo de los 250 millones de eventos por día. Aunque no estoy directamente involucrado en la ingeniería de datos, trabajamos junto con ingenieros de datos y ¡son los MEJORES!

Trabajamos en muchas cosas diferentes, algunos están más en el lado comercial como la monetización y el marketing, otros están más en el lado del comportamiento que es más complicado pero también más gratificante. El diseño de experimentos es importante para nosotros.

Técnicamente hablando es exigente. Necesitamos saber tanto sobre la implementación técnica de nuestros lagos de datos como sobre nuestra infraestructura de juegos más las herramientas que utilizamos. En nuestro caso, el enfoque en los juegos multijugador agrega complejidad a eso.

Tipos de proyectos … para ser honesto, todo es un juego justo. Como dije, hay mucho que se puede hacer y dada la naturaleza de nuestros productos, la cantidad y la calidad de nuestros datos, que muchas empresas pueden simplemente probar. He trabajado con regresión, clasificación y asociación. Tenemos planes de recomendación, agrupación y bandidos. Otros equipos con los que hablé han usado PNL, por ejemplo.

En general, es muy emocionante!

En la mayor parte de mi carrera de ciencia de datos “estándar”, he trabajado con aspectos espacio-temporales de la demografía. Primero en la creación de productos de datos (es decir, crear modelos que explicaran los cambios a lo largo del tiempo, la agrupación, la definición de urbanidad de manera sensata, etc.)

Después de dejar esa compañía, utilicé productos de datos de esa compañía, junto con otros datos para crear modelos de marketing y luego modelos de pronóstico de ventas.

Actualmente (y esta es la parte “no estándar”), estoy profundamente inmerso en la teoría del aprendizaje automático haciendo algo realmente muy interesante de lo que hablaré … más adelante.

Me gusta la variedad, trabajar como consultor científico de datos. Cada trabajo es diferente: desde la detección de fraude hasta el mapeo de servicios de alcantarillado, pasando por el análisis de sentimientos para fines de marketing y más.

Principalmente uso R, y me concentro en modelar los datos. Ajuste de curvas, procesamiento del lenguaje natural, análisis de gráficos, algoritmos de aprendizaje supervisado, análisis de retraso, análisis de series de tiempo, … Es divertido poder utilizar una amplia gama de técnicas.

Pero también es una gran cantidad de limpieza y moldeo de datos. Y algunas cosas menos interesantes como clasificar y unir datos.

Eso varía mucho desde tecnología como Google / Facebook / LinkedIn hasta una empresa minorista como LVMH.

El último caso podría ser menos exigente en términos de conjunto de habilidades y nivel de expertos porque su negocio no depende SOLO de los datos recopilados y no requieren una respuesta en tiempo real. Sin embargo, el conocimiento de dominio que obtenga tampoco sería muy diferente. Por lo tanto, debe decidir sobre su interés y qué conocimiento de dominio desea aprender.

More Interesting

Además de ser un científico de datos, ¿cuáles son otros aspectos profesionales prospectivos con una maestría en aprendizaje automático?

¿Cuáles son los mejores institutos en la India para convertirse en analista de datos / científico de datos?

¿Cómo obtengo un trabajo como desarrollador R / científico de datos como recién graduado mientras solicito el trabajo desde el extranjero?

¿Qué consejo le darías a un aspirante a científico de datos?

¿Cuáles son los mejores cursos de científicos de datos en Bangalore?

Quiero ingresar a un programa de maestría en ciencia de datos. ¿Podría aprender matemáticas discretas darme una ventaja competitiva?

¿Por qué tantos científicos de datos actuales suponen que los futuros estudiantes están en esto por el dinero?

¿Estudiar ciencia de datos en la Universidad es un buen plan para el futuro?

¿Cuáles son los requisitos para convertirse en un científico de datos?

¿Qué habilidades necesito para ser un científico de datos por el que lucharán las grandes compañías tecnológicas?

Acabo de solicitar estudios de posgrado en CS pero no tengo conocimiento previo. ¿Qué habilidad debo aprender para prepararme para una carrera como científico de datos?

¿Cuál es la mejor manera de pasar del campo de Ingeniería no CS a un Puesto de Científico de Datos (Ciencias de la Computación)?

¿Es Accenture un buen lugar para comenzar su carrera si desea ingresar a Data Science en el futuro?

Recién salido de una universidad de ingeniería, ¿cuál es una mejor opción de trabajo a largo plazo, una carrera en análisis de datos o una carrera en consultoría?

En mi búsqueda de convertirme en científico de datos, elegí aprender R. Sin embargo, ¿es importante elegir el campo de especialización antes de aprender algún paquete?