¿Cuál es la parte más frustrante del trabajo de un científico de datos?

Creo que mucha gente dirá que se trata de datos mal formateados (he oído hablar de personas que reciben Excel, html e incluso datos pdf), pero para mí lo más molesto es “mira esta mala recomendación”.

Mis dos citas favoritas relacionadas con la ciencia de datos son algo así como “Todos los modelos están mal, pero algunos son útiles” – George EP Box y “Predecir el futuro es difícil, especialmente si aún no ha sucedido” – ¿Yogi Berra?

El punto es que el modelo nunca será correcto todo el tiempo. Especialmente en las recomendaciones, generalmente está optimizando para que el usuario haga clic en algo que de otra manera no vería, sería difícil mostrar cosas interesantes sin mostrar a veces algo que podría parecer extraño. Su sistema funciona con información lejos de ser perfecta e intenta hacer lo mejor que puede en promedio.

Es probable que a su empresa no le importe reconocer este hecho.

Bueno, hay una serie de problemas que estoy seguro de que pasan durante un análisis:

  1. Problemas de datos / integridad de datos
  2. Falta de comprensión correcta de datos / conocimiento comercial
  3. Problemas al comunicar resultados / pasos a una audiencia laica

Pero sea lo que sea, es una de las profesiones más complicadas en estos días, considerando que el análisis se está utilizando en todas las industrias.

Una mirada a varios blogs en Analytics Leap (www.a-leap. Com) y comprenderá cómo se está utilizando en todos los sectores.

Mejor,

UNA

La curva de aprendizaje es inmensa y la incapacidad para producir un análisis significativo comienza a sentirse frustrante después de un tiempo.

Lo más probable es que las partes interesadas del negocio no se preocupen por los algoritmos que utiliza en sus análisis y existe una presión constante para producir resultados con plazos estrictos.

Parece que se te ha dado una varita mágica para convertir algo crudo en oro. Se siente emocionante al comienzo del proyecto, pero pronto puede convertirse en una situación de olla de alta presión.

¡Buena suerte!

Creo que la parte más frustrante es adaptarse a la realidad.

Quiero decir, en esencia, Data Science, es una ocupación científica. Pero, eso en sí mismo, se convierte en una adaptación a tener que aceptar la realidad en términos de finanzas y de otro tipo.

Siempre ha sido y sigue siendo, un duro enfrentamiento de tener que hacer frente a la realidad, en contra de lo que uno hace.

Muchos científicos de datos de los que sé, han sido o están obligados a adherirse a los actores más grandes, a los entornos más grandes y a tener en cuenta el dinero.

Ahora, la posibilidad de poder mantener dinero en uno mismo, en términos de tener la capacidad de manejar y utilizar la posibilidad de ganar dinero en virtud de la aplicación de Data Science.

Eso, más o menos, en sí mismo, causa mucha atención y muchas cosas diferentes.

Quiero decir, si aplicas Data Science para mantener tu propio nivel de economía, seguramente llamarás la atención de los grandes jugadores en el campo.

Similar a, si desarrolla su propio sistema operativo, o publica documentos o lo que no

Alguien lo notará. Y ese alguien, podría intentar atraerlo a sus filas, etc.

Donde, esto podría no ser una noción hostil o incluso forzada, es un factor permanente de algo a favor o en contra.

Similar a eso, en algún momento de hacerlo, llegarás a un acuerdo con:

¿Qué es lo que más valoras?

¿El dinero? ¿El prestigio? ¿Atención? ¿Familia? ¿Poder?

Quiero decir, el campo es tan profundo y grande que el cielo es el límite.

Pero, de nuevo, todo se reduce a la persona en cuestión.

Cómo manejan la adversidad, la atención y cómo manejan otras perspectivas.

Es una relación muy “amor-odio”, creo.

Las ventajas son geniales, pero es lógico ser una adaptación de una realidad, no siempre un cohesivo y coherente “Yo soy así”.

Lo cual, creo que es la parte más frustrante del trabajo.

Las personas que piden y luego rechazan mi experiencia.

Preguntas que contienen suposiciones sobre cómo deben responderse.

Una típica se presenta generalmente como “¿puede mirar esto y estos datos y ver si tiene algún impacto en eso y aquello”? El problema es que ya ha bloqueado lo que puede afectar qué, pero lo más importante, probablemente piense que “eso” es lo que necesita para responder la pregunta final. Muchas veces, la elección de “esto” y “aquello” son suposiciones incorrectas, y en su lugar deberíamos considerar “estos” y “esos”. ¿Puedes mirar las demostraciones de las personas que usaron este cupón [porque ya he decidido, incorrectamente, que sería lo correcto enviarlas a demostraciones similares la próxima vez]? ¿Puedes mirar las ventas de estos SKU en estas tiendas por tipo de tienda [porque cuando informamos un gran resultado, preferimos ignorar las caídas de ventas en marcas de precio completo]? El resultado suele ser lo que uno de mis antiguos jefes llamó “¿qué parte del globo apretado estamos viendo ahora”?

PD: Frustración adicional: cualquier pregunta que contenga la palabra “diario”. Recomiendo la prueba de giro de la rueda. Pregunte si por diario significan granularidad de los datos o frecuencia de las actualizaciones. Repentina “giro de las ruedas” significa que la pregunta no se ha pensado.

Probablemente se trata de los pequeños detalles (como el código de depuración o la limpieza de datos que en su mayoría están limpios pero tienen ese pequeño inconveniente). Seré feliz cuando haya más automatización de las tareas para que la ciencia de datos implique principalmente matemáticas y pensamiento crítico.

Creo que esta es mi oración más utilizada en Quora: no soy un científico de datos. 🙂

Lo que más me frustra son los errores evitables. Por ejemplo, si supongo que una pregunta simple conducirá a un análisis simple, es posible que no me tome el tiempo suficiente para explorar / discutir los datos desde el principio o pedir aclaraciones a las partes interesadas.

La gente pide mi consejo, luego lo ignora por cualquier razón, luego se mete en problemas al ignorarlo. Historia de mi vida.