¿Son frecuentes los científicos de datos o los bayesianos?

Estoy totalmente de acuerdo con Michael Hochster! y agrego que tampoco somos nada de eso.

Una vez tuve una conversación con un colega sobre esto y le dije que cualquier herramienta que sea la mejor es la que deberíamos elegir sin pensar que es un código bayesiano, frecuente o simple de fuerza bruta. Si cumple, es la herramienta, independientemente de la “escuela”.

Me pidió que le diera un ejemplo. Dije que si realizamos una prueba AB, ¿no tenemos un conocimiento previo de nuestros productos que tengamos en cuenta cuando analizamos los resultados con metodologías frecuentas? ¿No hay algo de Thomas Bayes es eso? En este caso, creo (¡pero podría estar equivocado!) Que la mayor parte del trabajo son estadísticas frecuentes. Pero la mentalidad es un poco diferente. Cuando hablo con analistas de datos y BI, generalmente están contentos con la aplicación de un método y llegar a una conclusión. Un científico de datos a menudo no lo es. Y ese “no es” generalmente se define por sus propias creencias. De nuevo, ¡esto es muy bayesiano!

Todo esto se trata principalmente del análisis de datos, pero si cambiamos la discusión al aprendizaje automático, agregamos una tercera escuela: la caja negra, donde las reglas de precisión y la interpretabilidad no son tan relevantes. En este caso, la discusión bayes vs frecuentista ni siquiera importa y así es como debería ser, en mi humilde opinión.

De acuerdo con Michael Hochster .

Siento que deberíamos usar bayesiano con más frecuencia (al menos, debería hacerlo). Pero la curva de aprendizaje de la programación y el modelado es un poco más pronunciada (además aprendí principalmente algoritmos frecuentistas en el pasado).

Creo que hay mucho que decir sobre los enfoques bayesianos, ya que se presta para el procesamiento paralelo y las actualizaciones locales antes de unir las actualizaciones para obtener el resumen completo de su gran conjunto de datos.

Si.