¿Hay una escasez de científicos de datos que hacen modelos bayesianos versus frequentistas?

No. Los científicos de datos generalmente eligen qué modelo usar según el problema en cuestión, no según una filosofía general. Los métodos bayesianos son apropiados cuando tenemos un conocimiento específico sobre el establecimiento del problema o podemos explotar su estructura con antecedentes bien elegidos.

Por ejemplo, la asignación de Dirichlet latente es un modelo de tema bayesiano popular creado en torno a los antecedentes de Dirichlet, que le permite reflejar nuestra intuición de que un artículo de noticias trata sobre unos pocos temas en lugar de muchos.

En términos más generales, los enfoques ‘frecuentista’ y ‘bayesiano’ a veces están tan estrechamente relacionados que no tiene sentido hacer una distinción. La regresión lineal básica es un MLE y ‘frecuentista’ en ese sentido, pero tan pronto como agrega regularización, está utilizando efectivamente un modelo bayesiano. Aquí su anterior es una distribución de probabilidad de coeficientes que asigna una baja densidad a magnitudes particularmente extremas.

La división Bayesiana vs Frecuentista se aplica más a la inferencia que a la predicción, ya que está estimando parámetros no observados. En la medida en que equiparamos la ciencia de datos con la predicción, realmente no hay ninguna división bayesiana / frecuentista.

La predicción es más simple, ya que puede especificar medidas objetivas de corrección para sus modelos (sin importar cómo ocurran). Creo que muchos métodos comunes de aprendizaje automático tienen una interpretación bayesiana.

Entonces, no, no creo que haya escasez de personas con estos antecedentes. Las estadísticas en general aún pueden favorecer la metodología frecuentista, pero creo que Andrew Gelman y otros han demostrado que el análisis de datos bayesianos no tiene que ser tan subjetivo como a veces se describe.

Mire esta respuesta y las otras respuestas a la pregunta: la respuesta de Michael Hochster a ¿Son frecuentes los científicos de datos o los bayesianos?

La respuesta de Michael es hermosa.

Los otros le dan un poco de contexto.

Personalmente, utilizo la vista que es apropiada para el problema en cuestión, dado el tiempo y el poder computacional que tengo para enfrentarlo. Eso significa que si la respuesta bayesiana es más apropiada pero demasiado cara, la aproximaré con la frecuente.

Si usa métodos bayesianos o frecuentistas no debería depender de su entrenamiento, sino de lo que sea apropiado para las circunstancias.

No. Hay un gran excedente de “científicos de datos” que creen que el teorema de Bayes es polvo mágico de hadas, y la respuesta a cualquier pregunta estadística es “espolvorear a algunos Bayes”, ya sea que tenga sentido o no.

More Interesting

¿Puedes convertirte en un científico de datos solo haciendo competencias de Kaggle?

Análisis de datos, ciencia de datos, análisis web, análisis de negocios: ¿Cuáles son los salarios típicos de los "científicos de datos" para las nuevas empresas en el Área de la Bahía?

¿Puede convertirse en un científico / analista de datos de clase mundial sin tener un conocimiento experto de dominio?

Cómo cambiar mi carrera de vendedor a científico de datos

¿Cuál es la mejor manera de pasar del campo de Ingeniería no CS a un Puesto de Científico de Datos (Ciencias de la Computación)?

¿Pueden un experto en programación y un campeón estadístico juntos desempeñar un papel de científico de datos?

¿Cómo y dónde aprendo el aprendizaje automático? ¿Cómo puedo comenzar como científico de datos?

¿Qué roles específicos en ciencia de datos tienen actualmente una gran demanda en Silicon Valley?

¿Los científicos informáticos son científicos?

¿Por qué es importante la comunicación para los científicos de datos?

¿En qué se diferencia la informática de la ciencia de datos?

¿Cuál es el alcance de data scientist vs MBA?

Como científico de datos, ¿necesitamos Excel y todas las herramientas de Microsoft?

¿Qué información sobre BI puedo proporcionar a un propietario de clubes nocturnos como científico de datos?

¿Debería hacer una pasantía como ingeniero de software o como científico de datos si quisiera trabajar en IA? ¿Cuál sería más útil para mi carrera?