La respuesta es ambas.
Depende un poco de dónde trabajas como científico de datos. Por ejemplo, si usted es un académico, su trabajo real es publicar trabajos, ya que esa es la forma en que comúnmente medimos la producción de un investigador académico. Un lugar popular para la literatura de aprendizaje automático es The Nips Conference.
Si trabaja en un entorno corporativo o industrial, le preocupa menos crear nuevos hallazgos, sino resolver problemas relevantes , por lo que lo más probable es que publique su trabajo en un repositorio privado para la empresa, o en un repositorio público si su empresa lo hace. No importa que lo hagas. Sin embargo, como repositorio público, probablemente sea para beneficio de la comunidad en general leer, como Data @ Quora.
- ¿Qué habilidades de ingeniería de software deberían adquirir los científicos de datos?
- ¿Por qué debería ser un científico de datos, si soy un ingeniero eléctrico?
- ¿Cuál es una alternativa para la 'Guía de Google para el desarrollo técnico' para científicos de datos?
- ¿Qué tan difícil es convertirse en un investigador científico en Google?
- ¿Cómo es beneficioso para un científico de datos aprender tecnologías de big data?
En términos de cómo exactamente los profesionales hacen esto … depende un poco. Puede publicar sus hallazgos en un blog escrito interesante (personalmente me gusta KADataScience, por ejemplo). Por lo general, se basan en un lenguaje de descuento de algún tipo, y también pueden tener un repositorio detrás de ellos para que los datos estén disponibles y sean dinámicos y puedan incluir características como widgets.
No estoy familiarizado con muchos métodos para hacerlo, pero anoche estaba leyendo sobre Blogging con Rmarkdown, knitr y Jekyll, lo que sería una gran solución para los usuarios de R.
Pero generalmente, la mayoría de los científicos de datos hacen ambas cosas, no son métodos exclusivos.