¿Cómo publican los científicos de datos su trabajo?

La respuesta es ambas.

Depende un poco de dónde trabajas como científico de datos. Por ejemplo, si usted es un académico, su trabajo real es publicar trabajos, ya que esa es la forma en que comúnmente medimos la producción de un investigador académico. Un lugar popular para la literatura de aprendizaje automático es The Nips Conference.

Si trabaja en un entorno corporativo o industrial, le preocupa menos crear nuevos hallazgos, sino resolver problemas relevantes , por lo que lo más probable es que publique su trabajo en un repositorio privado para la empresa, o en un repositorio público si su empresa lo hace. No importa que lo hagas. Sin embargo, como repositorio público, probablemente sea para beneficio de la comunidad en general leer, como Data @ Quora.

En términos de cómo exactamente los profesionales hacen esto … depende un poco. Puede publicar sus hallazgos en un blog escrito interesante (personalmente me gusta KADataScience, por ejemplo). Por lo general, se basan en un lenguaje de descuento de algún tipo, y también pueden tener un repositorio detrás de ellos para que los datos estén disponibles y sean dinámicos y puedan incluir características como widgets.

No estoy familiarizado con muchos métodos para hacerlo, pero anoche estaba leyendo sobre Blogging con Rmarkdown, knitr y Jekyll, lo que sería una gran solución para los usuarios de R.

Pero generalmente, la mayoría de los científicos de datos hacen ambas cosas, no son métodos exclusivos.

Related Content

¿Cuál es el certificado científico de datos más fácil de obtener?

¿Qué saben los científicos de datos experimentados que los científicos de datos principiantes no saben?

¿Es el campamento de entrenamiento de Zipfian Academy / Galvanize Data Science un campamento de alta calidad?

Acabo de solicitar estudios de posgrado en CS pero no tengo conocimiento previo. ¿Qué habilidad debo aprender para prepararme para una carrera como científico de datos?

¿Por qué los científicos creen que tienen razón?

Como científico de datos o consultor de análisis, ¿cómo explica su trabajo a los padres mayores que nunca habían usado computadoras?

¿Cuáles son algunos de los conceptos centrales que un ingeniero de EC debe aprender mientras se prepara para una entrevista?

La respuesta correcta es “depende”. Algunos ejemplos son probablemente más útiles.

Aquí hay un buen trabajo, sospecho que es un proyecto paralelo divertido: Semántica: ¿qué revela la ciencia de datos sobre Clinton y Trump? – Escuadrón de reputación Como puedes ver, fue publicado en Medium.

Aquí hay una lista de documentos que obtuve simplemente buscando en Google “documentos de ciencia de datos”: http://bigdata-madesimple.com/mo …

Algunas investigaciones se realizan internamente y se publican en las publicaciones de blog de la compañía, Google, Twitter, Facebook y otros lo hacen. También comparten su código en repositorios públicos.

Internamente, sin embargo, es un asunto diferente. Por ejemplo, la semana pasada entregué modelos para un producto de datos que implementaremos este año. El código está en un repositorio, los modelos se pueden construir a partir del código. El equipo de ingeniería de datos probablemente creará su propio repositorio con el código en vivo.

Otro ejemplo es una aplicación web que creé con Shiny. El código está en un repositorio, la aplicación está en vivo para mis colegas.

Nuestra propia investigación interna está totalmente codificada, desde el análisis hasta los documentos finales, similar a los documentos pero con un lenguaje más accesible. Codifique en el repositorio (como de costumbre) y los documentos se comparten en toda la organización por correo electrónico.

En pocas palabras, la “publicación” del trabajo de ciencia de datos depende en gran medida del resultado que generamos. La ciencia de datos, a mi modo de ver, se trata de crear productos de datos y estos se pondrán en marcha de alguna manera y su código se mantendrá en repositorios. Sin embargo, hay mucho trabajo que origina informes. En este caso particular, la salida es el informe, pero nuevamente, el código está en el repositorio.

¡Espero que esto ayude!

Tinashe Michael Tapera

More Interesting

Si pudieras diseñar tu propio trabajo en ciencia de datos, ¿cómo sería el perfil del trabajo?

¿Por qué Google me está llamando para oportunidades de trabajo solo para cortar el proceso de la entrevista después de la primera llamada del reclutador?

Cómo construir una cartera de ciencia de datos sin experiencia laboral

Cómo convertirse en científico de datos después de hacer ingeniería civil

¿Cuál será la carrera en ciencia de datos después de 2 años?

¿Cómo obtener experiencia en proyectos de ciencia de datos cuando no estoy trabajando en ninguna compañía de ciencia de datos?

¿Cuáles son las oportunidades in situ para los empleados de LatentView como científicos de datos?

¿Qué puedo encontrar en el curso abierto de científico de datos?

¿Qué pasó con el científico de datos 'superhéroe' que podía codificar, modelar y hablar con 'el negocio'? ¿Él / ella alguna vez existió?

¿Está bien seguir una carrera en ciencia de datos si soy un asco en el "cálculo"?

¿Cómo saben las cosas los científicos?

¿Linkedin, Quora, Facebook, Google, Twitter reclutan científicos de datos de universidades de menor rango en los Estados Unidos?

¿Cuál es el papel de un ingeniero de datos en Facebook?

Cómo conseguir un trabajo de científico de datos en LinkedIn

¿Prefieres ser científico de datos o ingeniero de aprendizaje automático?

Web Analytics