TL; DR Al incorporar comunicación
Le hice esta pregunta a Drew Conway, el creador del Data Science Venn Diagram, y esto es lo que tenía que decir:
Su diagrama de Venn de ciencia de datos ha sido ampliamente compartido y realmente ha ayudado a muchas personas a tener una idea inicial de lo que es la ciencia de datos. Lo creaste hace mucho tiempo, en 2010. Si tuvieras la oportunidad de volver a crearlo hoy, ¿cambiarías alguna parte?
Bastante. Puedo hablar un poco sobre la historia, que creo que es probablemente menos gloriosa de lo que la gente sabe.
- ¿Dónde trabajan los graduados de la Academia Zipfian en este momento como científicos de datos?
- ¿Qué tipo de revistas suelen leer los científicos de datos?
- ¿Cómo hacerse científico? Cuéntame sobre los procedimientos, como el nombre del título, etc.
- ¿Cómo debería prepararse un más nuevo para ser publicado como científico de datos en India?
- ¿Qué clases debo tomar en la Universidad de Washington si quiero ser un científico de datos?
Yo era un estudiante graduado en la Universidad de Nueva York y era asistente de enseñanza para una clase de pregrado en Política Comparada. Como asistente de enseñanza en esas clases, su mente divaga porque ya conoce el material.
Era 2010, y la idea de la ciencia de datos era mucho más primordial. La gente tenía menos idea de lo que era la ciencia de datos. En ese momento estaba pensando en la definición de ciencia de datos. Había estado hablando con personas como Mike Dewar, Hilary Mason y algunas otras personas en Nueva York, y sus ideas y las mías me influyeron, y se me ocurrió la definición mientras estaba sentado en clase.
El diagrama original de Venn que hice sobre ciencia de datos, que terminó siendo bastante conocido, se dibujó usando GIMP como editor, el programa más simple y económico del mundo. Pero estoy muy feliz de que parece que las personas se han apegado a él y tiene sentido para ellos.
Lo que se ha vuelto más evidente para mí a medida que han pasado los años es que lo que falta es la capacidad de transmitir un hallazgo o información relevante una vez que se completa un análisis, a una audiencia no técnica. Una gran parte del arduo trabajo que hacen la mayoría de los científicos de datos no es necesariamente toda la disputa de datos, el modelado y la codificación. En cambio, una vez que tenga un resultado, se trata de descubrir cómo explicar ese resultado a personas que no son necesariamente técnicas o que están tomando decisiones comerciales o decisiones de ingeniería.
Realmente, se trata de transmitir un hallazgo. Puede usar palabras para hacer eso, puede usar la visualización para hacer eso, o puede desarrollar una presentación para hacerlo. Un equipo completo de ciencia de datos tendrá a alguien que sea muy competente en esto. Si su organización está tomando decisiones basadas en su análisis, debe asegurarse de que entiendan por qué.
Este tema de la comunicación, que es absolutamente importante para el éxito de un científico de datos, se repite en muchas de las entrevistas en el libro.
Por ejemplo, el profesor de estadística Joe Blitzstein dice que el paralelismo más importante entre ser un científico de datos y un educador es la comunicación y la narración de historias (ver La cosa única que los científicos deben aprender de los educadores). Enumero la comunicación y la narración de historias como uno de los 4 principales errores que cometen los científicos de datos aspiracionales en ¿Cuáles son los errores más comunes cometidos por los aspirantes a científicos de datos?
¡Esta pregunta es parte del próximo Manual de ciencia de datos! Obtenga tres capítulos gratis siguiendo este enlace El Manual del Científico de Datos: Primeros 3 Capítulos Gratis por William Chen sobre Storytelling with Statistics