Esa ciencia de datos es 99% de narración de historias .
Un científico de datos bueno, o incluso promedio, al comienzo de su carrera puede hacer la mayor parte de lo que puede hacer un científico de datos de primer nivel. La diferencia realmente no es tan grande: después de todo, los científicos de datos trabajan con una caja de herramientas relativamente limitada y, mientras aprenden qué herramientas usar, cuándo usarlas y cómo usarlas correctamente, suele llevar tiempo, incluso los principiantes tienden a tener idea bastante decente de lo que están haciendo.
Sin embargo, en la etapa más temprana (prefiero este término a ‘principiante’, ya que es mucho más preciso), los científicos de datos se ven a sí mismos principalmente como analistas de datos. La mayoría de ellos provienen de uno de los tres antecedentes profesionales:
- ¿Cuáles son los mejores cursos de científicos de datos en Bangalore?
- ¿Cómo es ser un científico de datos en Deloitte?
- ¿Se necesita ser un analista de datos para ser un científico de datos?
- ¿Qué debe saber todo científico de datos sobre el aprendizaje automático?
- ¿Pueden algunos científicos de datos aquí encontrarnos con el trabajo real y los pros y contras involucrados en los trabajos de proyectos de Big Data y guiarnos con qué cursos, paquetes de pago, etc., elegir?
- analistas de negocios, analistas de BI, etc.
- analistas de datos con una inclinación académica
- matemáticos, estadísticos e informáticos
Como tal, cada uno de estos grupos tiende a estar un poco atascado en su antigua posición, y eso está perfectamente bien, después de todo, ¡al cerebro le toma un tiempo dar el salto de su carrera anterior a su nueva vida en la ciencia de datos! Los antiguos analistas piensan que todavía son analistas y que esperan usar sus herramientas del oficio para generar ideas cuantitativas: las ventas de widgets han disminuido en un 15%, mientras que las ventas de blodgets han mejorado lentamente en un 3% durante el último mes. Los antiguos analistas de datos académicos hacen lo mismo, aunque a veces con más detalle y con más (¡y más bonitos!) Gráficos. Y los matemáticos, estadísticos y científicos de la computación piensan que su trabajo es escribir código que haga el trabajo analítico, y siempre que el resultado no esté en jeroglíficos egipcios, será lo suficientemente bueno.
Excepto que … eso no es lo que se espera que hagan los científicos de datos, al menos no en un entorno empresarial.
No importa qué tan bien conozca las técnicas de aprendizaje automático, si puede codificar un clasificador de máquina de vectores de soporte en cinco minutos o si es un mago absoluto en el aprendizaje profundo. Esas son las habilidades que necesita para obtener el trabajo como científico de datos de nivel de entrada, pero no son las habilidades que necesita para mantener su trabajo y sobresalir en él.
Como tal, debe comprender que su trabajo es, principalmente, contar una historia, y los datos son la herramienta que utiliza para anclar e ilustrar su historia . Una buena, realmente buena, ciencia de datos se lee como un hilo desgarrador, un thriller de cambio de página que capta su atención y no lo dejará ir hasta que haya pasado su último cálculo.
Eso significa que necesitas entender cosas que probablemente no te enseñaron en la escuela:
- Teoría narrativa Esa es una manera elegante de decir ‘la forma de escribir una historia buena y apasionante’. ¿Cómo toma sus hallazgos y los estructura de una manera que transmite el mensaje pero que también mantiene el interés de la persona?
- Estructura . Hay una razón por la cual la mayoría de los libros presentan a sus personajes en las primeras páginas, en lugar de hacerlo hacia el último cuarto del libro. Si eso suena obvio, considere con qué frecuencia las personas, ¡incluso las personas que deberían saber mejor! – no presente el problema y exponga las principales consideraciones de manera clara y convincente en las primeras líneas. La estructura es el arte de presentar información de una manera que “tenga sentido”, sea lógicamente coherente y le dé al lector un sentimiento de coherencia.
- Escritura. Buena escritura. Ahora, no soy el mejor en la escritura, pero sé que he mejorado mucho a través de la práctica pura y dura. Eventualmente, a medida que asciende en la escala de antigüedad, cada vez más de su producción será leída por compañeros de trabajo fuera de la profesión de la ciencia de datos. Finalmente, sus informes o correos electrónicos podrían llegar a los CEO y miembros de la junta. Debes saber cómo escribir y escribir bien, incluso si es un arte moribundo. Aprenda buena gramática y sea tan asiduo acerca de su ortografía como lo es con sus cálculos. Adopta una forma de hablar clara e inequívoca. Evite las “palabras comadreja”. Desarrolle un estilo de escritura que sea agradable de leer. Escribe algo de ficción, solo por diversión, incluso si nadie lo ve, es práctica y te ayudará a mejorar.
- Comunicación de información compleja. Dado que la mayoría de nosotros hemos recibido una educación basada principalmente en matemáticas y ciencias que puso un énfasis significativo en la ‘corrección analítica’, también conocida como obtener las premisas y los detalles exactamente correctos (las premisas incorrectas e inexactas son como un árbol envenenado, incapaz de dar más que fruta tóxica) ), la idea de dejar de lado ese compromiso con la precisión aunque sea un poquito es casi dolorosa para la mayoría de los científicos de datos. Sin embargo, a medida que asciendes a la cima de la profesión, escribirás cada vez menos informes. Con mayor frecuencia, sus superiores, o incluso CxO y miembros de la junta, le pedirán sus opiniones. Tendrá que aprender a equilibrar las exigencias del contexto informal con la necesidad de proporcionar una evaluación precisa y confiable. Tendrá que aprender a comunicar información altamente técnica en términos simples. Tendrá que comprender su profesión con tal profundidad que sepa qué es absolutamente indispensable y qué se puede omitir sin distorsionar la verdad. Esa es una habilidad difícil, y que lleva tiempo aprender, pero eventualmente, es lo que diferencia a la ‘crema de la cosecha’ de los científicos de datos que permanecerán para siempre en los rangos medios.
Por supuesto, mis puntos de vista están fuertemente ponderados hacia mi campo de experiencia, es decir, la ciencia de datos empresariales, pero las verdades son universales. Cualquiera que sea la rama de la ciencia de datos que termine persiguiendo, si desea sobresalir en ella, debe aprender cómo convertirse en un gran narrador de historias, cómo manejar sus herramientas con el dominio de un artesano pero la ligereza de un artista. Los científicos de datos de la etapa inicial a menudo toman su título de trabajo demasiado en serio. Pero no eres un científico de datos. Más bien, eres un científico que usa datos para contar una historia. Y saber decirlo bien marca la diferencia.