¿Qué cualidades debe tener un aspirante a científico de datos?

Imagen cortesía de Women of Color In Tech

Esta es una gran pregunta, y ya hay algunas respuestas geniales aquí. La mayoría de ellos se centran en las cualidades que un científico de datos debería tener en general.

En cambio, quiero centrarme en lo que realmente hace la pregunta y centrarme en las cualidades que debe tener un aspirante a científico de datos.


1. Persistencia

Data Science es un campo muy ‘sexy’ en este momento. Hay mucha expectación en torno al aprendizaje profundo y la IA, y atrae salarios altos que hacen que sea atractivo considerarlo como una carrera profesional para ambas personas al comienzo de su carrera u otras que deseen hacer un cambio profesional.

Pero aprender ciencia de datos, especialmente si eres un autodidacta, es difícil. Te encontrarás con obstáculos: vas a tener días buenos y malos, tu motivación puede disminuir a veces y tendrás dificultades para aprender algunos conceptos.

Una vez que haya adquirido habilidades, necesita conseguir un trabajo, y demostrar lo que sabe a menudo requerirá que cree una cartera sólida para demostrar sus habilidades (puede leer más sobre eso aquí, si es de interés)

Necesitará persistencia para seguir trabajando y superar estos obstáculos.

2. Un amor por la resolución de problemas.

Se ha dicho muchas veces que el 80% de la ciencia de datos es limpieza / preparación, y la limpieza de datos es esencialmente una serie de muchas tareas de resolución de problemas.

En pocas palabras, si no te gusta resolver problemas, te sentirás frustrado la mayor parte del tiempo. Si desea disfrutar trabajando con datos, tendrá que adoptar este proceso.

Tendrás que amar profundizar en los problemas: consultar la documentación, el desbordamiento de google y stack y, a veces, incluso el código fuente de la biblioteca que estás utilizando para solucionar el problema a cualquier costo.

3. humildad

Es fácil completar un curso de ciencias de datos y pensar que está listo para ser un científico de datos. En realidad, esto suele ser solo el comienzo de su viaje de aprendizaje.

El campo de la ciencia de datos es muy amplio, y ser humilde es un rasgo muy importante. No tenga miedo de reconocer cuando no sabe algo, o pedir ayuda a otros. La comunidad más amplia de ciencia de datos está llena de personas generosas (ver # 5 a continuación) que están dispuestas a ayudarlo.

También es común pensar que puedes pasar rápidamente a un rol de aprendizaje automático cuando trabajas por primera vez en ciencia de datos, cuando la realidad es que a menudo no es tan fácil. Muchos roles de nivel de entrada en datos no implican aprendizaje automático y pueden tener nombres poco atractivos como ‘analista’ o ‘analista de negocios’. Debes estar preparado para poner tu pie en la puerta como puedas para que puedas obtener una experiencia valiosa y eventualmente subir de nivel.

4. Coraje

Necesitarás valor para creer que puedes lograr tus objetivos. Para exponerse y compartir su código para que otros lo revisen. Para crear una cartera de proyectos y compartirlos, escribir blogs que detallen su viaje.

Para asistir a eventos y reuniones de redes, e incluso hablar en ellos, lo que puede ser extremadamente valioso para darle contactos y vías para conseguir un trabajo en el campo.

Debes ser valiente sin ser bullicioso o jactancioso. Si la humildad es el yin, entonces el coraje es el yang. Siempre debes apuntar a equilibrar los dos.

5. Generosidad

Debe ser generoso con su tiempo y siempre dispuesto a ayudar a otras personas que también están en su propio viaje de aprendizaje por dos razones clave.

En primer lugar, como mencioné anteriormente, he descubierto que la comunidad más amplia de la comunidad de ciencia de datos es extremadamente generosa y está dispuesta a ayudar a los jóvenes y nuevos profesionales de la información. Sin duda, usted será el beneficiario de esto a medida que aprenda, y debe hacer lo mismo para ‘pagarlo’ a otros.

En segundo lugar, hay un beneficio directo para ayudar a otros. Creo que he aprendido más explicando temas a otros y ayudando a solucionar problemas de código que en otros lugares, y me pareció una estrategia clave para ayudarme en mi propio viaje de aprendizaje. No puedo recomendar lo suficiente los beneficios que obtienes al ayudar a otros mientras aprendes.

Cuando comienzas por primera vez, podrías estar ayudando a alguien que solo sabe fraccionalmente menos que tú. No debes temer que es demasiado pronto para comenzar a ayudar a otros, cuanto antes te sumerjas mejor.

TL; DR

Estas cinco cualidades (persistencia, amor por la resolución de problemas, humildad, coraje y generosidad) son esenciales para cualquier aspirante a científico de datos. Acelerarán su aprendizaje, lo ayudarán a alcanzar sus objetivos más rápido y lo convertirán en un científico de datos más completo.


Si te gustó esta respuesta, considera votarla y seguirme.

Trabajo para Dataquest, la mejor plataforma en línea para aprender a ser un científico de datos. Más allá de enseñarle los conceptos que necesita, tratamos de inculcar todas nuestras cualidades que he enumerado en esta publicación en nuestros estudiantes a medida que los apoyamos mientras aprenden.

Si eso le interesa, puede inscribirse y completar nuestro primer curso gratis en Dataquest.io

¡Esta es una gran pregunta!

Existe una obsesión masiva con la idea de un “científico de datos”. Hay generalizaciones en las que ‘Estadístico’ es realmente un sinónimo de ‘Científico de datos’ o ‘Programador de Java para Hadoop’ significa ‘Científico de datos’, la lista continúa. Si bien no es incorrecta, la respuesta es normalmente ‘Todo lo anterior’, en diferentes combinaciones dependiendo de lo que desea resolver.

El enfoque actual se centra principalmente en “¿qué herramientas, idiomas y habilidades necesito para aprender a ser un científico de datos?” El ecosistema de herramientas, idiomas, habilidades y experiencia en la materia es muy amplio y profundo.

Aquí está la cosa. Hay un grupo muy pequeño de personas con talento que son los cocineros desnudos de la ciencia de datos (@Unicorn Data Scientists vs Data Science Teams). Mi mentor lo resumió cuando dijo: “Las compañías de big data inteligentes reconocerán esto y construirán las herramientas para ayudar a convertir Data Science en un deporte de equipo y eliminar la dependencia de algunas personas con talento”.

Imagine por un momento que eso se ha convertido en una realidad y que las herramientas son simplemente una mercancía. Imagine que tiene una base suficiente en Estadística, Aprendizaje automático, Matemáticas y Negocios para saber cómo aplicar estas herramientas. Ahora, ¿cuáles son las cualidades importantes que debe tener un científico de datos en ciernes?

Neil Hepburn destacó algunos de estos. “Curiosidad, escepticismo, perseverancia”. Me encuentro con muchos ejemplos de personas que, si tuvieran las herramientas para apoyarlos, serían excelentes científicos de datos. Tienden a ser apasionados pensadores impulsados ​​por los datos con una curiosidad insaciable sobre el mundo que los rodea a través de la lente de los datos disponibles. Son autodirigidos e impulsados ​​para obtener conocimientos y compartirlos con el mundo que los rodea. Normalmente son agnósticos en términos de herramientas y cambiarán a lo que sea que los ayude a alcanzar sus objetivos, incluso si eso significa aprender un nuevo idioma, habilidad o herramienta.

Cuando tienes estas cualidades y te encuentras con un individuo de ideas afines, lo reconoces instantáneamente en ellas y generalmente sigue una discusión enérgica.

Isaac Kohane es un ejemplo clásico de este tipo de individuo. ¡Hay una razón por la cual el Departamento de Bioinformática de HMS está creciendo tan rápido!

Data Science como el nuevo campo próximo tiene un gran requisito en el mundo de los negocios. Tiene más que ver con los beneficios que este campo puede proporcionar a las empresas, y se está demostrando que es fundamental para el crecimiento de cualquier negocio en el mundo actual. La cantidad de datos es enorme, tan grande que es incomprensible para la mente humana. Entonces, ¿qué hacemos cuando tenemos una gran cantidad de información? Tratamos de simplificar y analizar el problema y buscar soluciones de manera estructurada, y para eso necesitamos:

  • Habilidades para resolver problemas: puede encontrar fácilmente casi el 70% de los requisitos de trabajo mencionando que quieren un candidato que tenga habilidades para resolver problemas. Lo que significan es que debe tener un enfoque estructurado hacia la resolución de problemas, es decir, definir un problema, objetivo, evaluar la situación actual y la información, formar hipótesis alternativas, probar y comparar esas hipótesis y dar una solución / recomendaciones. Es una habilidad adquirida por el aprendizaje y, lo más importante, por la práctica. Como dicen, practiquen, practiquen, practiquen.
  • Habilidades difíciles: para resolver estos problemas complejos, también necesita algunas herramientas en su mano. La base de conocimiento en el campo de la ciencia de datos está ampliamente dividida en tres conjuntos de habilidades (Diagrama de Venn de Ciencia de Datos):
    1. Habilidades de piratería: se refiere a las habilidades informáticas que debe tener, incluido un buen coma y sobre los lenguajes de computadora, limpieza y transformación de datos, análisis explicativo, visualización de datos, etc. Consulte esta respuesta para obtener más información: ¿qué tipo de habilidades de piratería requiere un científico de datos?
    2. Experiencia sustancial: dado que la ciencia de datos es en general un campo que admite otros campos, debe tener un conocimiento sustancial de un área de dominio para usar la ciencia de datos en eso. Por ejemplo, la industria financiera utiliza la ciencia de datos para determinar los cambios en el mercado, por lo tanto, para que un científico de datos realice análisis sobre finanzas, debe tener el conocimiento del dominio. ¿Qué es la experiencia sustantiva en ciencia de datos?
    3. Matemáticas y conocimiento estadístico: tiene sus herramientas y experiencia en un campo, pero necesita hipótesis para conectar estas cosas, ¿cómo lo haría? Llega el conocimiento matemático y estadístico: le ayuda a formar estas hipótesis, probarlas y dar una buena recomendación basada en la prueba estadística.
    • Habilidades blandas: los científicos de datos no trabajan solos, a menudo tienen que colaborar con diferentes funciones para dar sentido a los datos y trabajar en ellos. Por lo tanto, una persona que tiene calidad de juego en equipo es muy útil en este campo.

    Tener todas estas cualidades no es solo cuestión de pocos años, las personas las aprovechan y practican para ser fuertes y crear su propia experiencia en el campo de la ciencia de datos. Es por eso que se ven graduados en informática, graduados en investigación de operaciones, estadísticos y todo tipo de personas que trabajan en el campo de la ciencia de datos.

    Puede encontrar más información sobre Machine Learning y Data Science en http://ibm-ml-hub.com/ .

    Lo que hace a un “buen” científico de datos es algo subjetivo, pero le daré mis dos centavos.

    Habilidades:

    • Probabilidad / Estadística: sin una base sólida en probabilidad y estadística, un científico de datos no comprenderá ni podrá transmitir la información procesable derivada de su análisis
    • Comunicación: es imprescindible que un científico de datos pueda comunicar sus resultados a otras personas dentro de su organización de una manera que todos los públicos (desde sofisticados hasta no sofisticados) puedan comprender
    • Algoritmos: una comprensión básica de los algoritmos de aprendizaje automático, sus pros y sus contras, y las situaciones para las que cada uno es más útil, acelerará rápidamente el proceso de experimentación de los científicos de datos
    • Ordenamiento de datos: los datos del mundo real son desordenados. Un científico de datos que no puede limpiar y preparar sus propios datos para el análisis es inútil. Este no es el lado glamoroso de la ciencia de datos, pero es necesario.

    Calidades:

    • Curiosidad intelectual: un deseo de encontrar respuestas a las preguntas a través de los datos es imprescindible para esta profesión. Si prefiere encontrar sus respuestas cualitativamente o mediante anécdotas, la ciencia de datos no es para usted
    • Escepticismo: los científicos de datos deben sentirse escépticos sobre los resultados que provienen de su algoritmo. Todos los algoritmos son basura en la basura (GIGO). Un pequeño cambio o error en las entradas puede tener un impacto muy significativo en las conclusiones alcanzadas y las acciones tomadas. El escepticismo conducirá a resultados de mayor calidad.
    • Persistencia: si desea ejecutar un algoritmo, obtener algunos resultados y seguir adelante, la ciencia de datos no es para usted. Enfrentará desafíos de principio a fin en el proceso de la ciencia de datos, desde la instalación del software adecuado hasta la obtención de los datos relevantes para eliminar errores en su código y, finalmente, interpretar y comunicar los resultados. Necesita un impulso fuerte y una piel gruesa para superar todo eso.

    Valores:

    • Ética: se necesita un fuerte sentido de lo correcto y lo incorrecto cuando se trata de datos y conclusiones para ser un “buen” científico de datos. Ya sea que eso signifique tratar los datos confidenciales de manera adecuada o la honestidad intelectual al investigar una pregunta en particular, una buena brújula ética es una apuesta de mesa.
    • Trabajo en equipo: es posible que escuche algunos nombres de superestrellas en ciencia de datos, pero todos trabajan en equipos de alto rendimiento. La ciencia de datos es un campo demasiado grande para que un individuo lo sepa todo. Debe rodearse y sentirse cómodo trabajando en un entorno de equipo para maximizar su potencial.
    • Aprendizaje permanente: la ciencia de datos cambia tan rápidamente como cualquier otro campo. Esta evolución constante significa que los científicos de datos necesitan desafiarse continuamente para aprender cosas nuevas para mantenerse al día y lograr resultados de vanguardia.

    Como puede ver, no mencioné ningún lenguaje de programación en particular, software de base de datos o tipos de algoritmos que necesite saber. Esas son preocupaciones secundarias a lo anterior. Si tiene las habilidades, cualidades y valores que he enumerado, puede considerarse un buen científico de datos.

    Como su propio nombre sugiere, un científico de datos generalmente se sienta en toneladas de datos y tiene que encontrar enlaces cruciales que puedan ayudar a su organización a crecer. Entonces, para empezar, un científico de datos debe ser un tipo al que le encantan los números. Sin embargo, una vez dicho esto, también me gustaría agregar que la ciencia de datos es un campo donde la ciencia se encuentra con el arte. Es el arte de encontrar un gran significado en los datos. Por lo tanto, una idea de los científicos de datos también debería tener una inclinación creativa que lo haga usar sus datos juiciosamente.

    Estas son las dos habilidades más intrínsecas que los científicos de datos deberían tener. Además de esto, un científico de datos también debe tener una buena visión para los negocios. Solo ser bueno con los números pero tropezar para comprender los negocios no sirve de nada.

    Puede seguir leyendo este blog sobre lo que define a un científico de datos. Le da una mejor idea de las habilidades que un científico de datos debe tener para triunfar.

    Puedo pensar en las siguientes cualidades importantes, en base a mi experiencia como científico de datos, y de haber trabajado con personas exitosas:

    1. Base de conocimientos y habilidades sólidas en estadística, informática y resolución de problemas, que se traduce en fuertes habilidades básicas para resolver ingeniería estadística, aprendizaje automático y resolución de problemas basada en datos
    2. Grandes habilidades de comunicación y la capacidad de pensar de manera crítica y analítica sobre hechos, datos y narrativas, utilizando datos, hechos, inferencias y visualizaciones.
    3. Conocimiento profundo del dominio en al menos una disciplina, específicamente, el dominio en el que esperamos que trabajes como científico de datos. El conocimiento del dominio aclara su enfoque de resolución de problemas profundamente y en más formas de las que podría darse cuenta al principio.

    El tercer aspecto, el conocimiento del dominio, a menudo se pasa por alto y, en mi opinión, es clave para simplificar su enfoque de análisis de datos.

    Una de las más importantes son las habilidades sólidas de codificación: solo la capacidad de generar cientos de líneas de código que estén suficientemente organizadas y limpias para que pueda ajustarlas fácilmente en el futuro a medida que evoluciona un proyecto.

    Otra gran es una apreciación del valor de la simplicidad. Muchas personas intentan utilizar el aprendizaje profundo cuando la regresión logística es suficiente, o nlp cuando todo lo que necesitas es una expresión regular. Mantenga los modelos que ajuste y las métricas que mida de la manera más simple posible mientras resuelve adecuadamente el problema en cuestión.

    Coincidiendo con la anterior están las habilidades de comunicación (ya que las ideas más simples son más fáciles de comunicar y más difíciles de engañar). Por lo general, usted no es el experto en la materia, el ejecutivo que toma una decisión final o el ingeniero de software que recopiló los datos sin procesar. Debe poder comunicarse claramente con todas estas personas.

    Se han desplegado billones de píxeles para responder la pregunta “¿Qué hace que un buen científico de datos?” La mayoría de estos artículos se han centrado en las habilidades y herramientas de la ciencia de datos, mientras que casi ninguno ha discutido las personalidades que hacen buenos, incluso excelentes, científicos de datos. Una búsqueda en Google de “habilidades de ciencia de datos” arroja 38 millones de resultados; Los “rasgos del científico de datos” arrojan resultados anémicos de 938,000.

    Dada la variedad de capacitación gratuita, casi gratuita y de pago en Internet, casi cualquier persona puede dominar las herramientas y habilidades que se utilizan en la práctica de la ciencia de datos. Pero obtener esas herramientas y aplicarlas bien requiere un conjunto de rasgos que son difíciles de identificar y aún más difíciles de dominar.

    Hemos presentado cinco rasgos esenciales de un gran científico de datos:

    1. Curiosidad
    2. Claridad
    3. Creatividad
    4. Escepticismo
    5. Humildad

    Leer más aquí.

    concéntrese en trabajar desde el objetivo (producto o negocio) y no en preocuparse por los papeles. cualquier buen gerente de científicos de datos le informará “esto no encaja” si su pasión es jugar y escribir documentos.

    los científicos de datos tienen un conjunto de habilidades increíble, quizás el mejor en una organización para descomponer realmente un producto / negocio y evolucionarlo para mejor. cuando se distraen / rastrean de lado con su propia búsqueda intelectual, este papel pierde su importancia en la organización.

    “Un buen científico de datos es uno que es mejor estadístico que cualquier programador y mejor programador que cualquier estadístico”

    CUALIDADES DE UN BUEN CIENTÍFICO DE DATOS

    1. Una mente analítica extraordinaria.
    2. Paciencia.
    3. Excelentes habilidades de programación: R y Python
    4. Excelente conocimiento de estadística y álgebra
    5. Conocimiento sobre diversas bases de datos.

    Estos complementan las cualidades anteriores

    • Mentalidad trabajadora
    • Habilidad para pensar como un hacker
    • Pasión
    • Habilidades de manejo del tiempo

    Curiosidad, escepticismo y perseverancia.

    Hay muchas cualidades para enumerar aquí, pero dos son las más importantes: fuertes habilidades matemáticas y la capacidad de hacer una “narración de datos” convincente.

    Las características, cualidades y valores que uno debe tener para convertirse en un buen científico de datos son las mismas que cualquiera debería ser un buen [insertar profesión aquí]. Unos pocos se enumeran a continuación:

    • Deseo de aprender más allá de su alcance actual
    • Fuerte ética de trabajo
    • Trabajo en equipo
    • Buena brújula moral

    El conjunto de habilidades técnicas es una bestia diferente, pero puede resumirse en conocimientos de programación, matemáticas y dominio de la industria.

    Solo compartiendo.
    Un grupo excelente para entusiastas de Big Data apasionados por aprender y compartir cosas relacionadas con las tecnologías de Big Data.

    Unirse

    https://groups.google.com/d/forum/big-data-techies

    Aquí hay 6 que serían grandes cualidades para cualquier científico de datos aspiracional:

    • Una búsqueda constante de aprendizaje
    • Una curiosidad insaciable
    • Una terquedad optimista
    • Una inclinación práctica
    • Una dosis saludable de escepticismo
    • Un amor por la narración

    Aquí hay 4 más que se deben desarrollar a lo largo de la carrera:

    • Una habilidad para priorizar
    • Un hábito de confiabilidad
    • Una mentalidad impulsada por el impacto
    • Una intuición llena de conocimiento del dominio

    Detallo los 10 más en mi respuesta a ¿Cuáles son los rasgos clave de un científico de datos?

    Lee la respuesta a una pregunta similar.

    ¿Cuáles son las 5 habilidades principales necesarias para convertirse en un científico de datos?

    Curiosidad, pensamiento crítico y un profundo conocimiento de las ciencias y las matemáticas. El resto se puede aprender.