¿Qué tan competente se necesita para codificar para convertirse en un científico de datos?

No sé cómo calificar los niveles de competencia, pero espero que un científico de datos de nivel medio a superior sea un programador muy competente. Sin embargo, hay varias capas a mi expectativa. También defiendo que los analistas de datos de hoy en día deberían desarrollar experiencia en la codificación, por lo que los arrojaré a la mezcla para explicarlos.

Digamos que contrato a un analista de datos junior. Su trabajo será crear paneles en alguna plataforma de terceros que se conecte a nuestras bases de datos. Esto solo implica que se utilizarán algunos SQL y secuencias de comandos en algún momento.

Más temprano que tarde, él / ella estará haciendo análisis de datos, incluso si son simples descriptivos. En mi equipo, estos análisis se revisan internamente antes de ser enviados a usuarios comerciales. Puede haber nuevas preguntas (las denominamos seguimientos) en el proceso de revisión o por decisión de los usuarios comerciales. Para responder rápidamente a estos, el análisis debe estar codificado.

Para proyectos de ciencia de datos, la codificación es fundamental. La gran mayoría es prototipo y código de análisis exploratorio. Aunque tenemos estándares de codificación para el código R, no lo hago cumplir particularmente para los prototipos, pero sí para el análisis de datos y los productos de datos de nivel de producción.

A medida que un científico de datos se vuelve más autónomo (es decir, puestos intermedios y superiores) debe garantizar la calidad del código. En este momento, el dominio de la codificación es una prioridad. Utilizo un tiempo considerable para transmitir las mejores prácticas a los miembros de mi equipo yendo tan lejos como para establecer metas personales para ellos en términos de calidad de programación.

Todo esto para decir que considero que la codificación es extremadamente importante pero en diferentes niveles. Algunos códigos deben estar tan bien diseñados como sea posible. Otros se pueden tirar. Pero cada persona que trabaja conmigo crece en el dominio de la codificación porque quiero que todos construyan productos de datos (científicos de datos o no) y quiero que seamos lo más eficientes posible y una de las formas más rápidas es a través del código.

¡Espero que esto ayude!

No es tanto codificación, ya que el código de programación es solo una traducción del proceso de pensamiento algorítmico. Sigo escuchando a los solicitantes que desean inscribirse en los programas del Data ScienceTech Institute “Estoy aprendiendo R, estoy aprendiendo Python, estoy aprendiendo Scala”.

Eso es genial y siempre aprecio el esfuerzo, pero aprender una sintaxis no significa aprender algoritmos. Siempre recomiendo este libro: Introducción a los algoritmos.

Un buen desarrollador / informático / científico de datos debería ser capaz de traducir un algoritmo en casi cualquier idioma una vez que haya elegido la sintaxis y los principios de dicho idioma. Y el último proceso no debería llevar mucho tiempo si ha diseñado su algoritmo de antemano.

Último consejo: una vez que su algoritmo esté a la altura, aprenda C con Amazon.com: El lenguaje de programación C (9780131103627): Brian W. Kernighan, Dennis M. Ritchie: Libros y asegúrese de que puede hacer todos los ejercicios en él. Sé que suena extraño y no tan moderno como los idiomas que mencioné anteriormente, pero C es tan bajo que aprendes a “hablar” con la máquina, su sintaxis es de la misma familia que todos los lenguajes exagerados del momento , y muchos desarrollos industrializados de Data Science se vuelven a implementar en C / C ++ por razones de rendimiento. Una inversión segura y sólida 😉

La codificación es una parte crucial en el día de Data Scientist. Aunque no es obligatorio tener habilidades de codificación impresionantes, sí lo hará la comprensión básica.

Dicho esto, no es imposible ser un Científico de Datos sin habilidades de codificación. Consulte el siguiente artículo de Analytic Vidya donde cubren las herramientas que se utilizarán para convertirse en Científico de Datos para las personas que no conocen la codificación.

19 herramientas de ciencia de datos para personas que no son tan buenas en programación

No estoy seguro de la competencia, pero todo lo que sé (y hago constantemente) es fortalecer sus estructuras de datos y conceptos de algoritmos, luego elegir cualquier lenguaje como Python, R o Java (famosos para la ciencia de datos) para codificar. El dominio viene con la práctica. Si es claro con sus conceptos básicos, estoy seguro de que no le tomará mucho tiempo llegar a ser “competente”, pero asegúrese de tener un conocimiento funcional / funcional del lenguaje / conceptos de programación orientado a objetos.

More Interesting

¿Por qué cambiaste tu carrera a informática?

¿Dónde debo comenzar a construir un gran currículum desde cero?

¿Qué compañías ofrecen el salario más alto a los ingenieros mecánicos?

En un sentido general / amplio, ¿los graduados en ciencias de la computación se desempeñan mejor en puestos técnicos específicos en comparación con los graduados del campo de entrenamiento de código?

Si tenía 31 años, era hábil con las computadoras pero con cero conocimientos de programación y un trabajo a tiempo completo, ¿cree que podría valer la pena / factible comenzar a aprender codificación para cambiar completamente su carrera / vida?

¿Qué cursos en línea debo tomar para estudiar ciencias de la computación para que mi conocimiento sea equivalente al de un graduado de 4 años en ciencias de la computación?

¿Cuáles son los pasos correctos para que un estudiante de CS mejore como programador?

¿Necesito un número específico de publicaciones para convertirme en profesor de informática?

¿Es bueno ICFAI Hyderabad para hacer un BTech en informática?

¿Es necesario hacer un B.Tech para convertirse en un programador de computadoras?

¿Cuánto beneficia tener fuertes habilidades sociales a un ingeniero principiante?

Cómo saber si la programación es para mí

¿Cuáles son algunos desafíos que puedo plantearme si quiero convertirme en un gran desarrollador?

¿Solo las personas inteligentes pueden convertirse en desarrolladores de software?

¿Necesita maestría en ciencias de la computación si planea tener un inicio tecnológico?