Los científicos de datos aprenden sobre datos. No aprenden sobre lo grande. Muchos no aprenden sobre el desarrollo, Dios no quiera diseñar software.
Mi experiencia es en (uno de) los mayores campos no comerciales de análisis de datos: LHC y su red informática. Odio explotar una burbuja, pero no confiaría en que la mayoría de nuestra gente maneje más de un servidor a la vez. Estamos capacitados para encontrar respuestas a problemas, no para formular estas respuestas de manera eficiente. Especialmente no de manera distribuida, concurrente, asíncrona, masivamente paralela.
La fracción más grande de ingenieros de datos se las arregla porque no tienen que escalar. No tienen que escalar porque hay algunos desarrolladores competentes que hacen las tareas. Si alguien le da el mapa, reduce la cuadrícula, los recursos de la nube asignados dinámicamente y todas las herramientas y marcos, debe ser un imbécil para desordenar.
- ¿Cuáles son las últimas tecnologías para el desarrollo más rápido en el campo del software?
- ¿Qué pasos debo seguir para aprender C # como desarrollador principiante?
- ¿Cuáles son las mejores herramientas y servicios para probar software?
- ¿Cuál es el salario de un analista de garantía de calidad de software?
- Cómo desarrollarme en las pruebas de software
Pero debido a que muchos ingenieros de datos funcionan bien, piensan que están calificados para escalar. No lo son, pero su punto de vista es demasiado limitado para darse cuenta. Piensan que los datos son más importantes que el software , sin darse cuenta de que el diseño del software está muy relacionado con la coincidencia de estructuras de datos y algoritmos. Piensan que los datos son más importantes que el software , negando la necesidad de aprender sobre el diseño de software. Piensan que los datos son más importantes que el software , ignorando todo lo que no son datos.
En resumen, son el tipo de personas que se preguntan por qué las cosas se rompen después de enviar miles de trabajos detrás de NAT, cada trabajo usando rsync a una sola máquina que tiene un montaje WAN NFS para almacenamiento en la red. Debido a que no pudieron ser evaluados para acceder a él utilizando un protocolo estándar. Y su prueba local de 10 funcionó bien.
¿Los datos se están volviendo más valiosos que un software?
No. Los datos se están convirtiendo en software.