La discusión sobre este hilo es bastante representativa del espectro de opiniones sobre lo que realmente significa el término (y título profesional) “científico de datos”:
La primera pregunta en cuestión es “¿ seguirá existiendo una gran demanda de profesionales con la capacidad de trabajar con datos con éxito “?
- Si esto es lo que queremos saber, la respuesta es un ” sí ” inequívoco; la creciente demanda de “científicos de datos” es representativa de una necesidad que no disminuirá en el corto plazo. El costo de almacenar, trabajar y obtener información de los datos sigue disminuyendo, lo que significa que la demanda de profesionales que puedan trabajar con esta información y entregar las ideas continuará creciendo.
- La necesidad de obtener información a partir de los datos para las empresas de tecnología, basadas en gran medida (o exclusivamente) a través de la interfaz móvil y web, es sencilla, pero la explosión de la demanda de científicos de datos (y otros profesionales de datos) en el comercio minorista, telecomunicaciones, marketing, atención médica, educación y Casi todas las demás industrias y sectores públicos sugieren un hecho convincente: el aprovechamiento de los datos es fundamentalmente un ejercicio para utilizar la evidencia disponible para llevar a cabo una toma de decisiones óptima al operar una empresa o institución pública. En este sentido, la pregunta de si continuará existiendo una demanda de expertos que puedan trabajar bien con los datos es como preguntar si seguirá existiendo una demanda de expertos que puedan administrar bien o que puedan garantizar la excelencia operativa en una organización . A medida que una empresa crece, la necesidad de que estas habilidades se mantengan competitivas se convertirá en una necesidad más que un lujo.
Entonces, ¿de qué tipo de “expertos en datos” estamos hablando? Científico de datos, analistas, mineros de datos, estadísticos, …
- ¿Cuál es la mejor computadora portátil para un científico de datos?
- ¿Es un rol de analista de negocios en Apple lo suficientemente desafiante para alguien que es científico de datos en la industria no tecnológica y programas en Python y C ++?
- Tengo un título en ingeniería, pero quiero convertirme en científico de datos. ¿Merece la pena obtener una maestría o simplemente ampliar mis habilidades de programación, estadística y matemática?
- Hice mi maestría en física y soy bueno en los lenguajes de programación Python y R. ¿Puedo postularme como científico / analista de datos?
- Como científico de datos en una empresa más grande, ¿es más valioso sentarse con el equipo de productos o con un equipo de científicos de datos?
- En cierto modo, la respuesta es “todo lo anterior”. Debido a que el campo es tan nuevo, la forma en que usamos estos términos todavía está pendiente, por lo que hay mucho espacio para un debate saludable sobre las distinciones entre los “analistas de datos” tradicionales (o el “minero de datos” menos utilizado) y los “científicos de datos”, o si los científicos de datos son estadísticos renombrados. La distinción que está comenzando a solidificarse en la industria es que los analistas analizan e informan sobre observaciones de datos anteriores , mientras que los científicos llevan esos datos un paso más allá utilizando el modelado estadístico y el aprendizaje automático para sacar conclusiones e ideas sobre datos futuros que aún no se han recopilado. El idioma todavía está cambiando y hay muchos “Científicos de datos” fantásticos con “Analista” en sus títulos.
- En círculos, trabajo con el término “científico de datos” significa alguien con el conocimiento, las habilidades y la experiencia para crear modelos prescriptivos y predictivos además de informes retrospectivos. En gran parte, esto significa utilizar una gran cantidad de modelado estadístico y aprendizaje automático, por lo que las estadísticas son un punto de partida para aprender ciencia de datos. Sin embargo, Data Science no se trata de la teoría estadística pura más que de la bioinformática, la mecánica estadística o cualquier otra disciplina.
- Al igual que con la mayoría de las nuevas profesiones (o al menos títulos profesionales), el papel de Data Scientist sigue siendo un poco complicado para una serie de especializaciones importantes. Ya existe una distinción entre el Data Science Modeler, que se enfoca más en diseñar, diseñar y entrenar los algoritmos y generar información de datos, y el Data Science Engineer que se enfoca más en proporcionar la implementación escalable y la arquitectura distribuida necesaria para ejecutar estos algoritmos en producción. La terminología sin duda evolucionará en los próximos años, pero es probable que los científicos de datos de todas las tendencias sigan necesitando tener una familiaridad funcional con los fundamentos importantes en las ciencias de datos: un modelador de ciencia de datos incapaz de pensar y anticipar los problemas de escalabilidad en su código no serán muy efectivos cuando se trata de la producción, y un ingeniero de datos que no esté familiarizado con las estadísticas o los elementos de Machine Learning tendrá dificultades para diseñar sistemas eficientes que aprovechen al máximo los algoritmos del modelador .
Pero, ¿la ciencia de datos es realmente una ciencia?
Para estar seguros, es un nuevo término para un campo en crecimiento. Muchos podrían estar de acuerdo en que fundamentalmente cualquier ciencia se trata de tomar observaciones del mundo real y usar mejores prácticas confiables para comprender esas observaciones y sacar conclusiones comprobables sobre las nuevas observaciones que esperamos hacer. Entonces, aunque Data Science no está en la lista de “ciencias tradicionales” como Física o Biología, que se enfocan directamente en la observación de fenómenos naturales, es similar a Computer Science, una ciencia de sacar conclusiones comprobables sobre fenómenos computacionales. Data Science se trata de extraer conclusiones comprobables sobre conjuntos de datos de todo tipo extraídos de entornos industriales o académicos.
La capacitación de un científico de datos significa desarrollar las habilidades de los estudiantes para pensar y operar como científicos, profundizando en las estadísticas de pruebas rigurosas de hipótesis y mejores prácticas de diseño experimental. Los principales científicos de datos deben tener la experiencia de trabajar con datos del mundo real tomados de la industria para obtener información comprobable sobre esos datos que puedan usarse en el futuro.
Tener habilidades como esta es lo que hace que los científicos de datos expertos sean tan buscados en la industria. Entonces, a medida que un conjunto de habilidades básicas bien definido para los científicos de datos y otros especialistas continúe tomando forma en los próximos años, la pregunta evolucionará más de si se necesita un científico de datos , a una pregunta de qué tipo de experto en datos puede beneficiarse una institución de la mayoría .