En primer lugar, como ingeniero de datos / científico de datos, debe comprender la importancia de los algoritmos y las estructuras de datos y el papel que desempeñan en la ciencia de datos.
En todo el mundo, las organizaciones están creando más datos todos los días, pero la mayoría está luchando por beneficiarse de ellos. Por lo tanto, para minimizar este tipo de problemas, la mayoría de los científicos de datos utilizan una combinación de diferentes habilidades todos los días para ayudarlos a resolver estos problemas en erupción.
Es bastante confuso para un recién llegado al campo, por lo tanto, permítame desmitificar las diferentes habilidades / herramientas y técnicas dentro de la ciencia de datos para que pueda comprender los matices dentro del campo.
- ¿Por qué es importante la comunicación para los científicos de datos?
- ¿Se necesita ser un analista de datos para ser un científico de datos?
- ¿Es la escritura técnica una habilidad útil para tener como estadista o científico de datos?
- ¿Las preguntas de la entrevista de Google destinadas a evaluar las habilidades de 'resolución de problemas' son realmente efectivas para separar a los candidatos buenos de los malos?
- ¿Es la demanda de científicos de datos lo suficientemente alta en relación con la oferta, como para que los empleadores consideren candidatos menos que ideales?
- Cómo convertirse en un científico de datos con matemáticas: las matemáticas son una parte importante de la ciencia de datos, cuando los datos crecen, a menudo se vuelven difíciles de manejar . En este momento necesitará usar las matemáticas para procesar y estructurar los datos con los que está tratando. Cuantas más matemáticas sepa, mejorará.
- Cómo convertirse en un científico de datos con estadísticas : las estadísticas se utilizan para inferir ideas de conjuntos de datos más pequeños en poblaciones más grandes. Esta es la ley fundamental de la ciencia de datos. Las estadísticas allanarán su camino sobre cómo convertirse en un científico de datos. Es esencial conocer las estadísticas para jugar con la ciencia de datos, le permite comprender mejor los patrones observados en los datos y ayudarlo a extraer los conocimientos necesarios para llegar a una conclusión razonable.
- Cómo convertirse en un científico de datos con algoritmos: los algoritmos son la capacidad de hacer que las computadoras sigan un cierto conjunto de reglas o patrones. Comprender cómo usar máquinas para hacer su trabajo es esencial para procesar y analizar conjuntos de datos demasiado grandes para que la mente humana los procese. Para que pueda hacer un trabajo pesado en la ciencia de datos, tendrá que comprender la teoría detrás de la selección y optimización de algoritmos. Tendrá que decidir si su problema requiere o no un análisis de regresión o un algoritmo que ayude a clasificar diferentes puntos de datos en categorías definidas. Querrá conocer muchos algoritmos, también querrá aprender el aprendizaje automático, es decir, el aprendizaje automático es lo que le permite a Amazon recomendarle productos basados en su historial de compras sin ninguna intervención humana directa. Es un conjunto de algoritmos que utilizarán la potencia de la máquina para descubrir ideas para usted.
- Cómo convertirse en un científico de datos con visualización de datos: para impulsar el impacto, tendrá que convencer a otros para que crean y adopten sus ideas. Así es como te conviertes en un científico de datos. La visualización de datos es el arte de presentar información a través de gráficos y otras herramientas visuales, para que el público pueda interpretar fácilmente los datos y obtener información de ellos . Según 3M y Zabisco, casi el 90% de la información transmitida a su cerebro es de naturaleza visual, y las imágenes se procesan 60,000 veces más rápido que el texto .
- Cómo convertirse en un científico de datos con conocimiento empresarial: los datos significarán muy poco sin el contexto. Tienes que entender el negocio que estás analizando. Por lo tanto, la claridad del tema es imprescindible para ser un científico de datos. El mejor científico de datos no solo tiene la capacidad de trabajar con datos complejos de gran tamaño, sino que también comprende las complejidades de la empresa u organización para la que trabaja.
- Cómo convertirse en un científico de datos con experiencia en el dominio: como científico de datos, debe conocer el negocio para el que trabaja y la industria en la que vive. Además de tener un conocimiento profundo de la empresa para la que trabaja, también tendrá que comprender el campo funciona para que sus ideas comerciales tengan sentido.
Volviendo a su pregunta, sí, la ingeniería de software / ingeniería de datos / ciencia de datos son diferentes en función de los diferentes conjuntos de habilidades. Déjame darte una idea de los diferentes roles dentro de la ciencia de datos :
- Científicos de datos : son los que ajustan los modelos estadísticos y matemáticos que se aplican a los datos. Un científico de datos será quien tome un problema comercial y lo traduzca a una pregunta de datos, creando modelos predictivos para responder las preguntas y aportar una solución a los hallazgos.
Habilidades que necesita: algoritmos, estadísticas, matemáticas, lenguajes de programación como R y Python. Conocimiento de cómo estructurar un problema de datos, desde formular la pregunta correcta hasta comunicar los resultados de manera efectiva.
- Ingenieros de datos : son los que confían principalmente en su experiencia en ingeniería de software para manejar grandes cantidades de datos a escala. Estos son generalistas versátiles que usan la informática para ayudar a procesar grandes conjuntos de datos. Por lo general, se centran en la codificación, la limpieza de conjuntos de datos y la implementación de solicitudes que provienen de científicos de datos. Por lo general, conocen una amplia variedad de lenguajes de programación, desde Python hasta Java. Cuando alguien toma el modelo predictivo del científico de datos y lo implementa en código, generalmente desempeña el papel de un ingeniero de datos.
Habilidades que necesita: un profundo conocimiento en soluciones de almacenamiento y almacenamiento de datos ( SQL y NOSQL ), marcos de programación como Hadoop y Spark que pueden ayudarlo a obtener datos y procesarlos.
- Analistas de datos : son ellos quienes examinan los datos y proporcionan informes y visualizaciones para explicar qué información ocultan los datos. Cuando alguien ayuda a personas de toda la empresa a comprender consultas específicas con gráficos, están cumpliendo el rol de analista de datos.
Habilidades que necesita: comprensión sólida de la manipulación de datos (utilizando programas como Excel) y comunicación de datos.
¿Cuál es la comida para llevar?
Se puede decir que los ingenieros de datos confían más en las habilidades de ingeniería , los científicos de datos confían más en su capacitación en matemáticas y estadísticas , y los analistas de negocios confían más en sus habilidades de comunicación y su experiencia en el dominio . Puede estar seguro de que las personas que ocupan estos roles tendrán diferentes cantidades de habilidades fuera de sus especialidades.
¿Cuáles son las habilidades básicas que se necesitan para ser un científico de datos?
Para ser precisos, hay tres habilidades básicas que uno debe considerar en la ciencia de datos:
- Algoritmos: usted comprende la teoría de la ciencia de datos, las estadísticas, las reglas de modelado y las matemáticas que constituyen el núcleo de cualquier problema de datos. Entiende cómo se diseñan y miden los experimentos. Entiende los algoritmos y la teoría detrás de la ciencia de datos.
- Ingeniería: comprende la ingeniería necesaria para obtener, procesar y almacenar datos. Debe conocer los lenguajes de programación y los esquemas de computación distribuida que lo ayudarán a manejar grandes cantidades de datos a escala. Debe comprender la programación que aplica sus teorías a conjuntos de datos masivos. (Ingenieria)
- Comunicación: comprende cómo comunicar sus soluciones y cómo relacionar esas soluciones con los problemas empresariales.
¿Estás listo para comenzar una carrera en ciencia de datos?
Permítame ayudarlo brindándole diferentes trayectorias profesionales para aprender ciencia de datos a su conveniencia.
- MOOC en línea como Udacity, Udemy, edWisor y Simplilearn, etc.
- Udacity, Udemy , Simplilearn : buenas habilidades de aprendizaje, buen currículum, sesiones en vivo, nano títulos, certificaciones, asistencia laboral pero sin garantía de empleo.
- edWisor : buenas habilidades de aprendizaje, sesiones en vivo, proyectos en vivo, experiencia práctica, capacitación práctica, orientación de mentores, evaluación de proyectos y garantía de empleo en una empresa / empresa basada en productos. Hay más de 100 empresas que contratan candidatos capacitados para edwisor hoy.
- Libros en línea que puede consultar – (enumere los libros de ciencia de datos, pero recuerde que su objetivo principal es conseguir un trabajo )
- Data Jujitsu: el arte de convertir datos en producto
- R Cookbook: Recetas comprobadas para análisis de datos, estadísticas y gráficos (O’Reilly Cookbooks)
- Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos
- Programación de la inteligencia colectiva: creación de aplicaciones web 2.0 inteligentes
- Haciendo ciencia de datos: conversación directa desde la primera línea
- Ciudades inteligentes: Big Data, piratas informáticos cívicos y la búsqueda de una nueva utopía
Espero que las respuestas anteriores hayan despejado todas tus dudas.
¡Te deseo lo mejor!