¿Cómo son los trabajos de Big Data?

Aquí hay algunos roles de trabajo en demanda relacionados con big data:

Científico de datos : Según este artículo de HBR, titulado ‘Científico de datos: el trabajo más sexy del siglo XXI’, se dice que un “científico de datos” es un “profesional de alto rango con la capacitación y la curiosidad para hacer descubrimientos en el mundo de Big Data ‘. Es un puesto de trabajo que combina la experiencia de análisis, estadísticas y programación. Sin embargo, el conocimiento de programación actúa como el trampolín dominante para embarcarse en una carrera en este papel. Con el advenimiento dramático de la inteligencia artificial en la escena empresarial y el gran volumen, variedad y velocidad de los datos, las empresas están buscando profesionales que puedan proporcionar respuestas relevantes y rápidas a través de la automatización y las plataformas integradas en datos. Un candidato con las credenciales académicas necesarias, un máster o un doctorado en aprendizaje automático, estadística o ciencia de datos, junto con un profundo conocimiento práctico de –Hadoop, Python, Java, R y SQL, puede buscar grandes avances en el campo de Ciencia de los datos.
Tales credenciales, sin embargo, no compensan el requisito crítico de conocimiento específico del dominio. Se espera que los científicos de datos utilicen plataformas de la empresa y herramientas de BI para no solo recopilar la información más precisa y relevante, desarrollar algoritmos que admitan la automatización para, por ejemplo, el reconocimiento de patrones, sino que también usen sus habilidades de programación para permitir la comunicación de información pertinente y procesable. en beneficio de todos los interesados. Naturalmente, es posible que algunas partes interesadas no se sientan cómodas con la automatización de datos, pero buscarían confiar en el valor analítico único arraigado en la infraestructura de la base de datos creada por los científicos de datos de la compañía.

Certificaciones como Certified Analytics Professional (CAP), EMC: Data Science Associate (EMCDSA), SAS Certified Predictive Modeler y Cloudera Certified Professional: Data Scientist (CCP-DS) pueden resultar realmente útiles a largo plazo en este campo.

Ingeniero de datos : La responsabilidad principal de un ingeniero de datos es conceptualizar e implementar la infraestructura de la base de datos de la organización. Además, se espera que participen activamente en la gestión de datos con el objetivo de respaldar la extracción, prueba y análisis de datos por parte de analistas comerciales. Con el análisis colaborativo y la tecnología en la nube que presentan soluciones efectivas y alternativas para el procesamiento de datos, se espera que los ingenieros de datos tengan una mejor comprensión de los conjuntos de habilidades relacionadas con el diseño, la construcción y la administración de bases de datos / aplicaciones en la nube. Una comprensión profunda de Hadoop, Apache Spark, SparkSQL sería útil para obtener experiencia en este rol. La aparición de proveedores de servicios en la nube como Amazon (Redshift), Microsoft (Azure) y Rackspace ha permitido acelerar el intercambio y el procesamiento de datos, impulsando a su vez el desarrollo de aplicaciones basadas en la nube para la detección de fraudes, el reconocimiento facial y el diagnóstico médico, entre muchos otros. Los profesionales calificados que estén al tanto de estas tendencias tecnológicas emergentes podrían crear una impresión en este rol.

Leer más: Desentrañando el mundo de Big Data

Los trabajos de Big Data están en alta demanda

¿Por qué?

Se producen enormes datos cada segundo y, si se recopilan todos a diario, se generan 2.5 bytes quintilianos de datos que se generan todos los días. El 90% de estos datos se han generado en los últimos 2 años. Esto ha llevado a una gran explosión de datos. Estos datos están creciendo a una tasa del 40% si se combinan anualmente.

Si calculamos los datos totales que se generarán para 2020, se trata de alrededor de 45 ZB que muestran cómo está creciendo Big data y sería la tecnología más exigente en los próximos años.

Esto les daría a los profesionales de Big Data un futuro muy brillante para trabajar.

Los trabajos de Hadoop no solo los ofrecen las empresas de TI. De hecho, todo tipo de empresas están contratando candidatos Hadoop con altos salarios. Estas empresas incluyen firmas financieras, organizaciones minoristas, bancos, organizaciones de atención médica, etc.

Hay una gran demanda de trabajos de desarrollador de Hadoop y trabajos de administración de Hadoop entre las nuevas empresas que incorporan Hadoop directamente en sus planes de negocios. Las principales empresas como EMC Corporation, Apple, Facebook, Google, Oracle, Hortonworks, IBM, Microsoft, Cisco, etc. tienen vacantes en Hadoop en gran cantidad con varios puestos como Desarrolladores de Hadoop, Probadores de Hadoop, Arquitectos de Hadoop y Administradores de Hadoop. El alcance de Big Data se encuentra en casi todas las ciudades de India, y la mayor demanda se encuentra en Bangalore, Pune, Mumbai, Hyderabad, Chennai, Nueva Delhi y NCR.

Tengamos una breve descripción de las diversas descripciones de trabajo de Hadoop

  1. Desarrollador Hadoop

Las responsabilidades del trabajo de un desarrollador de Hadoop incluyen escribir programas según los diseños del sistema. Deben tener un conocimiento justo sobre la codificación y la programación. La función de trabajo del desarrollador de Hadoop es similar a la del desarrollador de software, pero en el dominio de Big Data. Las tareas del desarrollador de Hadoop también incluyen comprender y trabajar para encontrar soluciones a los problemas, diseñar y diseñar junto con fuertes habilidades de documentación.

Roles y responsabilidades del desarrollador de Hadoop

  • Definición de flujos de trabajo de Hadoop
  • Administrar y revisar archivos de registro
  • Servicios de coordinación de clúster utilizando Zookeeper
  • Administrar trabajos de Hadoop con la ayuda del planificador
  • Trabajando en programas MapReduce que se ejecutan en el clúster Hadoop

Habilidades requeridas para el desarrollador de Hadoop:

  • Habilidades para escribir Scripts latinos de Pig y HiveQL
  • Conocimiento de flujo de trabajo / planificadores como Oozie
  • Capaz de manejar herramientas de carga de datos como Flume y Sqoop

Experiencia requerida para un perfil de desarrollador de Hadoop

0-5 años

2. Arquitecto de Hadoop

Las responsabilidades de trabajo de un arquitecto de Hadoop incluyen el diseño de cómo debe funcionar el sistema y administrar el ciclo de vida completo de una solución de Hadoop. El arquitecto Hadoop debe tener experiencia en la materia y experiencia de entrega trabajando en plataformas de distribución populares de Hadoop como Cloudera, HortonWorks y MapR.

Roles y responsabilidades del arquitecto Hadoop

  • Diseño de arquitectura técnica y personalización de aplicaciones.
  • Procesar el análisis de requisitos necesario
  • Operar la implementación del diseño de la solución propuesta

Habilidades requeridas para Hadoop Architect

  • Profundo conocimiento de Hadoop Architecture y HDFS, incluido YARN
  • Colmena, cerdo
  • Java MapReduce
  • HBase

Experiencia requerida para un perfil de arquitecto Hadoop

Experiencia requerida para un perfil de arquitecto Hadoop

8+ años

3. Administrador de Hadoop

Las responsabilidades del trabajo del administrador de Hadoop son similares al trabajo del administrador del sistema. Las funciones y responsabilidades administrativas de Hadoop son configurar clústeres de Hadoop, copias de seguridad, recuperación y mantenimiento de los mismos. El administrador de Hadoop requiere un conocimiento profundo de los sistemas de hardware y la arquitectura de Hadoop.

Roles y responsabilidades de administrador de Hadoop:

  • Mantenimiento y soporte de HDFS
  • Planificación y selección de grupos
  • Seguimiento de todos los problemas de conectividad y seguridad
  • Configuración para nuevos usuarios de Hadoop

Habilidades requeridas para el administrador de Hadoop:

  • Conocimiento de Hbase
  • Experiencia en Oozie, HCatalog, Hive
  • Buenas habilidades de scripting en entorno Linux

Roles y responsabilidades de administrador de Hadoop:

0-5 años

4. Probador de Hadoop

Las responsabilidades laborales del probador de Hadoop incluyen garantizar que el proceso que se está diseñando esté sincronizado con el proceso requerido por la organización. Su función clave es encontrar y corregir errores en las aplicaciones de Hadoop.

Roles y responsabilidades de Hadoop Tester

  • La responsabilidad clave incluye la resolución de problemas y la búsqueda de errores en el programa e informarlos al desarrollador de Hadoop para tomar medidas correctivas
  • Informe de cada caso de prueba positivo y negativo en componentes Hadoop / Pig / Hive

Habilidades requeridas para Hadoop Tester

  • Prueba de habilidades para JUnit, MRUnit framework
  • Expertise Java para probar los trabajos de MapReduce
  • Conocimiento práctico de colmena, cerdo

Se requiere experiencia para un perfil de probador de Hadoop

0-5 años

5. analista de Hadoop

Las responsabilidades laborales de un analista de Hadoop incluyen el análisis de grandes cantidades de datos y revelar información que las empresas podrían utilizar para su mejora.

Analista de Hadoop Roles y responsabilidades

  • Desarrollar una nueva visión a partir de los datos disponibles utilizando lenguaje de script
  • Realizar pruebas A / B según diferentes hipótesis para impactar diferentes indicadores clave de rendimiento

Habilidades requeridas para Hadoop Analyst

  • Conocimiento práctico de colmena, cerdo
  • Conocimiento profundo de Flume y comando SQL

Experiencia requerida para un perfil de analista de Hadoop

0-5 años

Si desea aprender sobre Big y Hadoop, existen institutos de renombre que ofrecen cursos de certificación en línea sobre Big Data. Aquí están los cursos que le sugiero que debe seguir una vez.

Capacitación certificada en Big Data y Hadoop

Curso de capacitación certificado para desarrolladores de Hadoop y Spark

Si desea comenzar a aprender Big Data y Hadoop, aquí hay algunos blogs muy detallados que puede consultar

Big Data: aprenda qué es Big Data y su importancia

Tutorial de Hadoop: una guía completa de Hadoop para principiantes

Características de Hadoop HDFS: descripción general para principiantes

MapReduce – Introducción a Hadoop MapReduce para principiantes

Junto con la tecnología relativamente nueva de Big Data está el nuevo científico de datos de títulos de trabajo. Si bien no está vinculado exclusivamente a los proyectos de Big Data, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se examinan, en comparación con los roles tradicionales …

Puede visitar este enlace: Ciencia de datos, R, Mahout – Clases de capacitación de cursos combinados en línea | Data Science, R, Mahout – Cursos de cursos combinados en línea Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

. Lo que distingue al científico de datos es la perspicacia empresarial sólida, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es curioso, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan los supuestos y procesos existentes

Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

Las discusiones sobre quién está calificado exactamente para ser un científico de datos no difieren demasiado del debate que se sostuvo anteriormente sobre si, sin embargo, al principio, los expertos de la industria han indicado que un científico de datos debe tener una maestría en matemáticas o estadísticas. Mientras tanto, el CTO del grupo en Shoppers Stop dice: “Hay una escasez de profesionales a los que se les puede llamar científicos de datos. Por el momento, quien tiene pasión por trabajar con datos está llenando el vacío ”.

Un científico de datos trabajará en el desarrollo de nuevos algoritmos y presentará nuevos patrones e ideas sobre los datos que de otro modo permanecerían ocultos. “Junto con las estadísticas, un científico de datos puede tener una calificación en economía, y definitivamente necesita una docena o más de experiencia trabajando con diez a quince herramientas de BI”, dice Chuck Hollis, vicepresidente de marketing global y CTO, EMC.

un proveedor de servicios de análisis y ciencia de decisiones dice que “los científicos de datos también incursionarán en psicología experimental, antropología y ciencias sociales”. Con la necesidad de establecer centros de excelencia de BI (CoE), los análisis se institucionalizarán.

Con el advenimiento de las redes sociales impactando la mayoría de las facetas de los negocios, las organizaciones esperan integrar la tecnología, el software social y el BI para crear un ambiente agradable para la toma de decisiones. El científico de datos será responsable de proporcionar un contexto social a la información. BI y análisis bailan a una nueva melodía cuando adoptan nuevos enfoques como Hadoop. No esperan datos estructurados, limpios y prístinos, sino que trabajan con una mezcla de datos para proporcionar un análisis en tiempo real o cercano. La analítica descriptiva, la analítica inquisitiva, la analítica preventiva y prescriptiva son parte del nuevo paradigma, con el científico de datos en el centro.

La curva de evolución se está moviendo del apoyo a la toma de decisiones a ser cada vez más operacional, con una progresión inminente que llevará la competencia estratégica a un nivel completamente nuevo con los científicos de datos en la imagen. BI entró en escena hace quince años y TI poseía estas iniciativas. Ahora, BI es una función comercial que involucra investigación de mercado con un enfoque central en análisis. Las compañías con grandes volúmenes de datos (internos y externos) irían a The Notion Market sin pestañear, pero las compañías más pequeñas lo pensarían dos veces antes de pagarle a alguien para hacer algo que su proveedor de BI les dijo que haría su producto de BI.

Sin embargo, no es que haya científicos de datos en abundancia, todos clamando por empleos. Por el contrario, como dice Hollis de EMC, “Hay una escasez de talento. Por cada científico de datos, hay treinta trabajos esperando “.

En respuesta a este problema, Analytics as a Service se presenta como una alternativa factible. La analítica como servicio aún es incipiente y evoluciona; A medida que crece la complejidad y emergen modelos de servicio maduros que están vinculados con los resultados y el éxito, la tasa de adopción aumentará. La posibilidad de contratar a un científico de datos a través de un proveedor de servicios de análisis es un paso intermedio para muchas EMPRESAS medianas y pequeñas

TCS se ha asociado con cuatro universidades: la Universidad Swami Vivekananda (Bengala Occidental), la Facultad de Artes y Ciencias St Xaviers (Ahmedabad), la Universidad Central para ofrecer cursos en Big Data, ya que busca fortalecer el grupo de mano de obra en el espacio de tecnología digital en India .

Si necesita más información sobre la búsqueda de trabajo de TCS BigData, consulte

¡Ellos son buenos! Todavía ahí, creciendo