¿Cómo transformará Big Data la práctica del desarrollo de software?

Big data cambió el desarrollo de software hace años cuando se trata de aplicaciones, es decir, API basadas en datos (o “aplicaciones sin cabeza”) a las que hoy llaman muchas aplicaciones.

Piensa en lo que hay detrás de las API más populares. Las empresas que donan la mayor cantidad de código y participan más en las comunidades de código abierto de Big Data, muchas de las propiedades web más grandes, como Yahoo, Google, LinkedIn, Twitter, Facebook y Netflix, entre otras, ejecutan entornos basados en grandes datos, y todos ofrecen API populares. Google Analytics se lanzó en 2005, y la API de Google Analytics existe desde 2008. La API Graph de Facebook se introdujo en 2010.

Las API basadas en datos son los principales generadores de ingresos para grandes propiedades web. Forbes en un artículo de enero de 2014 señaló que el 90 por ciento de los ingresos de Expedia se generaron a partir de API. (¿Ver Listo para API? Tres pasos para desbloquear el canal más prometedor de la economía de datos).

Las API son, por supuesto, un habilitador para desarrollos más ágiles, pero hay otros. Estas compañías web son las mismas compañías centrales en el movimiento DevOps / entrega continua. Todos ellos ejecutan entornos muy instrumentados y rutinariamente extraen sus archivos de registro para obtener pistas sobre cómo optimizar sus servicios y liberar código con mayor frecuencia. Centran mucha atención en bucles rápidos de respuesta y respuesta en todas sus organizaciones y ajustan constantemente sus sitios y otros servicios. Los proveedores como Splunk y Sumo Logic que se especializan en análisis de archivos de registro de big data tienen a muchas de estas compañías como clientes. Hicimos un análisis completo de DevOps, antifragilidad y oportunidades de entrega continua en 2013 que está disponible para descargar aquí: DevOps: Resolviendo el desafío de productividad de ingeniería

Quizás lo que está identificando es una brecha de experiencia entre las grandes empresas web y otras empresas. Muchas compañías grandes en otras verticales y desarrolladores independientes no están conectados a los entornos OSS o encuentran herramientas como MapReduce extrañas o piensan que son demasiado riesgosas.

Pero aquellos que ejecutan clústeres Hadoop + NoSQL internamente y personal o nutren los roles correctos ciertamente pueden desarrollar aplicaciones beneficiosas de big data, y herramientas como YARN están haciendo posible desarrollar aplicaciones usando una variedad de idiomas, y muchas plataformas de análisis importantes están incorporando soporte para Hadoop Vea algunos de los mazos de Hortonworks o Cloudera en YARN para obtener más información, como Introducción a las aplicaciones de YARN. Estas compañías ciertamente pueden instrumentar sus propios entornos en línea y extraer los datos, o construir cajas de arena para minar la web pública para obtener información sobre los mercados y cómo se perciben sus marcas en el mercado, y muchas compañías lo han hecho. Una serie de fabricantes de alta tecnología, compañías de transporte, empresas de servicios públicos y energía están muy avanzados en el análisis de big data, si es que aún no lo han hecho. Es posible que todavía no hayan dado el paso de usar big data para impulsar la innovación de software.

Gran parte de la actividad está detrás de escena, y el público en general no lo sabe, pero la información sobre lo que está sucediendo en esta área ciertamente se puede encontrar en la web pública. Si necesita información general sobre las técnicas de big data y las implicaciones comerciales de las tecnologías, en 2010 elaboramos un informe en beneficio de las grandes empresas que querían aprovechar Hadoop y NoSQL: Pronóstico de tecnología: 2010 Número 3

Big Dataingeniería de software