MS Azure se puede usar en la tubería de ciencia de datos de varias maneras diferentes. La opción obvia es utilizar AzureML. Con AzureML, un científico de datos puede usar su navegador y crear experimentos complejos de aprendizaje automático sin escribir una sola línea de código (simplemente arrastre y suelte diferentes módulos en el lienzo del experimento). Es una forma visual de diseñar y ejecutar algoritmos de aprendizaje. También puede usar R, Python y SQL para realizar modificaciones de datos e ingeniería de características.
Recientemente, el cuaderno Jupiter (anteriormente conocido como IPython) se ha agregado a AzureML (mi favorito). Por lo tanto, puede agregar fácilmente su conjunto de datos y escribir código Python en un cuaderno y obtener la misma sensación de Anaconda con la elasticidad de Cload.
El plan de Microsoft es admitir más idiomas de esta manera, como R y Julia.
Con AzureML, la transición del diseño y la prueba a la producción es muy fácil. En realidad, solo necesita dos clics (para el diseñador visual) o unas pocas líneas de código para convertir su modelo en un servicio web totalmente funcional.
Si necesita trabajar con Hadoop, Azure proporciona Hdinsight, que es la distribución de HadoonWorks de Hadoop. Incluye Hive, MapReduce, Spark y …
Para el almacenamiento de datos, Azure proporciona AzureSQL (base de datos relacional), DocumentDB (base de datos de documentos), AzureTable (almacén de valores clave) y AzureBlob (almacén de blobs) además de HDFS.
- ¿Qué debo hacer para prepararme para ser un científico de datos?
- ¿Cuál es la forma más fácil de recibir alertas cuando alguien cambia un esquema de base de datos?
- ¿Cómo puede una persona con un doctorado no técnico y con algún conocimiento independiente de R obtener un trabajo de ciencia de datos?
- Cómo realizar prácticas como científico de datos en startups
- ¿Cuáles son los mejores programas de maestría en ciencias de datos?
Por cierto, Azure incluye eventHub y streamAnalytics para la transmisión de datos (puede considerarlo como un motor de procesamiento de eventos complejo).
En resumen, hay varias opciones para los científicos de datos en Azure y algunas de ellas se superponen en la funcionalidad.
Por cierto, todas las herramientas y tecnologías mencionadas se pueden integrar con Excel y PowerBI.