Si te preguntas qué es Microsoft Fabric debes saber que es una plataforma desplegada como servicio (SaaS) que ofrece una solución todo en uno abarcando desde el movimiento de datos hasta la ciencia de datos, la inteligencia empresarial y el análisis en tiempo real. Es un completo conjunto de servicios que además añade un lago de datos, ingeniería y transformación de datos. Todo lo tendrás desde un único lugar.
Componentes de Fabric
¿Qué puedo crear en cada componente?
Data Factory
Te permite una integración de datos sencilla para ingerir, preparar y transformar datos de un amplio conjunto de orígenes de datos con más de 200 conectores listos para usar y sin mantenimiento alguno. Desde la página inicial puedes:
- Flujo de datos Gen2: prepara, limpia y transforma los datos de tus orígenes de datos gracias a sus más de 300 transformaciones disponibles en el diseñador de flujos de datos ¡spoiler! funciona con Power Query.
- Canalización de datos: ingiere datos a escala y programe flujos de trabajo de datos con posibilidad de toma de decisiones en función del resultado de la ejecución.
Synapse Data Engineering
Permite recopilar, almacenar, procesar y analizar grandes volúmenes de datos mediante diversas funcionalidades de ingeniería de datos para asegurarse de que los datos sean fácilmente accesibles, de alta calidad y estén bien organizados. Desde la página inicial tienes las siguientes opciones:
- Lakehouse: crear y administrar los datos mediante un almacén de lago.
- Bloc de notas: usar cuadernos para escribir código para la ingesta, preparación y transformación de datos. Puedes escribir y ejecutar código en varios lenguajes de programación, como Python, R y Scala.
- Entorno: configura bibliotecas compartidas, configuración de proceso de Spark y recursos para cuadernos y definiciones de trabajos de Spark.
- Definición de trabajo de Spark: define, programa y administra tus trabajos de Apache Spark para el procesamiento de macrodatos.
- Canalización de datos: diseña canalizaciones para copiar datos en el almacén de lago (recopila, procesa y transforma datos de un forma sin procesar a un formato que se pueda usar para el análisis y la toma de decisiones)
- Importar bloc de notas: importar cuadernos ya existentes.
- Usar una muestra: permite usar muestras que a día de hoy (01/12/2023) se limita a un lakehouse de días festivos y a un bloc de notas de kit de iniciación.
Synapse Data Science
Te permite crear, implementar y poner en marcha modelos de aprendizaje automático. Se integra con Azure Machine Learning para proporcionar un registro de modelos y seguimiento de experimentos integrado. Desde la página inicial tienes las siguientes opciones:
- Modelos de ML: usa modelos de aprendizaje automático para predecir resultados y detectar anomalías en los datos.
- Experimento: crea, ejecuta y realiza un seguimiento del desarrollo de varios modelos para validar hipótesis.
- Bloc de notas: explora los datos y crea soluciones de aprendizaje automático con aplicaciones Apache Spark.
- Entorno: configura bibliotecas compartidas, configuración de proceso de Spark y recursos para cuadernos y definiciones de trabajos de Spark.
- Importar bloc de notas: importa archivos de código fuente del bloc de notas desde la máquina local y crea elementos del bloc de notas en el área de trabajo.
- Usar una muestra: permite usar muestras.
Synapse Real Time Analytics
Recopila datos para su observación desde diversos orígenes, como aplicaciones, dispositivos IoT, interacciones humanas y mucho más. Los datos suelen estar semiestructurados en formatos como JSON o texto. Suele incluir un gran volumen de datos. Desde la página inicial tienes las siguientes opciones:
- Base de datos KQL: carga rápidamente datos estructurados, no estructurados y de transmisión para realizar consultas.
- Conjunto de consultas KQL: ejecuta consultas en tus datos para producir tablas y objetos visuales compartibles.
- Eventstream: captura, transforma y enruta el flujo de eventos en tiempo real a varios destinos en el formato deseado sin necesidad de código.
- Usar una muestra: permite usar muestras.
Power BI
Accede a todos los datos de Fabric de forma rápida e intuitiva para tomar mejores decisiones con los datos. Power BI es una colección de servicios de software, aplicaciones y conectores que funcionan conjuntamente para convertir orígenes de datos sin relación entre sí en información coherente, interactiva y atractiva visualmente. Power BI consta de cinco elementos principales:
- Aplicación de escritorio de Windows llamada Power BI Desktop.
- Servicio de software como servicio (SaaS) en línea denominado servicio Power BI.
- Aplicaciones para Power BI Mobile para dispositivos Windows, iOS y Android.
- Power BI Report Builder, para crear informes paginados y compartirlos en el servicio Power BI.
- Power BI Report Server, un servidor de informes local en el que puede publicar los informes de Power BI, después de crearlos en Power BI Desktop.
Desde la página inicial del servicio puedes empezar a crear informes:
Data Activator
Supervisa los datos para desencadenar alertas y acciones automatizadas para que la organización se adapte a las condiciones cambiantes en tiempo real. Desde la página inicial tienes las siguientes opciones:
- Reflejo: supervisa los conjuntos de datos, las consultas y los flujos de eventos en busca de patrones para desencadenar acciones y alertas.
- Ejemplo de reflejo: permite abrir un ejemplo de reflejo.
One Lake
En este otro artículo hablo más extendido sobre OneLake aunque a forma de resumen podemos definir OneLake como un lago de datos que es la base en la que se crean todos los servicios de Fabric. Microsoft Fabric Lake también se conoce como OneLake que se basa en Azure Data Lake Storage (ADLS) Gen2. Está integrado en el servicio Fabric y proporciona una ubicación unificada para almacenar todos los datos de la organización en los que funcionan las experiencias. Cada inquilino de cliente tiene exactamente una instancia de OneLake. Nunca puede haber más de una y si tienes Fabric, nunca puede haber cero. Cada inquilino de Fabric aprovisiona automáticamente OneLake, sin recursos adicionales para configurar o administrar.
Dentro de un inquilino, puedes crear cualquier número de áreas de trabajo. Las áreas de trabajo permiten que diferentes partes de la organización distribuyan las directivas de propiedad y acceso. Cada área de trabajo forma parte de una capacidad asociada a una región específica y se factura por separado.