Mais qu'est ce que Microsoft fabrique avec Fabric?
Par Decidim Eurl
Il y a quelques semaines, Microsoft annonçait la sortie d’un tout nouveau produit baptisé Fabric. Fabric est une sorte de suite de la data un peu comme Office (365) Online est une suite bureautique : Fabric est une solution as a service (SaaS), Fabric réunit l’ensemble des fonctions utilisées autour de la data dans les solutions Azure : du data lake au data warehouse avec aussi l’analyse temps réel, Fabric inclu Power BI ou l’étend: les utilisateurs self-service ne seront pas dépaysés, ils retrouveront à tous les niveaux les espaces de travail/workspace de celui-ci. Autant dire que c’est un projet extrêmement ambitieux : offrir la capacité de développer une solution Data d’entreprise comme dans Azure mais sans équipes d’infrastructures et de sécurité, comme Power BI offre les modèles Analysis Services tabulaires (ou datasets).
Fabric est tellement ambitieux qu’il est difficile de choisir un ou des sujet(s) particulier(s) à exposer dans cet article. En gros, avec Fabric, vous avez Power bi (qui inclut Azure Analysis Services), Azure Storage Account Gen2, Synapse, Azure Data Factory et Data Activator, le tout as a service prêt à l’emploi. Pour chaque produit il y a des ajouts ou des limites en comparaison des originaux mais globalement les ajouts sont considérables.
- Exemple de nouveauté : le stockage sous-jacent de la donnée est dans un format qui n’est plus propriétaire, donc ouvert, le fameux delta-parquet (même le moteur Transact SQL a été réécrit dans ce sens).
- Autre exemple, tous les stockages de données sont dans un data lake unique d’entreprise ou précisément unique par tenant Azure : le fameux OneLake alias le OneDrive de la data… Et ce OneLake posséde un zonage définit par les espaces de travail/workspaces bien connus des utilisateurs power bi. Judicieusement divers mécanismes permettent la communication ou le partage de la data d’une zone à l’autre.
- Encore un exemple, un petit détail mais qui aide beaucoup les espaces de travail/workspaces power bi peuvent être regroupés via une notion nouvelle : le domaine.
- Dernier exemple : une requête SQL dans le warehouse peut joindre une table du lake situé dans le même workspace.
- Exemple de ‘régression’ (à l’heure H. Je ne crois pas qu’il faille espérer une correction à ce sujet) : Azure Data Factory est allégé et ne permet pas de faire tourner des bons vieux paquets SSIS.
- Autre exemple : revers de la médaille de la réécriture du moteur Transact SQL, certaines commandes ne sont pas disponibles à l’heure actuelle, c’est le cas par exemple du MERGE.
Bien sûr, les services historiques d’Azure sont conservés et ne sont pas impactés.
On se pose forcément plein de questions :
- A quel usage Fabric est-il destiné ? Self-Service, Team, Corporate ? A tous à la fois ? L’architecture proposée permet d’implémenter comme avec Power BI l’ensemble des scénarios jusqu’au Data Mesh.
- Combien ça coûte ? Combien ça va couter ? Le compute est facturé par capacité sur le modèle de Power BI auquel il faudra ajouter le stockage de la data et les coûts de transfert de la data. Il faudrait s’essayer à faire une sorte de calcul comparatif (avec de nombreuses hypothèses) mais il est probable que la facture soit moins élevée que celle la solution Azure Services + architecte réseau + architecte sécurité et autres experts Azure…
- Qui va se lancer dans Fabric ? Pour une PME c’est la solution idéale. Pour un grand compte, prend-on un risque à plonger dans le OneLake et autres services de Fabric ? Il est difficile d’apporter une réponse. Power BI apportait une fonctionnalité, reporting dynamique, qui n’existait pas dans l’écosystème Microsoft, mais là Fabric propose des services déjà existants et parfois déjà implémentés dans Azure. En même temps beaucoup ont déjà Power BI. Les grands comptes devraient démarrer par des solutions hybrides grâce à la grande ouverture de Fabric, par exemple en permettant aux usagers « self-service » d’utiliser One Lake et donc de stocker leurs données dans le lac, mais aussi d’accéder aux données corporate déjà existantes.
- Un service comme Fabric, c’est un monstre protéiforme : il englobe tellement de sous services, donc de couches complexes sous-jacentes et cachées : sécurité, resources, clusters, sauvegardes, firewalls… Est-ce que cela va fonctionner ??
Il est impossible d’ignorer Fabric. Fabric est un peu le rêve de l’expert(e) Data, de l’ingénieur Data, Business Intelligence ou de la data scientist voire encore du data stewart: la possibilité de travailler autour de la données sans recourir à des experts IT.