Qu’est-ce qu’un lac de données ?

Un lac de données est un référentiel où les données sont ingérées sous leur format d’origine, sans aucune modification. Cette méthode de stockage est particulièrement utile lorsqu’elle fait partie d’une plus grande plateforme de gestion des données et est intégrée à des données et outils existants pour une analyse encore plus puissante. Le but est de découvrir des informations et des tendances tout en préservant la sécurité, l’évolutivité et la flexibilité.

Qu’est-ce qu’un lac de données ?

Un lac de données permet de stocker dans un emplacement centralisé, généralement le cloud, une grande quantité de données dans leur format brut, natif. Tirant parti d’un stockage d’objets peu coûteux, de formats ouverts et de l’évolutivité cloud, un large éventail d’applications peuvent profiter de la richesse des données stockées dans un lac de données.
  • Peuvent y figurer n’importe quel type de données qualitatives comme les données non structurées, souvent appelées « Big Data » et les données semi-structurées — un atout essentiel pour les cas d’utilisation actuels du machine learning et de l’analytique avancée.
  • Dans l’espace réseau, la télémétrie des infrastructures et des points de terminaison peut se concevoir comme des descripteurs et des classificateurs venant alimenter les modèles et les algorithmes d’IA/de ML permettant d’identifier les données de base et les anomalies.
  • En tant que client, votre infrastructure et vos clients de points de terminaison alimentent le lac de données. Votre fournisseur de réseau le maintient de façon à fournir des outils IA qui aident l’IT à exploiter votre réseau plus efficacement.
Data Lakes Explained

Que contient un lac de données ?

Dans l’espace d’un réseau, un lac de données est constitué de la télémétrie du réseau (infrastructure et terminaux) de chaque client qui utilise la solution de gestion cloud d’un fournisseur. Le fournisseur est responsable de la gestion et de la sécurisation du lac de données, ainsi que de la création d’outils orientés client. Les clients et le service informatique ne sont pas obligés d’effectuer des tâches spécifiques dans le lac de données. L’infrastructure de réseau gérée dans le cloud est conçue pour transmettre les données relatives à la gestion vers le cloud. Il est ainsi facile d’extraire les données de télémétrie afin de fournir une base de référence pour mesurer les performances et les écarts d’un réseau.

Un lac de données exige :

  • Beaucoup de données – La diversité est essentielle en machine learning. Un lac de données est inutile si vous n’avez qu’un seul ensemble de données.
  • Une structure de machine learning – Ceci inclut des bibliothèques, une science des données et les autres outils utilisés par les fournisseurs réseau pour exécuter différents types d’analyse, allant de l’analyse des écarts et des causes à la prédiction des résultats.

Avantages d’un lac de données

Un lac de données offre au client les avantages suivants :

  • Des bases de référence dynamiques pour les performances réseau de son site, sans avoir à définir manuellement les attentes de niveau de service (SLE).
  • Des comparatifs qui indiquent où des sites similaires ont rencontré des problèmes sur la base de leurs propres données.
  • Conseils d’optimisation fondés sur les données de performance du comportement d’un site client similaire.
  • Réentraînement continu de l’IA/du ML à mesure qu’émergent des technologies et des infrastructures nouvelles et de nouveaux points de terminaison.

Quelle est la différence entre des lacs de données cloud et des lacs de données sur site ?

Attribut du lac de donnéesCloudSur site
Sécurité des donnéesExpertise/ meilleures pratiques du fournisseur cloudIsolement d’un ordinateur (Air gapping) et configuration manuelle
MémoireÀ la demandeNécessite davantage d’appliances
ProcesseurÀ la demandeNécessite davantage d’appliances
StockageÀ la demandeNécessite davantage d’appliances
Recommandations de configurationPermet de recueillir de précieuses informations sur plusieurs sites mutualisésDonnées / Configuration d’un client seulement
Comparaisons de données de base semblablesDisponible pour chaque site client et pour les sites similairesDonnées / sites d’un client seulement
Réentraînement et utilisation de modèles AIOpsAutomatiques et utilisables instantanément via une interface graphique cloudNécessitent des mises à niveau logicielles manuelles vers une interface graphique de gestion

Prêts à vous lancer ?