Qu’est-ce qu’un lac de données ?
Un lac de données est un référentiel où les données sont ingérées sous leur format d’origine, sans aucune modification. Cette méthode de stockage est particulièrement utile lorsqu’elle fait partie d’une plus grande plateforme de gestion des données et est intégrée à des données et outils existants pour une analyse encore plus puissante. Le but est de découvrir des informations et des tendances tout en préservant la sécurité, l’évolutivité et la flexibilité.
Qu’est-ce qu’un lac de données ?
- Peuvent y figurer n’importe quel type de données qualitatives comme les données non structurées, souvent appelées « Big Data » et les données semi-structurées — un atout essentiel pour les cas d’utilisation actuels du machine learning et de l’analytique avancée.
- Dans l’espace réseau, la télémétrie des infrastructures et des points de terminaison peut se concevoir comme des descripteurs et des classificateurs venant alimenter les modèles et les algorithmes d’IA/de ML permettant d’identifier les données de base et les anomalies.
- En tant que client, votre infrastructure et vos clients de points de terminaison alimentent le lac de données. Votre fournisseur de réseau le maintient de façon à fournir des outils IA qui aident l’IT à exploiter votre réseau plus efficacement.
Que contient un lac de données ?
Dans l’espace d’un réseau, un lac de données est constitué de la télémétrie du réseau (infrastructure et terminaux) de chaque client qui utilise la solution de gestion cloud d’un fournisseur. Le fournisseur est responsable de la gestion et de la sécurisation du lac de données, ainsi que de la création d’outils orientés client. Les clients et le service informatique ne sont pas obligés d’effectuer des tâches spécifiques dans le lac de données. L’infrastructure de réseau gérée dans le cloud est conçue pour transmettre les données relatives à la gestion vers le cloud. Il est ainsi facile d’extraire les données de télémétrie afin de fournir une base de référence pour mesurer les performances et les écarts d’un réseau.
Un lac de données exige :
- Beaucoup de données – La diversité est essentielle en machine learning. Un lac de données est inutile si vous n’avez qu’un seul ensemble de données.
- Une structure de machine learning – Ceci inclut des bibliothèques, une science des données et les autres outils utilisés par les fournisseurs réseau pour exécuter différents types d’analyse, allant de l’analyse des écarts et des causes à la prédiction des résultats.
Avantages d’un lac de données
Un lac de données offre au client les avantages suivants :
- Des bases de référence dynamiques pour les performances réseau de son site, sans avoir à définir manuellement les attentes de niveau de service (SLE).
- Des comparatifs qui indiquent où des sites similaires ont rencontré des problèmes sur la base de leurs propres données.
- Conseils d’optimisation fondés sur les données de performance du comportement d’un site client similaire.
- Réentraînement continu de l’IA/du ML à mesure qu’émergent des technologies et des infrastructures nouvelles et de nouveaux points de terminaison.
Quelle est la différence entre des lacs de données cloud et des lacs de données sur site ?
Attribut du lac de données | Cloud | Sur site |
---|---|---|
Sécurité des données | Expertise/ meilleures pratiques du fournisseur cloud | Isolement d’un ordinateur (Air gapping) et configuration manuelle |
Mémoire | À la demande | Nécessite davantage d’appliances |
Processeur | À la demande | Nécessite davantage d’appliances |
Stockage | À la demande | Nécessite davantage d’appliances |
Recommandations de configuration | Permet de recueillir de précieuses informations sur plusieurs sites mutualisés | Données / Configuration d’un client seulement |
Comparaisons de données de base semblables | Disponible pour chaque site client et pour les sites similaires | Données / sites d’un client seulement |
Réentraînement et utilisation de modèles AIOps | Automatiques et utilisables instantanément via une interface graphique cloud | Nécessitent des mises à niveau logicielles manuelles vers une interface graphique de gestion |