O que é um data lake?
Um data lake é um repositório onde os dados são ingeridos em sua forma original sem alteração. É mais útil quando faz parte de uma plataforma de gerenciamento de dados maior e se integra bem aos dados e ferramentas existentes para análises mais poderosas. O objetivo é descobrir insights e tendências sendo seguro, escalável e flexível.
Data lakes explicados
- Todos os tipos de dados qualitativos, incluindo dados não estruturados (geralmente chamados de big data) e semiestruturados, podem ser armazenados, o que é crítico para os casos de uso atuais de machine learning e análises avançadas.
- No espaço de rede, pense na infraestrutura e na telemetria de terminal sendo usadas como descritoras ou classificadoras que alimentam algoritmos e modelos de IA/ML para identificar linhas de base e anomalias.
- Como cliente, seus clientes de infraestrutura e terminal alimentam o data lake, e seu fornecedor de rede o mantém para fornecer ferramentas baseadas em IA que ajudam a TI a operar sua rede com mais eficiência.
O que é armazenado em um data lake?
Um data lake no espaço de rede é composto de telemetria de rede (infraestrutura e terminais) de cada cliente que está usando a solução de gerenciamento de nuvem de um fornecedor. O fornecedor é responsável por gerenciar e proteger o data lake e por criar ferramentas voltadas para o cliente. Os clientes e a TI não precisam executar tarefas especiais relacionadas ao data lake. A infraestrutura de rede gerenciada em nuvem é projetada para encaminhar dados relacionados ao gerenciamento para a nuvem, portanto, foi uma progressão simples extrair a telemetria para basear o desempenho e os desvios de uma rede.
Os requisitos do data lake incluem:
- Muitos dados – Na verdade, para machine learning, a variedade é fundamental. Você não precisa de um data lake para um único conjunto de dados.
- Estrutura de machine learning – Inclui bibliotecas, ciência de dados e outras ferramentas usadas por fornecedores de rede para realizar vários tipos de análise, desde variação a análise causal e previsão de resultados.
Benefícios de um data lake
Os benefícios do data lake para o cliente incluem:
- Linhas de base dinâmicas para o desempenho da rede do local sem configurar SLEs manualmente.
- Comparações que destacam onde locais semelhantes estão tendo problemas com base em seus próprios dados.
- Dicas de otimização com base nos dados de desempenho do comportamento de um local de cliente semelhante.
- Um retreinamento constante de IA/ML à medida que surgem novas tecnologias, infraestrutura e terminais.
Qual a diferença entre os data lakes na nuvem e no local?
Atributo de data lake | Nuvem | No local |
---|---|---|
Segurança de dados | Melhores práticas / experiência do provedor de nuvem | Vedação hermética e configuração manual |
Memória | Sob demanda | Requer mais dispositivos |
CPU | Sob demanda | Requer mais dispositivos |
Armazenamento | Sob demanda | Requer mais dispositivos |
Recomendações de configuração | Permite insights em locais de vários locatários | Limitado à configuração/dados de um cliente |
Comparações de pares de linha de base | Disponível para cada local do cliente e locais semelhantes de “pares” | Limitado aos locais/dados de um cliente |
Retreinamento e uso de modelos AIOps | Automático e utilizável instantaneamente com base na GUI gerenciada na nuvem | Requer atualizações manuais de software para a GUI gerenciada |