O que é um data lake?

Um data lake é um repositório onde os dados são ingeridos em sua forma original sem alteração. É mais útil quando faz parte de uma plataforma de gerenciamento de dados maior e se integra bem aos dados e ferramentas existentes para análises mais poderosas. O objetivo é descobrir insights e tendências sendo seguro, escalável e flexível.

Data lakes explicados

Um data lake é usado para armazenar uma grande quantidade de dados em seu formato bruto nativo em um local central – normalmente a nuvem. Aproveitando o armazenamento de objetos de baixo custo, formatos abertos e capacidade de expansão na nuvem, uma variedade de aplicativos pode aproveitar a riqueza de dados contidos em um data lake.
  • Todos os tipos de dados qualitativos, incluindo dados não estruturados (geralmente chamados de big data) e semiestruturados, podem ser armazenados, o que é crítico para os casos de uso atuais de machine learning e análises avançadas.
  • No espaço de rede, pense na infraestrutura e na telemetria de terminal sendo usadas como descritoras ou classificadoras que alimentam algoritmos e modelos de IA/ML para identificar linhas de base e anomalias.
  • Como cliente, seus clientes de infraestrutura e terminal alimentam o data lake, e seu fornecedor de rede o mantém para fornecer ferramentas baseadas em IA que ajudam a TI a operar sua rede com mais eficiência.
Data Lakes Explained

O que é armazenado em um data lake?

Um data lake no espaço de rede é composto de telemetria de rede (infraestrutura e terminais) de cada cliente que está usando a solução de gerenciamento de nuvem de um fornecedor. O fornecedor é responsável por gerenciar e proteger o data lake e por criar ferramentas voltadas para o cliente. Os clientes e a TI não precisam executar tarefas especiais relacionadas ao data lake. A infraestrutura de rede gerenciada em nuvem é projetada para encaminhar dados relacionados ao gerenciamento para a nuvem, portanto, foi uma progressão simples extrair a telemetria para basear o desempenho e os desvios de uma rede.

Os requisitos do data lake incluem:

  • Muitos dados – Na verdade, para machine learning, a variedade é fundamental. Você não precisa de um data lake para um único conjunto de dados.
  • Estrutura de machine learning – Inclui bibliotecas, ciência de dados e outras ferramentas usadas por fornecedores de rede para realizar vários tipos de análise, desde variação a análise causal e previsão de resultados.

Benefícios de um data lake

Os benefícios do data lake para o cliente incluem:

  • Linhas de base dinâmicas para o desempenho da rede do local sem configurar SLEs manualmente.
  • Comparações que destacam onde locais semelhantes estão tendo problemas com base em seus próprios dados.
  • Dicas de otimização com base nos dados de desempenho do comportamento de um local de cliente semelhante.
  • Um retreinamento constante de IA/ML à medida que surgem novas tecnologias, infraestrutura e terminais.

Qual a diferença entre os data lakes na nuvem e no local?

Atributo de data lakeNuvemNo local
Segurança de dadosMelhores práticas / experiência do provedor de nuvemVedação hermética e configuração manual
MemóriaSob demandaRequer mais dispositivos
CPUSob demandaRequer mais dispositivos
ArmazenamentoSob demandaRequer mais dispositivos
Recomendações de configuraçãoPermite insights em locais de vários locatáriosLimitado à configuração/dados de um cliente
Comparações de pares de linha de baseDisponível para cada local do cliente e locais semelhantes de “pares”Limitado aos locais/dados de um cliente
Retreinamento e uso de modelos AIOpsAutomático e utilizável instantaneamente com base na GUI gerenciada na nuvemRequer atualizações manuais de software para a GUI gerenciada

Pronto para começar?