¿Qué es un lago de datos?

Un lago de datos es un depósito donde se incorporan datos en su forma original sin alteraciones. Es más útil cuando forma parte de una plataforma de gestión de datos más grande y se integra bien con los datos y las herramientas existentes para brindar análisis más potentes. El objetivo es descubrir información y tendencias siendo, a la vez, seguro, escalable y flexible.

Explicación del lago de datos

Un lago de datos se usa para mantener una gran cantidad de datos en su formato nativo y en bruto en una ubicación central, por lo general en la nube. Al aprovechar el almacenamiento de objetos asequible, los formatos abiertos y la escalabilidad de la nube, gran variedad de aplicaciones pueden beneficiarse con la riqueza de datos contenida en un lago de datos.
  • Se puede almacenar todo tipo de datos cualitativos, como los no estructurados (por lo general denominados big data) y los semiestructurados, lo que es fundamental para los casos de uso actuales de aprendizaje automático y análisis avanzados.
  • En el espacio de redes, piensa en infraestructura y telemetría de terminal usadas como descriptores o clasificadores que alimentan los modelos y algoritmos de IA/AA para identificar puntos de referencia y anomalías.
  • Como consumidor, tus clientes de infraestructura y terminales alimentan el lago de datos y tu proveedor de red lo mantiene para ofrecer herramientas basadas en IA que ayudan a la TI a operar tu red de manera más eficiente.
Data Lakes Explained

¿Qué se almacena en un lago de datos?

Un lago de datos en el espacio de red está compuesto de telemetría de red (infraestructura y terminales) de cada cliente que usa una solución de gestión de nube de un proveedor. El proveedor es responsable de gestionar y proteger el lago de datos y de crear herramientas dirigidas al cliente. Los clientes y la TI no tienen que realizar tareas especiales relacionadas con el lago de datos. La infraestructura de red administrada en la nube está diseñada para enviar los datos relacionados con la administración a la nube, de manera que fue una progresión sencilla extraer telemetría para marcar la referencia de rendimiento y las desviaciones de una red.

Los requisitos del lago de datos incluyen:

  • Muchos datos; de hecho, para el aprendizaje automático la variedad es clave. No es necesario un lago de datos para un solo conjunto de datos.
  • Marco de aprendizaje automático: esto incluye bibliotecas, ciencia de datos y otras herramientas que utilizan los proveedores de redes para llevar a cabo los diferentes tipos de análisis, desde desviación hasta análisis causales y predicción de resultados.

Ventajas del lago de datos

Las ventajas del lago de datos para el cliente son:

  • Puntos de referencia dinámicos para el rendimiento de red de su sitio sin establecer SLE manualmente.
  • Comparaciones que destacan dónde sitios similares encuentran problemas según sus propios datos.
  • Consejos de optimización basados en datos de rendimiento del comportamiento del sitio de un cliente similar.
  • Reentrenamiento continuo de IA/AA conforme surgen nuevas tecnologías, infraestructura y terminales.

¿En qué se diferencian los lagos de datos en la nube con respecto a los locales?

Atributo del lago de datosNubeLocal
Seguridad de datosConocimiento experto / mejores prácticas del proveedor de nubeEspacio de aire y configuración manual
MemoriaBajo pedidoRequiere más aparatos
CPUBajo pedidoRequiere más aparatos
AlmacenamientoBajo pedidoRequiere más aparatos
Recomendaciones de configuraciónAdmite conocimientos de varios sitios de múltiples inquilinosLimitado a los datos / configuración de un cliente
Comparaciones entre pares de referenciaDisponible para cada sitio de cliente y sitios “pares” similaresLimitado a datos / sitios de un cliente
Reentrenamiento y uso de modelos de AIOpsUtilizable de manera automática e instantánea con GUI gestionada en la nubeRequiere actualizaciones manuales de software para gestión de GUI

¿Estás listo para empezar?