何謂資料湖?

資料湖是一種存放庫,其中資料以其原始形式擷取而不會更改。將資料湖納入更大的資料管理平台之中,並與現有資料和工具充分整合以進行更強大的分析時,資料湖將能達到最大的使用效益。資料湖的目標是在發掘洞察力和趨勢的同時,確保安全性、可擴充性和彈性。

資料湖說明

資料湖用於在中央位置 (通常是雲端) 以原生原始格式儲存大量資料。藉由價格實惠的物件儲存、開放格式和雲端可擴充性,各種應用程式將可利用資料湖中包含的豐富資料。
  • 所有類型的質化資料都可以儲存,包括非結構化 (通常稱為大數據) 和半結構化資料,這些資料對於當今的機器學習和進階分析使用案例來說,至關重要。
  • 在網路空間中,可以將基礎架構和端點遙測用作描述項或分類器,為 AI/ML 模型和演算法提供資料以識別基準和異常。
  • 對於客戶來說,您的基礎架構和端點用戶端會為資料湖提供資料,而您的網路廠商則會負責維護工作,以提供採用 AI 技術的工具,協助 IT 更有效地進行網路營運。
Data Lakes Explained

資料湖儲存哪些資料?

網路空間中的資料湖是由每個使用廠商雲端管理解決方案之客戶的網路遙測 (基礎架構和端點) 所組成。廠商負責管理及保護資料湖,並建立客戶適用的工具。客戶和 IT 不必執行與資料湖相關的特殊工作。雲端託管網路基礎架構旨在將管理相關的資料轉送到雲端,因此只是簡單地提取遙測資料以建立網路效能和偏差的基準。

資料湖需求包括:

  • 大量資料 – 事實上,對於機器學習來說,多樣性是重要關鍵。單一資料集並不需要用到資料湖。
  • 機器學習架構 – 這包括程式庫、資料科學,以及為了執行從變異到因果分析和結果預測的各種分析,網路廠商使用的其他工具。

資料湖的優勢

客戶可從資料湖獲得下列優勢:

  • 無需手動設定 SLE,即可為站點的網路效能設定動態基準。
  • 根據自身資料,利用比較凸顯發現問題的類似站點。
  • 根據類似客戶站點行為的效能資料,提供最佳化提示。
  • 隨著新技術、基礎架構和端點興起,持續對 AI/ML 進行再訓練。

雲端與內部部署資料湖有什麼不同?

資料湖屬性雲端內部部署
資料安全性雲端供應商專業知識/最佳做法氣隙和手動配置
記憶體隨需選用需要更多設備
CPU隨需選用需要更多設備
儲存隨需選用需要更多設備
配置建議允許產生跨多個租用戶站點的洞察僅限於一個客戶的資料/配置
基準對等比較適用於每個客戶站點和類似的「對等」站點僅限於一個客戶的資料/站點
AIOps 模型的再訓練和使用從雲端託管型 GUI 自動執行且立即可用需要手動升級管理 GUI 軟體

準備好開始了嗎?