前言:
我們提到 BigQuery 是一種 serverless 的 Data warehouse,本篇想要針對 Databases 和 Data warehouse 做一個比較圖,以及對應的雲端服務有哪些,讓大家有更全面的了解。此外,本文主要是參考 MongoDB的文章做彙整,更詳細的資訊可以參考這裡。
前面有提到 Databases 和 Data warehouses 的關鍵差異是使用情境。
What is database?
資料庫是資料或信息的集合,並用於支持OLTP。而資料庫又可以分為關聯式資料和非關聯式資料庫 (以 key value形式儲存,例如 JSON or BSON)。
What is data warehouse?
資料倉儲則是儲存來自一個或多個系統,用於支持OLAP,並且是高度結構化的資料,以便於後續的分析並獲取洞見。另外 ETL 也是建造 data warehouse 常見的步驟。
- ETL: Extract, Transform, Load
Summary:
Databases 和 Data warehouses 的關鍵差異是使用情境,此外,雖然本次的主題主要是 Google BigQuery,但是 Data warehouses 相關的地端或雲端服務也很多,各位可以依照企業情境,選擇合適的雲端資料倉儲。
Reference:
https://www.mongodb.com/databases/data-lake-vs-data-warehouse-vs-database