首頁技術文章正文

什么是數(shù)據(jù)倉庫?Hive數(shù)據(jù)倉庫特點簡介

更新時間:2020-12-07 來源:黑馬程序員 瀏覽量:

  數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化的,但信息本身相對穩(wěn)定的數(shù)據(jù)集合,它用于支持企業(yè)或組織的決策分析處理,這里對數(shù)據(jù)倉庫的定義,指出了數(shù)據(jù)倉庫的四個特點:

  數(shù)據(jù)倉庫是面向主題的

  操作型數(shù)據(jù)庫的數(shù)據(jù)組織是面向事務處理任務,而數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織,這里說的“主題”是一個抽象的概念,它指的是用戶使用數(shù)據(jù)倉庫進行決策時關心的重點方面,一個主題通常與多個操作型信息系統(tǒng)相關。例如,商品的推薦系統(tǒng)就是基于數(shù)據(jù)倉庫設計的,商品的信息就是數(shù)據(jù)倉庫所面向的主題。

  數(shù)據(jù)倉庫是隨時間變化的

  數(shù)據(jù)倉庫是不同時間的數(shù)據(jù)集合,它所擁有的信息并不只是反映企業(yè)當前的運營狀態(tài),而是記錄了從過去某一時間點到當前各個階段的信息。可以這么說,數(shù)據(jù)倉庫中的數(shù)據(jù)保存時限要能滿足進行決策分析的需要(例如:過去的5-10年),而且數(shù)據(jù)倉庫中的數(shù)據(jù)都要標明該數(shù)據(jù)的歷史時期。

  數(shù)據(jù)倉庫相對穩(wěn)定

  數(shù)據(jù)倉庫是不可更新的。因為數(shù)據(jù)倉庫主要目的是為決策分析提供數(shù)據(jù),所涉及的操作主要是數(shù)據(jù)的查詢,一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,修改和刪除操作很少,通常只需要定期的加載、刷新來更新數(shù)據(jù)。

  多學一招:OLTP和OLAP

  數(shù)據(jù)處理大致可以分為兩類,分別是聯(lián)機事務處理OLTP和聯(lián)機分析處理OLAP,其中:

  (1) OLTP是傳統(tǒng)關系型數(shù)據(jù)庫的主要應用,主要針對的是基本的日常事務處理,例如,銀行轉(zhuǎn)賬。

  (2) OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果,例如,商品的推薦系統(tǒng)。

  接下來,通過一張表來比較OLTP和OLAP,具體如表1所示。

  表1 OLTP和OLAP的對比
1607322367849_20201202171534742.png



猜你喜歡:

Sqoop是什么?Sqoop發(fā)展歷程簡介

MapReduce程序如何設置本地運行模式?

黑馬程序員大數(shù)據(jù)培訓課程 

分享到:
在線咨詢 我要報名
和我們在線交談!