112年國家安全情報人員三等資料庫應用
四、資料倉儲的概念 (Data Warehousing) 是由資料倉儲之父 Bill Inmon 所提出的,他對資料倉儲 (Data Warehouse) 的定義為何?在此定義中,資料倉儲具有那四個特徵?請分別說明這四個特徵。(30分) |
答:
(一)主題導向(Subject-oriented)
1.以主題來區分:
一般資料庫的架構大多以業務來區分,例如人事、財務、生產等分屬不同的資料庫,而在資料倉儲中,所收錄組織的資料打破業務分界的藩籬,以主題(subject) 來區分。
2.決策者可以有效率地取得所要的資訊:
如果將某商品視為一個主題,則在此主題下,不但有此商品的名稱、銷售量資料 (原屬於銷售部門的資料庫內容),還有其生產量、生產成本 (原屬生產部門的資料),由於資料在資料倉儲中做有機的整合,所以可以支援一「整體性觀點」的洞察需求,這對於決策者而言,也可以比較快且有效率的方式來取得所要的資訊。
3.選擇性地存入資料:
(1)收錄在資料倉儲中的資料雖是整合原本散佈於各部門的資料,但是並非毫無取捨地將所有資料完全納入資料倉儲中,而是在建立資料倉儲之前就針對企業決策的需要而選擇性地存入。
(2)決定那些主題、那些資料該屬於那些主題、那些主題可以提供何種決策資訊等等,都得事先作詳細的分析與規劃。
(3)例如產品銷售的資料,高層管理者希望以區域的角度來比較不同縣市之間的產品銷售情形;財務會計部門希望以產品的角度來記錄銷售的情形。
(二)整合性(Integrated)
1.由於原始資料是由各個分散的資料庫收錄而來,可能來自不同的單位或者不同的應用系統,資料中使用的單位或者是資料所採用的編碼都要整合為一致。
2.例如資料中使用的單位一律是英制 (或公制),或者資料的性別性別欄位採用的編碼是 M/F (或1/2)。
(三)時間變動性(Time-variant):時間差異性
1.在一般資料庫中通常只反映目前企業組織業務與活動的即時性資料,例如人事資料庫中所記載的公司員工總數,只記載公司目前的員工數,但是在資料倉儲的設計上,其所提供的資訊著重在支援趨勢分析。
2.在資料倉儲中,時間是資訊的一部分,就是資料倉儲中的資料元素中含有時間屬性。
3.例如資料倉儲中的「員工總數」這個資料值即表達過去5-10年之間公司的員工總數,所以資料倉儲中的資料是依照時間序列累積公司各時期的資料而來。因此,在資料倉儲中,可以有不同時間的相同資訊提供給予比較與分析。
(四)不可揮發性(Nonvolatile):不變動性
1.一般資料庫系統中所收錄的資料要反映公司的現況,新資料的存入會取代舊資料,但是資料倉儲中的資料則是要保存公司在每一個時期的「現況」,所以資料一旦存入資料倉儲就被保留,不能因為新資料的加入而被取代或者改變。
2.例如在資料倉儲中,大多為讀取操作,以及新增加資料。
※參考資料:
1.http://lips.lis.ntu.edu.tw/ycchuang/study/othersubject/datawarehouse/dw_intro.htm
2.http://www.hmhsieh.idv.tw/ec/3b/13/EC+homework2.htm
3.https://zh.wikipedia.org/zh-tw/%E8%B3%87%E6%96%99%E5%80%89%E5%84%B2#%E8%B3%87%E6%96%99%E5%80%89%E5%84%B2%E7%9A%84%E7%89%B9%E6%80%A7