112年國家安全情報人員三等資料庫應用

四、資料倉儲的概念 (Data Warehousing) 是由資料倉儲之父 Bill Inmon 所提出的他對資料倉儲 (Data Warehouse) 的定義為何在此定義中資料倉儲具有那四個特徵請分別說明這四個特徵。(30分)

答:

()主題導向(Subject-oriented)

1.以主題來區分:

  一般資料庫的架構大多以業務來區分,例如人事、財務、生產等分屬不同的資料庫,而在資料倉儲中,所收錄組織的資料打破業務分界的藩籬,以主題(subject) 來區分

2.決策者可以有效率地取得所要的資訊:

  如果將某商品視為一個主題,則在此主題下,不但有此商品的名稱、銷售量資料 (原屬於銷售部門的資料庫內容),還有其生產量生產成本 (原屬生產部門的資料),由於資料資料倉儲中有機整合,所以可以支援一「整體性觀點」的洞察需求,這對於決策者而言,也可以比較快且有效率的方式來取得所要的資訊。

3.選擇性地存入資料:

  (1)收錄在資料倉儲中的資料雖是整合原本散佈各部門資料,但是並非毫無取捨地將所有資料完全納入資料倉儲中,而是在建立資料倉儲之前針對企業決策需要選擇性地存入

  (2)決定那些主題、那些資料該屬於那些主題、那些主題可以提供何種決策資訊等等,都得事先作詳細分析規劃

  (3)例如產品銷售的資料,高層管理者希望以區域的角度來比較不同縣市之間的產品銷售情形;財務會計部門希望以產品的角度來記錄銷售的情形。

()整合性(Integrated)

1.由於原始資料是由各個分散資料庫收錄而來可能來自不同單位或者不同應用系統,資料中使用的單位或者是資料所採用的編碼都要整合為一致。

2.例如資料中使用的單位一律是英制 (或公制),或者資料的性別性別欄位採用的編碼是 M/F (1/2)

()時間變動性(Time-variant):時間差異性

1.在一般資料庫中通常只反映目前企業組織業務與活動的即時性資料,例如人事資料庫中所記載的公司員工總數,只記載公司目前的員工數,但是在資料倉儲的設計上,其所提供的資訊著重在支援趨勢分析

2.在資料倉儲中,時間是資訊的一部分,就是資料倉儲中的資料元素中含有時間屬性。

3.例如資料倉儲中的「員工總數」這個資料值即表達過去5-10年之間公司的員工總數,所以資料倉儲中的資料是依照時間序列累積公司各時期資料而來。因此,在資料倉儲中,可以有不同時間的相同資訊提供給予比較與分析。

()不可揮發性(Nonvolatile):不變動性

1.一般資料庫系統中所收錄的資料要反映公司的現況,新資料的存入會取代舊資料,但是資料倉儲中的資料則是要保存公司每一個時期的「現況」,所以資料一旦存入資料倉儲就被保留,不能因為新資料加入被取代或者改變

2.例如在資料倉儲中,大多讀取操作,以及新增加資料

參考資料:

1.http://lips.lis.ntu.edu.tw/ycchuang/study/othersubject/datawarehouse/dw_intro.htm

2.http://www.hmhsieh.idv.tw/ec/3b/13/EC+homework2.htm

3.https://zh.wikipedia.org/zh-tw/%E8%B3%87%E6%96%99%E5%80%89%E5%84%B2#%E8%B3%87%E6%96%99%E5%80%89%E5%84%B2%E7%9A%84%E7%89%B9%E6%80%A7

 

arrow
arrow

    jacksaleok 發表在 痞客邦 留言(0) 人氣()