Selasa, 16 Juni 2009

Data WareHousing and Online Analytical Processing (OLAP)

DATA WAREHOUSING
AND
ONLINE ANALYTICAL PROCESSING (OLAP)

Overview

Data Warehouse dan OLAP merupakan elemen penting yang mendukung decision support. Terutama bagi perusahaan – perusahaan besar dengan database yang kompleks.


 

  • Data Warehouse membantu para pekerja teknologi (manager,executive,analyst) untuk pengambilan keputusan yang lebih cepat dan mudah.
  • DATA WAREHOUSE
  • Definisi
  • Datawarehouse : Merupakan kumpulan data dari berbagai resource, yang disimpan dalam suatu gudang data (repository )dalam kapasitas besar.
  • Data warehouse memungkinkan user untuk memeriksa history data dan melakukan analisis terhadap data sehingga dapat mengambil keputusan berdasarkan analisa yang dibuat.


     

Manfaat Data Warehouse

  • Kemampuan mengakses data yang berskala perusahaan.
  • Kemampuan memiliki data yang konsisten.
  • Dapat melakukan analisis secara cepat.
  • Dapat digunakan untuk mencari redundansi usaha di perusahaan.
  • Menemukan gap antara pengetahuan bisnis dengan proses bisnis.
  • Meminimalkan biaya administrasi.
  • Meningkatkan kinerja pegawai perusahaan untuk dapat melakukan tugasnya dengan lebih efektif.
  • Karakteristik Data Warehouse    
  • Subject Oriented : Data warehouse berfokus pada entitas – entitas bisnis level tinggi.
  • Integrated : Data disimpan dalam format yang konsisten (dalam konvensi penamaan, constraint domain, atribut fisik dan pengukuran)
  • Time variant : Data diasosiasikan dengan suatu titik waktu.
  • Non-volatile : Data yang berasal dari banyak resource terbebut tidak dapat diubah karena bersifat read only.


     

Arsitektur Data Warehouse

 Desain Data Warehouse (1)
 

    • Mendefinisikan arsitektur, perencanaan kapasitas, memilih server storage, server OLAP dan database, dan toolsnya.
    • Mengintegrasikan server, storage dan client tools.
    • Mendesain skema warehouse dan views
    • Menentukan pengaturan physical database, data placement, pemartisian, metode pengaksesan


       

                  

  • Desain Data Warehouse (2)
    • Mengkoneksikan source menggunakan gateway, ODBC driver, atau yg lainnya
    • Mendesain dan mengimplementasikan script untuk extraksi data, cleaning, transformasi, load dan refresh
    • Menggabungkan repository dengan definisi skema dan view, script dan metadata lainnya
    • Mendisain dan mengimplementasikan aplikasi end user
    • Membuat data warehouse dan aplikasinya
  • Transformasi Data Menjadi Informasi
  • Perbedaan Data Warehouse dan View
  • Data warehouse merupakan penyimpanan yang stabil
  • Data warehouse tidak selalu relational, tetapi bisa juga multidimensional. Sedangkan view merupakan relational database
  • Data warehouse dapat diindex untuk mengoptimalkan performance, sedangkan view tidak dapat diindex secara independent
  • Karakteristik data warehouse mendukung spesifikasi dari funcionalitinya, sedangkan view tidak
  • Data warehouse menyediakan integrasi dan temporal data dalam jumlah yang besar umumya lebih dari satu database dimana view merupakan extraksi dari sebuah database
  • Pemodelan Data
  • Skema tabel yang sering digunakan adalah skema bintang (star schema), yang digunakan pada OLAP


     

  • Skema tabel ini membentuk struktur informasi multidimensi yang kompatibel dengan kebutuhan bisnis.
  • Star Schema
  • Karakteristik Star Schema
  • Pusat skema bintang adalah fact table.
  • Fact table berisi indikator – indikator kinerja pokok.
  • Tabel di sekeliling fact table adalah dimension table
  • Tiap dimension table di-relasikan fact table berdasarkan primary key-nya
  • Skema bintang diimplementasikan menggunakan teknologi relational database.


     

  • OLAP
  • Definisi
  • OLAP : Sistem yang bertugas mengubah data yang disimpan dalam data warehouse dan mentransformasikan data menjadi struktur multidimensi (cube).
  • OLTP vs OLAP
  • OLAP Server
  • Relational OLAP : RDBMS perluasan yang melakukan pemetaan operasi data multidimensi menjadi operasi relasional standar.
  • Multidimensional OLAP : Server yang secara langsung mengimplementasikan data dan operasi multidimensi.
  • Hybrid OLAP : Memberi kebebasan pada user / administrator untuk
    memilih partisi yang berbeda.
  • Multidimensional Data Model (1)
  • Terdiri atas sekumpulan dimensi (independent variable) dan ukuran / nilai numerik (dependent variable)
  • Untuk semua record pada tiap dimensi, mempunyai nilai atribut yang sesuai dengan nilai cell pada dimensi tersebut.
  • Contoh : dimensi à
    Product (pid),                           Location (locid), Time (timeid)

             nilai à
    Sales

  • Multidimensional Data Model (2)


     

                    

  • Multidimensional Data Model (3)
  • Untuk setiap dimensi, penentuan nilai dilakukan berdasarkan konsep hirarki.


     

        PRODUCT            TIME            LOCATION

  •   year                               
  • quarter         
  •   country  
  •  Category                      
  • week        
  • month    
  • state
  • Pname            
  • date    
  • city
  •         

  • Tipe Penelusuran Data (OLAP Query)
  • Roll-up : Menampilkan data yang semakin meningkat ke level agregasinya, misalnya untuk mengetahui total penjualan di tiap kota dapat melalui informasi total penjualan di tiap negara.
  • Drill-down : Menampilkan rincian – rincian melalui query. Kita melakukan drill-down terhadap hirarki suatu tabel dimensi atau lebih, misalnya melihat ringkasan bulanan, mingguan, dst.
  • Pivot : pembentukan cross tabulation
  • Slice and dice : Persamaan dan

        pembuatan range selection pada satu

        atau banyak dimensi.

        


     

Tidak ada komentar: