DATA WAREHOUSING
AND
ONLINE ANALYTICAL PROCESSING (OLAP)
Overview
Data Warehouse dan OLAP merupakan elemen penting yang mendukung decision support. Terutama bagi perusahaan – perusahaan besar dengan database yang kompleks.
- Data Warehouse membantu para pekerja teknologi (manager,executive,analyst) untuk pengambilan keputusan yang lebih cepat dan mudah.
- DATA WAREHOUSE
- Definisi
- Datawarehouse : Merupakan kumpulan data dari berbagai resource, yang disimpan dalam suatu gudang data (repository )dalam kapasitas besar.
- Data warehouse memungkinkan user untuk memeriksa history data dan melakukan analisis terhadap data sehingga dapat mengambil keputusan berdasarkan analisa yang dibuat.
Manfaat Data Warehouse
- Kemampuan mengakses data yang berskala perusahaan.
- Kemampuan memiliki data yang konsisten.
- Dapat melakukan analisis secara cepat.
- Dapat digunakan untuk mencari redundansi usaha di perusahaan.
- Menemukan gap antara pengetahuan bisnis dengan proses bisnis.
- Meminimalkan biaya administrasi.
- Meningkatkan kinerja pegawai perusahaan untuk dapat melakukan tugasnya dengan lebih efektif.
- Karakteristik Data Warehouse
- Subject Oriented : Data warehouse berfokus pada entitas – entitas bisnis level tinggi.
- Integrated : Data disimpan dalam format yang konsisten (dalam konvensi penamaan, constraint domain, atribut fisik dan pengukuran)
- Time variant : Data diasosiasikan dengan suatu titik waktu.
- Non-volatile : Data yang berasal dari banyak resource terbebut tidak dapat diubah karena bersifat read only.
Arsitektur Data Warehouse
Desain Data Warehouse (1)
- Mendefinisikan arsitektur, perencanaan kapasitas, memilih server storage, server OLAP dan database, dan toolsnya.
- Mengintegrasikan server, storage dan client tools.
- Mendesain skema warehouse dan views
- Menentukan pengaturan physical database, data placement, pemartisian, metode pengaksesan
- Desain Data Warehouse (2)
- Mengkoneksikan source menggunakan gateway, ODBC driver, atau yg lainnya
- Mendesain dan mengimplementasikan script untuk extraksi data, cleaning, transformasi, load dan refresh
- Menggabungkan repository dengan definisi skema dan view, script dan metadata lainnya
- Mendisain dan mengimplementasikan aplikasi end user
- Membuat data warehouse dan aplikasinya
- Transformasi Data Menjadi Informasi
- Perbedaan Data Warehouse dan View
- Data warehouse merupakan penyimpanan yang stabil
- Data warehouse tidak selalu relational, tetapi bisa juga multidimensional. Sedangkan view merupakan relational database
- Data warehouse dapat diindex untuk mengoptimalkan performance, sedangkan view tidak dapat diindex secara independent
- Karakteristik data warehouse mendukung spesifikasi dari funcionalitinya, sedangkan view tidak
- Data warehouse menyediakan integrasi dan temporal data dalam jumlah yang besar umumya lebih dari satu database dimana view merupakan extraksi dari sebuah database
- Pemodelan Data
- Skema tabel yang sering digunakan adalah skema bintang (star schema), yang digunakan pada OLAP
- Skema tabel ini membentuk struktur informasi multidimensi yang kompatibel dengan kebutuhan bisnis.
- Star Schema
- Karakteristik Star Schema
- Pusat skema bintang adalah fact table.
- Fact table berisi indikator – indikator kinerja pokok.
- Tabel di sekeliling fact table adalah dimension table
- Tiap dimension table di-relasikan fact table berdasarkan primary key-nya
- Skema bintang diimplementasikan menggunakan teknologi relational database.
- OLAP
- Definisi
- OLAP : Sistem yang bertugas mengubah data yang disimpan dalam data warehouse dan mentransformasikan data menjadi struktur multidimensi (cube).
- OLTP vs OLAP
- OLAP Server
- Relational OLAP : RDBMS perluasan yang melakukan pemetaan operasi data multidimensi menjadi operasi relasional standar.
- Multidimensional OLAP : Server yang secara langsung mengimplementasikan data dan operasi multidimensi.
- Hybrid OLAP : Memberi kebebasan pada user / administrator untuk
memilih partisi yang berbeda.
- Multidimensional Data Model (1)
- Terdiri atas sekumpulan dimensi (independent variable) dan ukuran / nilai numerik (dependent variable)
- Untuk semua record pada tiap dimensi, mempunyai nilai atribut yang sesuai dengan nilai cell pada dimensi tersebut.
- Contoh : dimensi à
Product (pid), Location (locid), Time (timeid)nilai à
Sales
- Multidimensional Data Model (2)
- Multidimensional Data Model (3)
- Untuk setiap dimensi, penentuan nilai dilakukan berdasarkan konsep hirarki.
PRODUCT TIME LOCATION
- year
- quarter
- country
- Category
- week
- month
- state
- Pname
- date
- city
- Tipe Penelusuran Data (OLAP Query)
- Roll-up : Menampilkan data yang semakin meningkat ke level agregasinya, misalnya untuk mengetahui total penjualan di tiap kota dapat melalui informasi total penjualan di tiap negara.
- Drill-down : Menampilkan rincian – rincian melalui query. Kita melakukan drill-down terhadap hirarki suatu tabel dimensi atau lebih, misalnya melihat ringkasan bulanan, mingguan, dst.
- Pivot : pembentukan cross tabulation
- Slice and dice : Persamaan dan
pembuatan range selection pada satu
atau banyak dimensi.
Tidak ada komentar:
Posting Komentar