Data Mart
Sebuah data mart adalah lapisan akses dari lingkungan data
warehouse yang digunakan untuk mendapatkan data keluar bagi pengguna. Data mart
adalah subset dari data warehouse yang biasanya berorientasi pada lini bisnis
tertentu atau tim. Dalam beberapa penyebaran, masing-masing departemen atau
unit bisnis dianggap sebagai pemilik data mart yang termasuk semua perangkat
lunak, perangkat keras dan data [1] Hal ini memungkinkan masing-masing
departemen untuk menggunakan, memanipulasi dan mengembangkan data mereka dengan
cara apapun yang mereka mau,. Tanpa mengubah informasi dalam data mart lain
atau data warehouse. Dalam penyebaran lain di mana dimensi sesuai digunakan,
kepemilikan unit usaha ini tidak akan terus berlaku untuk dimensi bersama seperti
pelanggan, produk, dll
The spreadmart istilah yang terkait menggambarkan situasi
yang terjadi ketika satu atau lebih analis bisnis mengembangkan sistem
spreadsheet terkait dengan melakukan analisis bisnis, kemudian tumbuh ke ukuran
dan tingkat kompleksitas yang membuatnya hampir mustahil untuk mempertahankan.
Penggunaan utama untuk data mart adalah business
intelligence (BI) aplikasi. BI digunakan untuk mengumpulkan, menyimpan,
mengakses dan menganalisis data. Data mart dapat digunakan oleh usaha kecil untuk
memanfaatkan data yang mereka telah mengumpulkan. Sebuah data mart dapat lebih
murah daripada menerapkan data warehouse, sehingga membuatnya lebih hemat biaya
untuk usaha kecil. Sebuah data mart juga dapat diatur dalam waktu yang jauh
kurang dari data warehouse, mampu dibentuk dalam waktu kurang dari 90 hari.
Karena kebanyakan usaha kecil hanya memiliki penggunaan untuk sejumlah kecil
aplikasi BI, biaya rendah dan cepat set up data mart membuatnya menjadi metode
yang cocok untuk menyimpan data
data warehouse
======
warehouse adalah "Sebuah skema database relasional yang
menyimpan data historis dan metadata dari sistem operasi atau sistem,
sedemikian rupa untuk memudahkan pelaporan dan analisis data, dikumpulkan untuk
berbagai tingkatan." Definisi ini adalah penggabungan dari berbagai
definisi yang saya temui.
Ada beberapa poin penting di sini. Pertama, gudang data
jarang berisi informasi yang ada tidak ada tempat lain dalam suatu organisasi.
Tujuan dari data warehousing adalah untuk mengumpulkan dan membuat catatan
sejarah dari informasi dari sistem lain. Ini mungkin sebuah aplikasi ERP, log
dari aplikasi web, data dari sistem manufaktur atau bahkan data dari teleskop
radio. Data ini diambil dari sistem sumber (s) dan kemudian dibersihkan dan
dimasukkan ke dalam gudang data dengan alat ETL. Proses ini biasanya disebut
"sesuai" sumber data ke dalam skema gudang. Aspek penting lain dari
definisi adalah agregasi. Sebuah data warehouse biasanya digunakan untuk
meringkas data yang selama bertahun-tahun, bulan, triwulan, atau atribut lain
waktu dimensi. Hal ini membantu dalam mengidentifikasi tren historis dan
membuat prediksi tentang tren masa depan. Data sering dikumpulkan dalam
berbagai cara. Data agregat dapat disimpan dalam tabel agregat sehingga dapat
diakses dengan cepat. Hal ini sangat penting karena tabel fakta mencapai ke
miliaran baris dan ratusan gigabyte informasi yang dikumpulkan. Mengakses data
ini di luar bentuk diringkas sering membutuhkan waktu yang sangat lama.
perbedaan data mart dan warehouse
on covering the following topics: Introduction to OLAP and
business intelligence. (this post) Identifying the differences between a data
warehouse, and a data mart. Introduction to MDX queries and the kind of SQL
which a ROLAP… next? Next we’ll talk about the difference between data marts
and data warehouses. The former are usually used for OLAP analysis, but they
can be fundamentally related to a warehouse.
OLAP analisis biasanya dilakukan pada skema bintang yang
sebagian denormalizes data. Sebuah skema bintang tentang subyek tertentu,
seperti penjualan, biasanya disebut sebagai "data mart". Mungkin ini
karena mereka menyediakan one stop shopping untuk semua informasi tentang
subyek tertentu. Itu cukup banyak apa yang saya bayangkan ketika saya mendengar
ungkapan.
Data mart cenderung sering diupdate, setidaknya sekali per
hari. Seperti yang saya sebutkan di posting saya sebelumnya, skema bintang
terdiri dari sebuah meja pusat yang disebut tabel fakta dan tabel dimensi
tambahan yang berisi informasi tentang fakta-fakta, seperti daftar pelanggan
atau produk. Karena sifat sebagian denormalized dari skema bintang, tabel
dimensi dalam data mart dapat diperbarui. Bahkan, ada istilah untuk dimensi
seperti itu - Sebuah "dimensi pelan-pelan berubah" atau SCD. Tabel
fakta biasanya hanya dimasukkan, tapi data yang lebih tua mungkin akan
dibersihkan dari itu. Kadang-kadang tabel fakta akan dikumpulkan dari sumber
data. Sebuah situs web yang menjual iklan banner mungkin menggulung semua
aktivitas untuk iklan tertentu ke tingkat hari, bukannya menyimpan informasi
rinci tentang kesan setiap dan klik untuk iklan.
Sebuah skema data warehouse dinormalisasi mungkin berisi
tabel disebut item, kategori dan item_category. Ketiga tabel memungkinkan
pengguna untuk menentukan item milik kategori mana, tetapi struktur ini
menciptakan sejumlah besar bergabung ketika banyak dimensi yang terlibat.
Sebuah data mart akan runtuh semua informasi ini ke dalam dimensi item yang
akan mencakup informasi kategori di baris yang sama dengan informasi item. Ini
akan mungkin membuat dua dimensi yang berbeda, produk dan kategori, namun
kinerja cenderung menurun sebagai meningkatnya jumlah dimensi