Banyak definisi tentang data warehouse, namun definisi yang paling populer berasal dari Bill Inmon. Menurutnya, "Gudang data adalah kumpulan data yang berorientasi subjek, terpadu atau terintegrasi, time-variant atau rentang waktu dan non-volatile untuk mendukung proses manajemen pengambilan keputusan."
Berorientasi Subjek: Sebuah gudang data dapat digunakan untuk menganalisa suatu subyek tertentu. Misalnya, "penjualan" bisa menjadi topik atau subyek yang dianalisis.
Terintegrasi: Sebuah data warehouse mengintegrasikan data dari berbagai sumber data. Misalnya, sumber A dan sumber B mungkin memiliki cara yang berbeda untuk mengidentifikasi produk, tetapi dalam data warehouse, hanya akan ada satu cara untuk mengidentifikasi produk, sehingga keduanya akan mempunyai cara yang sama dalam mengidentifikasi produk.
Rentang Waktu: Seluruh data historis disimpan di gudang data. Sebagai contoh, seseorang dapat mengambil data per 3 bulan, 6 bulan, 12 bulan, atau bahkan lebih lama. Ini berbeda dengan sistem transaksi, yang hanya menyimpan data terbaru. Sebagai contoh, sistem transaksi dapat menyimpan alamat terbaru dari pelanggan, data warehouse dapat menampung semua alamat yang terkait dengan pelanggan.
Non-volatile: Setelah data berada di dalam data warehouse, data tidak akan berubah. Jadi, data historis yang telah berada di dalam gudang data tidak akan berubah.
Ralph Kimball memberikan definisi yang lebih singkat tentang data warehouse: "Gudang data adalah salinan data transaksi khusus terstruktur untuk query dan analisis."
Ini adalah pandangan fungsional dari data warehouse. Kimball tidak membahas bagaimana data warehouse dibangun seperti yang dilakukan Inmon, karena dia lebih fokus pada fungsi data warehouse. (Berry Susanto)

0 Comment: