Database
 sql >> Teknologi Basis Data >  >> RDS >> Database

Pengantar Dimensi yang Berubah Perlahan (SCD)

Dimensi adalah struktur yang mengkategorikan kumpulan informasi sehingga jawaban yang bermakna atas pertanyaan mengenai informasi tersebut dapat diperoleh. Dimensi dalam manajemen data dan gudang data berisi data yang relatif statis; namun, data dimensi ini dapat berubah perlahan seiring waktu dan pada interval yang tidak dapat diprediksi. Jenis data dimensi ini dikenal sebagai Dimensi yang Berubah Perlahan (SCD).

Dalam lingkungan data warehouse, tabel dimensi memiliki kunci utama yang secara unik mengidentifikasi setiap record dan bagian informasi lainnya yang dikenal sebagai data dimensional. Kunci utama akan menautkan ke tabel fakta menggunakan kunci ini. Oleh karena itu, penting untuk memiliki model untuk memperbarui dan menangani data saat ini dan data historis. Ada model yang dikenali yang dikenal dengan tipenya:

  • Tipe 1 – Model ini melibatkan penimpaan nilai lama saat ini dengan nilai baru saat ini. Tidak ada sejarah yang dipertahankan.
  • Tipe 2 – Catatan saat ini dan catatan sejarah disimpan dan dipelihara dalam file atau tabel yang sama.
  • Tipe 3 – Data saat ini dan data historis disimpan dalam catatan yang sama. Pengguna memutuskan berapa banyak riwayat yang disimpan dalam catatan.
  • Tipe 4 – Dalam model ini, data saat ini disimpan dalam dua tabel yang berbeda; satu untuk data saat ini dan satu yang berisi semua data historis.
  • Tipe 6 – Model ini merupakan hibrida dari Tipe 1, Tipe 2, dan Tipe3.

Semua metode pembaruan untuk model SCD yang berbeda dapat dilakukan menggunakan program SortCL di IRI CoSort atau IRI Voracity. Voracity sekarang juga menyediakan wizard penciptaan pekerjaan ujung-ke-ujung tunggal untuk membangun program-program ini secara otomatis; Lihat di bawah. Sebagian besar jenis menggunakan gabungan luar penuh untuk mencocokkan catatan dari sumber data master dengan catatan di sumber pembaruan berdasarkan menyamakan kunci unik dari masing-masing. Catatan dengan kecocokan perlu diperbarui di master. Catatan di sumber pembaruan yang tidak memiliki kecocokan perlu ditambahkan ke master.

Artikel saya tentang jenis SCD yang berbeda menunjukkan sumber atau input data dalam file dan menunjukkan skrip SortCL yang digunakan untuk memperbarui file master. Tabel juga dapat menjadi sumber dengan skrip ini.

Dalam setiap contoh, saya membahas langkah-langkah untuk memperbarui sumber dimensi yang mempertahankan biaya produk yang berubah pada interval yang tidak teratur. Bidang atau kolom kunci adalah ProductCode. Semua file master sumber akan berisi data berikut:

Sumber master1.dat berisi:

Kode Produk Biaya Tanggal Mulai
C123 125,50 20110228
F112 2365.00 20120101
G101 19,25 20110930
J245 450,50 20110430
S022 98,75 20110515

Data pembaruan semua akan memiliki StartDate yang sama. Sumber pembaruan berisi data berikut:

Kode Produk Biaya Tanggal Mulai
F112 2425.00 20120701
J245 550,50 20120701
M447 101.75 20120701
S022 101.75 20120701

Pelaporan SCD juga dibahas di situs web IRI di sini. Lihat artikel khusus untuk SCD ini: Jenis 1, Jenis 2, Jenis 3, Jenis 4, dan Jenis 6.

Wizard Grafis SCD Baru

Pengguna Voracity sekarang juga dapat menggunakan wizard pembuatan pekerjaan yang dibuat khusus untuk melaporkan tipe SCD 1, 2, 3, 4, dan 6 di GUI Workbench IRI, yang dibangun di atas Eclipse. Wizard juga mendukung integrasi pengurutan, evaluasi ekspresi, agregasi, pemformatan baru, enkripsi, dan banyak lagi.

Setelah menyiapkan pekerjaan dan memilih jenis SCD di wizard, Anda menentukan data master dan memperbarui informasi. Setelah itu, Anda menentukan pemetaan untuk target, menempatkan bidang sesuai dengan bidang sumber yang cocok, dan menggunakan kotak kombo sesuai kebutuhan, bekerja dengan kumpulan bidang saat ini dan historis. Setelah bergabung dengan informasi yang ditentukan pada halaman Gabung Sumber, skrip yang sesuai dibuat dan siap untuk membuat diagram, mengeksekusi, memodifikasi, atau membagikan.

Artikel yang terkait dengan jenis di atas akan diperbarui untuk mencerminkan bagaimana wizard SCD baru di Voracity dapat membuatkan pekerjaan ini secara otomatis untuk Anda.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Menangani Kebocoran Sumber Daya GDI

  2. Menghubungkan ke Lotus Notes dari Java

  3. Menggunakan Fungsi DATEADD, DATEDIFF dan DATEPART T-SQL dalam Istilah Sederhana

  4. Memecahkan masalah kegagalan saat mencoba membuat model IMDB besar

  5. Lembar Cheat SQL:Apa itu SQL, Perintah SQL, dan Injeksi SQL