Replikasi data berarti menyalin data dari satu tempat ke tempat lain, dan biasanya dilakukan antara pengguna database yang berbeda yang perlu berbagi tingkat informasi yang sama. Replikasi juga dapat melibatkan sumber dan target data lain, dan menjadi lebih kompleks dalam hal transformasi dan temporal.
Ini adalah yang pertama dari dua artikel yang mencakup replikasi database di GUI Meja Kerja IRI. IRI Workbench adalah IDE gratis yang dibangun di atas Eclipse™ yang mendukung semua produk IRI, termasuk IRI NextForm (untuk migrasi data dan database) dan IRI Voracity (platform pengelolaan data total yang mencakup NextForm dkk.). IRI Workbench membuat dan menjalankan tugas replikasi data melalui wizard, skrip, dan diagram alur kerja.
Berikut adalah beberapa cara terjadinya replikasi:
- Data dalam satu database disalin ke database lain di server yang sama atau server lain.
- Data dari dua atau lebih database digabungkan menjadi satu database.
- Pengguna mendapatkan salinan awal lengkap dari database dan kemudian pembaruan berkala saat data berubah.
- Data diekstraksi secara selektif dari database dan direplikasi dalam file eksternal.
Replikasi data memungkinkan Anda untuk mereplikasi hanya sebagian dari database; yaitu, tabel, kolom, dan/atau baris yang dipilih. Mereplikasi semua tabel adalah bagian dari pencerminan basis data. Namun, perubahan skema, batasan, prosedur, dan otorisasi akses tidak mudah untuk direplikasi, dan mungkin melibatkan proses terpisah.
Contoh Dasar di Meja Kerja IRI
Kami akan menggunakan wizard pembuatan pekerjaan dari menu NextForm di toolbar IRI Workbench untuk contoh replikasi data pertama ini. Kami akan menyalin data dari tabel Oracle ke tabel MySQL dan file datar yang dimodifikasi. Artikel kedua ini menunjukkan replikasi hanya data yang diperbarui dalam tabel dengan mengevaluasi nilai kolom stempel waktu.
Menu NextForm berisi tiga wizard pembuatan pekerjaan:
- Tugas Pemformatan Ulang Baru
- Tugas Migrasi Sumber Tunggal Baru
- Tugas Migrasi Multi Tabel Baru
Kami akan menggunakan wizard New Reformat Job untuk melakukan replikasi ini. Untuk pekerjaan yang lebih kompleks, kami akan menggunakan wizard NextForm yang berbeda, atau wizard pekerjaan ETL di menu Voracity (atau secara manual membangun alur kerja baru).
Berikut adalah struktur tabel sumber dan target:
Langkah 1:Tentukan Nama dan Pilihan Pekerjaan
Dari menu NextForm di toolbar atas, pilih wizard New Reformat Job. Untuk contoh ini, masukkan nama file pekerjaanreplikasi data . NextForm menambahkan ekstensi .ncl. Anda juga dapat menambahkan informasi yang relevan tentang pekerjaan ini yang akan muncul sebagai komentar di skrip.
Dari daftar tombol radio, biarkan pilihan default Buat skrip karena ini adalah pekerjaan yang berdiri sendiri dan bukan bagian dari proyek aliran atau batch yang lebih besar.
Langkah 2:Identifikasi Sumbernya
Pada layar berikutnya, Sumber Data, klik Tambahkan Sumber Data . Sumber dalam contoh ini adalah database yang terhubung dengan ODBC, jadi pilih ODBC, lalu klik Jelajahi untuk memilih nama sumber data (DSN) dan tabel.
Langkah 3:Tentukan Metadata Sumber
Agar perangkat lunak IRI dapat memindahkan dan memanipulasi data di mesinnya (dalam hal ini, mereplikasi di NextForm), Anda memerlukan metadata untuk sumber dan target yang ditentukan dalam skrip pekerjaan, dalam format file definisi data (DDF) IRI.
Anda dapat membuat DDF untuk sumber (atau target) apa pun secara otomatis di IRI Workbench. Fungsi tersebut disematkan di sini, tempat Anda dapat memilih untuk Menemukan Metadata atau Tambahkan Metadata yang Ada . Dalam hal ini, kami akan menambahkan metadata yang ada, yang dibuat dengan cara yang berbeda. Pilihan itu, dan hasilnya, ditampilkan dalam dialog berikut:
Klik Tata Letak Bidang Sumber untuk melihat tata letak data.
Klik Oke untuk menutup Tata Letak Bidang Sumber. Kemudian klik Berikutnya di halaman Sumber Data untuk membuka halaman Target Data.
Langkah 4:Tentukan Target
Kami mengirimkan data Oracle yang direplikasi ke dua target:tabel MySQL yang kami beri namacustomers_out , dan file bernama personout.csv .
Tambahkan tabel target
Klik Tambahkan Target Data . Pilih ODBC dan klik Jelajahi . Kemudian pilih Nama sumber data (DSN) Oracle dan tabel CUSTOMERS_REP . Klik Oke untuk menutup dialog.
Pada halaman Target Data, sorot nama tabel dan klik Tambahkan Metadata yang Ada . Pilih cust.ddf (yang telah dibuat sebelumnya), dan klik OK .
Kami ingin membatasi jumlah catatan dalam file ini menjadi 100. Klik Edit Opsi Target untuk membuka editor, dan di Outcollect bidang, masukkan 100 , dan klik Oke .
Tambahkan file target
Sekali lagi, klik Tambahkan Target Data . Pilih File dan masukkan personout.csv , dan klik Oke . Kami ingin membatasi jumlah record dalam file tidak lebih dari 50, dan kami juga perlu mengubah format ke CSV. Untuk melakukan keduanya, klik Edit Opsi Target untuk membuka editornya. Ubah Format bidang ke CSV , dan di Outcollect bidang, masukkan 50 , dan klik Oke .
Menambahkan fungsi string ke file target
Kami juga akan menambahkan fungsi string untuk menampilkan hanya empat digit terakhir dari bidang SSN. Untuk melakukannya, klik Tata Letak Bidang Target, dan klik tab personout.csv.
Pilih bidang SSN, klik kanan dan pilih Terapkan Aturan > Buat Aturan . Pada halaman Pemilihan Wizard Aturan Bidang Baru, pilih Fungsi Manipulasi String . Di halaman berikutnya – Fungsi Manipulasi String – pilih sub_string . Dalam Offset bidang, masukkan 6 untuk jumlah karakter dari kiri bidang, dan di Panjang bidang, masukkan 4 untuk panjang substring, lalu klik Selesai .
Tambahkan filter penyertaan
Untuk melanjutkan memodifikasi file CSV, kami akan menambahkan filter untuk membatasi data agar hanya menyertakan catatan dari CA. KlikFilter Rekam untuk membuat saringan. Pilih Sertakan untuk Tindakan Filter, dan pilih Kondisi Baru untuk jenisnya. Buka Pembuat Ekspresi dengan mengklik ikon Fungsi. Dalam Pembuat Ekspresi, pilih kategori Operator Relasional dan item EQ . Dalam Ekspresi di bagian atas, masukkan STATE EQ “CA” menggunakan alat pada bilah alat, dan klik Selesai .
Kembali ke halaman Target Data, kami memutuskan untuk memposisikan ulang bidang nama belakang dan nama depan setelah bidang zip. Pilih NAMA TERAKHIR dan klik Bawah hingga kolom berada di bagian bawah daftar, lalu pilih NAMA PERTAMA dan lakukan hal yang sama.
Setelah selesai menambahkan kedua target, bidang dan modifikasi ditampilkan di halaman Target Data.
Klik Selesai untuk menyelesaikan pembuatan skrip, yang ditampilkan di bawah ini dalam tampilan editor berkode warna dan sadar sintaks dari IRI Workbench:
Hasil
Jalankan skrip pekerjaan dengan mengklik kanan skrip dan memilihRun As> Pekerjaan IRI . Data target ditampilkan di tab yang terbuka di bawah ini:
Jika Anda memiliki pertanyaan tentang mereplikasi data di NextForm atau Voracity, hubungi perwakilan IRI Anda.
- Dari Data Source Explorer, klik kanan pada tabel, pilih IRI > Buat DDF . Ini membuat DDF untuk tabel di folder proyek aktif, dan akan direferensikan oleh mesin manipulasi data IRI saat runtime.