Saya telah berlatih teknik database tangkas selama sekitar dua puluh tahun sekarang. Penggunaan teknik ini oleh saya tidak dimulai sebagai rencana yang ditetapkan; alih-alih, itu berkembang seiring waktu ketika saya berkonsultasi pada berbagai proyek. Masuk akal untuk mencari cara bekerja lebih cepat dan dengan interaksi pelanggan yang lebih besar.
Saya dapat memikirkan setidaknya tiga jenis teknik database tangkas:
- Pemodelan data
- Pengembangan gudang data
- Rekayasa balik basis data
Pemodelan Data Tangkas
Banyak yang menganggap pemodelan data sebagai tugas yang melelahkan. Tapi itu tidak perlu terjadi. Anda dapat mengambil pemodelan data dari ruang belakang dan melakukannya di depan pelanggan. Anda mungkin berpikir bahwa pelanggan akan terganggu oleh masalah teknis, tetapi sebenarnya tidak. Staf bisnis memiliki hasrat untuk pekerjaan mereka dan visi ke mana mereka ingin pergi. Mereka senang memiliki TI sebagai fasilitator daripada penghalang jalan.
Untuk pemodelan data tangkas, pengembang perlu melakukan hal berikut:
- Fasih dengan konsep pemodelan data dan alat pemodelan data.
- Buat diri Anda menjadi orang yang ramah untuk beberapa kali pertama Anda. Anda perlu mencoba teknik Anda pada audiens yang mengasuh sampai Anda mendapatkan kepercayaan diri.
- Memiliki setidaknya satu juara bisnis di antara audiens – seseorang untuk menerima hasil pekerjaan Anda, seseorang yang memahami bisnis secara mendalam dan akan membantu mendorong orang lain untuk mencapai konsensus.
- Memiliki proyek yang solid dengan tujuan yang jelas dan justifikasi bisnis.
Dengan pemodelan data yang gesit, pengembang bekerja dengan cepat dan sering melakukan revisi model. Saya lebih suka sesi pemodelan data berlangsung tidak lebih dari dua jam. Sesi ini intens, dengan semua orang berebut ide. Setelah dua jam, peserta perlu istirahat. Anda juga perlu waktu untuk membersihkan model dan menyelesaikan dokumentasi.
Teknik tangkas berlaku untuk semua aspek pemodelan data, termasuk sistem operasional sehari-hari, gudang data, model data master, dan model data perusahaan.
Teknik Pengembangan Gudang Data Agile
Teknik tangkas juga penting saat Anda membangun gudang data. Secara khusus, ada dua area di mana kami telah menerapkan teknik ini pada pengembangan gudang.
Yang pertama adalah pementasan data . Ini adalah praktik yang baik untuk menggunakan tabel staging perantara untuk menyangga gudang yang tepat dari sumber operasional. Tabel pementasan menduplikasi data operasional dan menambahkan metadata seperti sistem sumber, tanggal pemrosesan, stempel waktu efektif, dan stempel waktu kedaluwarsa. Saat ini, sebagian besar pengembang memproses data pementasan dengan kode ETL khusus. (ETL adalah singkatan dari Extract, Transform, dan Load.) Setidaknya ada satu alat (A2B Data) yang mengotomatiskan pembuatan dan populasi skema tabel staging.
Kami juga menggunakan teknik tangkas untuk meningkatkan pemrosesan data gudang . Untuk ini, kami menyukai campuran ETL dan SQL. ETL digunakan untuk tabel inti dengan logika kompleks, sedangkan SQL digunakan untuk tabel periferal — dan ada banyak tabel di gudang biasa. Ini kira-kira 10 kali lebih cepat untuk menulis SQL daripada ETL. Kode SQL juga lebih mudah untuk dikembangkan dan diuji. Masuk akal, Anda dapat mengharapkan untuk mengganti ETL dengan SQL untuk sekitar setengah dari tabel; jumlah pastinya tergantung pada kompleksitas gudang dan keterampilan SQL Anda.
Penyempurnaan ini mengurangi jumlah kode ETL yang perlu ditulis saat menerapkannya di tempat yang paling berharga:untuk kumpulan data besar dengan banyak sumber untuk diintegrasikan dan diproses.
Kelincahan dalam Rekayasa Pembalikan Basis Data
Kami juga menggunakan teknik tangkas selama reverse engineering. Rekayasa terbalik mengambil desain yang ada dan bekerja mundur untuk menyimpulkan maksud logis yang mendasarinya. Rekayasa balik basis data dapat memiliki berbagai motivasi. Anda mungkin mengonversi dari satu platform database ke platform lainnya. Atau Anda mungkin mencoba untuk lebih memahami model untuk tujuan pemeliharaan. Atau Anda mungkin mencoba menyelamatkan persyaratan yang tersirat dalam skema untuk dipertimbangkan oleh perangkat lunak baru.
Kami biasanya memulai dengan menganalisis skema yang ada. Skema sering tersedia dan itu adalah sesuatu yang dapat kita pelajari dengan cepat. Kami dapat menambahkan ini dengan sumber daya lain, seperti dokumentasi, data, dan percakapan pengembang.
Alat pemodelan data adalah sumber penting untuk mempelajari skema. Sebagian besar alat dapat mengimpor skema SQL sehingga Anda dapat melihat tabel dan cara mereka terhubung bersama. Seringkali, itu sudah cukup untuk analisis rekayasa balik.
Teknik Basis Data Agile:Takeaway
Pengembangan tangkas adalah topik populer yang memiliki beberapa implikasi basis data. Pendekatan tangkas sangat membantu untuk pemodelan data, pengembangan gudang data, dan rekayasa balik basis data.
Michael Blaha adalah konsultan dan pelatih yang berspesialisasi dalam menyusun, merancang, membuat model, merancang, dan menyetel basis data. Dia telah bekerja dengan puluhan organisasi di seluruh dunia. Dr. Blaha telah menulis tujuh paten AS, tujuh buku, banyak artikel, dan dua kursus video. Publikasi terbarunya adalah Desain Gudang Data Agile kursus video dari O'Reilly. Ia menerima gelar doktor dari Washington University di St. Louis, dan merupakan alumnus GE Global Research di Schenectady, New York. Anda dapat menemukan informasi lebih lanjut di profil LinkedIn-nya atau di superdataguy.com.