Untuk administrator basis data yang bertanggung jawab untuk menanggapi peringatan SQL Server setiap saat, siang dan malam, perasaan kelebihan beban kemungkinan diperburuk oleh rentetan pemberitahuan yang terus-menerus bahwa ada sesuatu yang membutuhkan perhatian Anda. BAIK. SEKARANG.
Pemantauan SQL Server sangat penting untuk menjaga ketersediaan tinggi dan melacak masalah kinerja di sistem Anda, dan peringatan adalah cara paling efisien untuk mengetahui ada masalah. Tetapi adalah mungkin untuk memiliki terlalu banyak hal yang baik.
Seperti kata pepatah, "Ketika semuanya menjadi prioritas, tidak ada yang menjadi prioritas." Kelelahan peringatan itu nyata dan dapat menyebabkan Anda mengabaikan atau mengabaikan peristiwa yang berdampak negatif pada pengguna Anda.
Saat Anda menyiapkan pemantauan kinerja SQL Server, penting untuk mengonfigurasi alarm dengan hati-hati dan dengan cara yang mengontrol kapan, mengapa, dan seberapa sering Anda menerima notifikasi. Berikut adalah empat cara untuk mengelola lansiran yang akan membantu mengurangi kelebihan lansiran dan menghemat sisa kewarasan Anda.
1. Matikan Alarm yang Tidak Anda Butuhkan
Untuk banyak DBA, ini lebih mudah diucapkan daripada dilakukan. Ada elemen kecil teror saat memikirkan untuk memilih peringatan mana yang tidak akan diterima. Untungnya, ada beberapa praktik terbaik yang dapat Anda terapkan yang dapat membuat FOMO Anda tidak terlalu menyakitkan.
Salah satu hal termudah yang dapat Anda lakukan adalah meninjau log peringatan dan mematikan peringatan yang secara kronis merupakan alarm palsu atau positif palsu. Kemungkinannya bagus bahwa Anda tidak akan melewatkan masalah nyata, dan otak Anda akan menghargai jeda dari bereaksi terhadap pemberitahuan yang tidak perlu.
Strategi lain datang dari teknisi keandalan situs (SRE) Google. SRE bertanggung jawab atas ketersediaan, latensi, kinerja, efisiensi, manajemen perubahan, pemantauan, tanggap darurat, dan perencanaan kapasitas.
Tim SRE memiliki sistem Alert/Ticket/Log untuk meminimalkan kelebihan peringatan dengan menetapkan respons ke suatu peristiwa yang didasarkan pada seberapa cepat intervensi manusia diperlukan. Tiga kemungkinan tanggapan meliputi:
- Peringatan:Peringatan hanya dikirim jika seseorang harus segera mengambil tindakan.
- Tiket:Jika acara memerlukan tindakan oleh seseorang, tetapi dapat menunggu hingga jam kerja normal, tiket dikirimkan dan melalui saluran normal.
- Log:Jika tidak ada tindakan yang diperlukan, acara akan dicatat untuk diagnostik.
2. Gunakan Alarm Cerdas untuk Mendapatkan Akar Penyebab Peringatan dengan Cepat
Saat ponsel Anda meledak dengan notifikasi pada pukul 3 pagi, Anda tidak ingin menghabiskan waktu satu jam untuk mencari-cari masalah.
Alarm Cerdas tidak hanya memberi tahu Anda bahwa Anda memiliki masalah, tetapi juga menyarankan cara untuk memperbaikinya dan membantu Anda mengidentifikasi akar masalahnya. Alarm Cerdas juga menyediakan data historis tentang peristiwa tersebut sehingga Anda tahu apa yang terjadi segera sebelum dan setelah peringatan dipicu.
3. Prioritaskan Lansiran Anda untuk Mengidentifikasi Masalah Paling Mendesak
Semua peringatan tidak dibuat sama, jadi penting untuk mengonfigurasi alat pemantauan kinerja SQL Server Anda sehingga hanya mengirimkan peringatan untuk masalah yang paling penting. Dengan memprioritaskan peringatan berdasarkan tingkat keparahan, dampak terhadap bisnis atau pelanggan, dan apakah tindakan segera diperlukan, Anda menghilangkan beberapa kebisingan yang dihasilkan oleh peringatan yang tidak penting.
Fokus pada penyiapan lansiran untuk masalah yang dapat menyebabkan server Anda offline, data yang rusak parah, atau mengakibatkan hilangnya data yang signifikan (yaitu, Tingkat Masalah 17 atau lebih tinggi dan pesan kesalahan 823, 824, dan 825).
4. Kelola Alarm dengan Menerapkan Ambang Batas dan Aturan Tertentu
Menetapkan ambang batas dan aturan adalah penghemat kewarasan yang besar karena akan membantu Anda menghindari dibombardir oleh banyak peringatan dalam rentang waktu yang singkat.
Saat Anda menentukan ambang batas kinerja, SQL Server menunda memberi tahu Anda hingga nilai untuk metrik tertentu mencapai tingkat yang terkait—misalnya, ruang disk kosong atau tingkat memori fisik kosong sangat rendah. Ini membebaskan DBA untuk mengerjakan tugas lain tanpa terus-menerus memantau metrik.
Menyetel aturan untuk lansiran memungkinkan Anda menyesuaikan tindakan, seperti seberapa sering Anda ingin diberi tahu. Misalnya, Anda dapat mengatur SQL Server untuk hanya mengirim pemberitahuan saat peringatan tertentu telah dipicu empat kali atau jika peringatan berisi objek database atau nama pengguna tertentu.
Saat DBA mulai menavigasi lingkungan bisnis yang baru dan sangat berbeda pasca-COVID-19, tingkat stres pasti akan meningkat. Mempertahankan ketersediaan tinggi dan memastikan sistem SQL Server Anda aman dan berkinerja optimal akan tetap menjadi prioritas utama. Namun sekarang adalah saat yang tepat untuk meminta kemampuan pemantauan SQL Server guna mengendalikan konfigurasi peringatan Anda dan menghilangkan gangguan yang tidak perlu.