Cloudera Data Platform (CDP) adalah penawaran Big Data terbaru dari Cloudera. Ini termasuk Apache HBase dan Phoenix sebagai bagian dari platform. Kedua komponen ini disediakan dalam 3 faktor bentuk:
- Untuk penerapan lokal, mereka tersedia dengan cara yang mirip dengan CDH &HDP (dalam penawaran CDP Private Cloud)
- Untuk pelanggan yang ingin mengelola database mereka sendiri di AWS &Azure, ini tersedia sebagai bagian dari penawaran CDP Public Cloud DataHub (dengan template Database Operasional atau di Custom penerapan DataHub)
- Ini akan tersedia sebagai bagian dari Cloudera Operational Database (COD) dalam waktu dekat yang merupakan penawaran terkelola sepenuhnya yang menghilangkan biaya manajemen untuk mengoperasikan penerapan HBase
Pelanggan Apache HBase Cloudera biasanya menjalankan aplikasi mission-critical yang tidak mampu membayar downtime. Mereka membutuhkan cara untuk bermigrasi ke penerapan baru baik tanpa penghentian produksi atau, minimal, pemadaman kecil. Dengan mempertimbangkan pemutakhiran ini, terutama dengan berakhirnya dukungan untuk CDH5 dan HDP 2 yang akan datang, kami telah mengembangkan Plugin Replikasi Cloudera OpDB .
Banyak perusahaan juga menerapkan klaster HBase berbasis CDH 6, HDP 3, dan EMR tetapi mencari cara untuk mengurangi atau menghilangkan biaya operasional pemeliharaan klaster HBase. Bagi mereka, Plugin Replikasi Cloudera OpDB dapat memungkinkan mereka untuk bermigrasi ke DataHub atau COD tanpa menimbulkan waktu henti atau penghentian produksi.
Plugin Replikasi mendukung replikasi dari cluster HBase sumber berikut:
- CDH 5.14
- CDH 6.3
- HDP 2.6.5
- HDP 3.1.5
- EMR 5,28
Replikasi HBase
HBase telah menyediakan kemampuan replikasi yang matang dan kaya fitur selama hampir satu dekade. Replikasi adalah salah satu kemampuan HBase yang paling populer karena menyediakan solusi pemulihan bencana (DR) otomatis, mendukung migrasi data, mendukung partisi beban kerja dan/atau mendukung indeks sekunder berbasis pencarian melalui integrasi dengan Apache Solr. Diskusi mendetail tentang cara kerja Replikasi HBase dan cara mengonfigurasi replikasi dijelaskan dalam Panduan Referensi HBase dan telah dibahas di banyak artikel Blog Cloudera. Saat ini, mendukung banyak topologi termasuk:
- Penggemar masuk
- Penggemaran
- Siklik
- Dua arah
Replikasi HBase dapat dikonfigurasi pada namespace (yaitu, database) atau tingkat tabel. Meskipun sifatnya hampir real-time, ini dapat dikonfigurasi untuk menjadi konsisten pada akhirnya atau konsisten dengan timeline.
Plugin Replikasi Cloudera OpDB hanya mendukung cluster tujuan yang disediakan oleh CDP DataHub Cluster atau oleh database COD, yang diterapkan di AWS atau Azure.
Membangun kepercayaan
Replikasi HBase hingga saat ini mengharuskan semua cluster yang berpartisipasi memiliki definisi keamanan yang sama, dengan kata lain, semua cluster tidak boleh memiliki keamanan yang diaktifkan (konfigurasi otentikasi disetel ke sederhana) , atau semua cluster harus mengaktifkan keamanan dengan kerberos (konfigurasi otentikasi disetel ke kerberos) .
Saat Kerberos digunakan, semua prinsip kerberos cluster harus berada dalam realm, yang sama atau jika di alam yang berbeda, itu harus dapat dipercaya antara satu sama lain (umumnya dikenal sebagai lintas alam autentikasi).
Mengonfigurasi kepercayaan lintas-alam dengan Kerberos bermasalah di sebagian besar organisasi karena kebijakan keamanan perusahaan biasanya melarangnya. Untuk mengatasi masalah ini, plugin Cloudera OpDB Replication memperluas replikasi HBase untuk menggunakan metode otentikasi alternatif, memungkinkan replikasi di seluruh domain keamanan. Plugin Replikasi memungkinkan replikasi
- Di beberapa domain Kerberos tanpa memerlukan kepercayaan lintas-alam
- Replikasi dari cluster aman ke tidak aman, dan
- Replikasi dari cluster yang tidak aman ke cluster yang aman.
Untuk membangun kepercayaan dari cluster CDP untuk cluster yang tidak memiliki konfigurasi keamanan atau diamankan menggunakan Kerberos, Plugin Replikasi mengimplementasikan mekanisme otentikasi baru menggunakan rahasia bersama yang dibuat menggunakan alat yang disediakan dan disimpan di cluster sumber dan tujuan.
Kesimpulan
Replikasi adalah alat yang berharga untuk menerapkan DR dan solusi migrasi pusat data (DC) untuk HBase. Ini memiliki beberapa peringatan, seperti yang ditunjukkan di sini ketika berhadapan dengan konfigurasi keamanan cluster. Dengan akhir masa pakai CDH 5 dan HDP 2 yang akan datang, kemampuan untuk memigrasikan data dari platform lama ini ke CDP sangat penting.
Untuk pelanggan dengan penerapan HBase berbasis HDP3, CDH6, dan EMR 5.28, plugin ini memungkinkan pelanggan ini untuk secara mulus mengadopsi solusi HBase yang terkelola sepenuhnya dan secara drastis mengurangi biaya operasional pengelolaan HBase.
Hubungi tim akun Cloudera Anda jika Anda tertarik untuk menerapkan Plugin Replikasi Cloudera OpDB di lingkungan Anda.