HBase
 sql >> Teknologi Basis Data >  >> NoSQL >> HBase

Memulai dengan Cloudera Data Platform Operational Database (COD)

Konsep

Apa itu Cloudera Operational Database (COD)?

Database Operasional adalah database relasional dan non-relasional yang dibangun di atas Apache HBase dan dirancang untuk mendukung aplikasi OLTP, yang menggunakan data besar.

Basis data operasional di Cloudera Data Platform memiliki komponen berikut: 

  • Apache Phoenix menyediakan model relasional yang memfasilitasi skalabilitas besar-besaran. Ini memanfaatkan skalabilitas dan ketahanan Apache HBase.
  • Apache HBase menyediakan model non-relasional yang dirancang untuk skalabilitas masif, sehingga Anda dapat menyimpan data dalam jumlah tak terbatas dalam satu platform dan menangani permintaan yang terus meningkat untuk menyajikan data.
  • Apache ZooKeeper menyediakan layanan konfigurasi terdistribusi, layanan sinkronisasi, dan registri penamaan.
  • Apache Knox Gateway menyediakan keamanan perimeter sehingga perusahaan dapat dengan percaya diri memperluas akses ke pengguna baru.
  • Apache HDFS digunakan untuk menulis Apache HBase WALs (dan HBase HFiles dalam beberapa kasus).
  • Toko objek seperti Amazon S3 dan Microsoft ADLS Gen2 digunakan untuk menyimpan Apache HBase HFiles.
  • Shared Data Experience (SDX) digunakan untuk kemampuan keamanan dan tata kelola. Kebijakan keamanan dan tata kelola ditetapkan satu kali dan diterapkan di semua data dan beban kerja. Sama seperti CDP itu sendiri, SDX dibangun di atas proyek open source komunitas dengan Apache Ranger dan Apache Atlas sebagai tempat kebanggaannya.

Atlas menyediakan manajemen metadata terbuka dan kemampuan tata kelola untuk membuat katalog semua aset, dan juga mengklasifikasikan dan mengatur aset ini. Lapisan SDX CDP memanfaatkan spektrum penuh Atlas untuk melacak dan mengontrol semua aset data secara otomatis.

Ranger menyediakan manajemen kunci keamanan, dengan login terpisah untuk administrator Kunci menggunakan layanan Ranger KMS. Apache Ranger juga menyediakan fitur keamanan yang sangat dibutuhkan seperti penyembunyian kolom dan pemfilteran baris di luar kotak. Faktor penting lainnya adalah bahwa kebijakan akses di Ranger dapat disesuaikan dengan konteks dinamis menggunakan atribut yang berbeda seperti 'wilayah geografis' atau 'waktu dalam sehari'.

  • IDBroker adalah REST API yang dibuat sebagai bagian dari layanan autentikasi Apache Knox. Ini memungkinkan pengguna yang diautentikasi dan berwenang untuk menukar satu set kredensial atau token untuk token akses vendor cloud.

Layanan Data Basis Data Operasional CDP

CDP Operational Database (COD) adalah database operasional penskalaan otomatis waktu nyata yang didukung oleh Apache HBase dan Apache Phoenix. Ini adalah layanan data yang berjalan di Cloudera Data Platform (CDP). Anda dapat mengakses COD langsung dari konsol CDP Anda. COD memungkinkan Anda membuat database operasional baru dengan sekali klik dan penskalaan otomatis berdasarkan beban kerja Anda.

Berikut ini adalah langkah-langkah kunci untuk memulai COD:

  • Buat database di lingkungan menggunakan satu klik dan database akan aktif dan tersedia dalam beberapa menit.
  • Siapkan kata sandi beban kerja Anda. Untuk informasi lebih lanjut, klik di sini.
  • Unduh dan instal Apache Maven, Java, Python 3.8.
  • Instal Klien CDP di mesin Anda. Untuk informasi lebih lanjut, klik di sini.
  • Ikuti petunjuk di repositori contoh untuk membuat perubahan pada maven settings-security.xml, settings.xml, dan pom.xml Anda.
  • Buat dan jalankan aplikasi.

Apache HBase

HBase adalah arsitektur penyimpanan data berorientasi kolom yang dibentuk di atas HDFS untuk mengatasi keterbatasannya. Ini memanfaatkan fitur dasar HDFS dan membangunnya untuk memberikan skalabilitas dengan menangani sejumlah besar permintaan baca dan tulis secara real-time. Meskipun arsitektur HBase adalah database NoSQL, ini memudahkan proses pemeliharaan data dengan mendistribusikannya secara merata di seluruh cluster. Ini membuat pengaksesan dan pengubahan data dalam model data HBase menjadi cepat. Pelajari lebih lanjut tentang Apache HBase.

Apache Phoenix

Apache Phoenix adalah antarmuka RDBMS dan ANSI SQL. Apache Phoenix mengimplementasikan pengoptimalan praktik terbaik untuk memungkinkan para insinyur perangkat lunak mengembangkan aplikasi berbasis data generasi berikutnya berdasarkan HBase. Dengan menggunakan Phoenix, Anda dapat membuat dan berinteraksi dengan tabel dalam bentuk pernyataan DDL/DML biasa menggunakan JDBC API standar, ODBC, dan Phoenix DB API.

Phoenix menyediakan:

  • dukungan SQL dan JDBC API
  • Dukungan untuk terikat akhir, skema-on-read
  • Akses ke data yang disimpan dan diproduksi di komponen lain seperti Apache Spark dan Apache Hive

Pelajari lebih lanjut tentang Apache Phoenix.

Prosedur

Cara membuat Basis Data Operasional

Anda dapat membuat database operasional di lingkungan terdaftar Anda menggunakan CDP Operational Database (COD).

Prasyarat

  • Anda harus masuk ke lingkungan COD sebagai ODAdmin.
  • Pastikan bahwa Anda berwenang untuk membuat database.

Langkah

  1. Masuk ke antarmuka web CDP. Misalnya, konsol CDP.
  2. Pilih Basis Data Operasional.
  3. Di antarmuka web COD, klik Buat Basis Data.
  4. Pilih lingkungan dari daftar tempat Anda ingin memiliki database.
  5. Berikan nama untuk database di bidang Nama Database.
  6. Klik Buat Basis Data.

Hasil

Ditampilkan halaman informasi yang menunjukkan status database. Basis data baru Anda siap digunakan setelah statusnya menjadi Tersedia.

Demo

Cara mengelola koneksi database

Setelah Anda membuat database operasional dan tersedia, Anda dapat mengelola koneksi database.

Prasyarat

  • Pastikan database aktif dan tersedia.
  • Anda berwenang untuk membuat perubahan pada database.

Langkah

  1. Di antarmuka web COD, pilih database yang ingin Anda kelola koneksinya.
  2. Di bawah Connect, masuk ke dalam setiap tab dan ubah parameternya.

Referensi

  • Dokumentasi Cloudera tentang pembuatan database COD
  • Database Operasional di CDP 

Jika Anda tertarik untuk mencoba CDP Public Cloud dan Database Operasional, cobalah Uji Coba .


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Pengantar Cache Terdistribusi di Hadoop

  2. Perhentian Berikutnya – Membangun Pipa Data dari Ujung ke Wawasan

  3. Perbedaan Antara InputSplit vs Blok di Hadoop

  4. Pengenalan Hadoop RecordReader, Cara Kerja &Jenis

  5. Menggunakan Hive untuk berinteraksi dengan HBase, Bagian 1