HBase
 sql >> Teknologi Basis Data >  >> NoSQL >> HBase

Basis Data Operasional di CDP

Catatan Editor, Agustus 2020:Pusat Data CDP sekarang disebut CDP Private Cloud Base. Anda dapat mempelajarinya lebih lanjut di sini.

Database operasional (OpDB) Cloudera di CDP menghadirkan OpDB yang dapat diskalakan secara real-time, selalu tersedia, yang menyajikan data terstruktur tradisional bersama data tidak terstruktur baru dalam platform Operasional dan Pergudangan terpadu. Cloudera menghadirkan database operasional yang menyajikan data terstruktur tradisional bersama data tidak terstruktur baru dalam platform sumber terbuka terpadu.

Basis data operasional membantu Anda untuk:

Mengoperasikan pembelajaran mesin/kecerdasan buatan untuk merevolusi sektor seperti perawatan kesehatan, utilitas publik, dll. 

  • Menyajikan konten waktu nyata di skala web.
  • Berdayakan analitik data besar untuk penggunaan operasional dan offline.
  • Gunakan sebagai penyimpan rekaman yang tangguh.

OpDB di CDP saat ini tersedia dalam dua faktor bentuk:sebagai penawaran semi-terkelola yang sepenuhnya aman di CDP Public Cloud – Data Hub, dan sebagai penawaran yang sepenuhnya dapat disesuaikan di Pusat Data CDP – serupa dengan yang sudah tersedia di CDH dan HDP. Anda dapat memilih faktor bentuk berdasarkan strategi penerapan dan kebutuhan OpDB Anda. Basis data operasional menggunakan penyimpanan objek seperti Amazon S3  sebagai lapisan penyimpanan untuk Apache HBase, tempat HFile ditulis ke penyimpanan objek, tetapi WAL ditulis ke HDFS.

Basis data operasional di CDP memiliki komponen berikut: 

  • Apache Phoenix sebuah antarmuka SQL yang berjalan di atas Apache HBase.
  • Apache HBase dirancang untuk skalabilitas masif, sehingga Anda dapat menyimpan data dalam jumlah tak terbatas dalam satu platform dan menangani permintaan yang terus meningkat untuk menyajikan data.
  • Apache ZooKeeper menyediakan layanan konfigurasi terdistribusi, layanan sinkronisasi, dan registri penamaan.
  • Apache Knox Gateway menyediakan keamanan perimeter sehingga perusahaan dapat dengan percaya diri memperluas akses ke pengguna baru.
  • Apache HDFS digunakan untuk menulis Apache HBase WAL.
  • Penyimpanan objek seperti Amazon S3 dan Microsoft ADLS Gen2 digunakan untuk menyimpan Apache HBase HFiles.
  • Shared Data Experience (SDX) digunakan untuk kemampuan keamanan dan tata kelola. Kebijakan keamanan dan tata kelola ditetapkan satu kali dan diterapkan di semua data dan beban kerja.
  • IDBroker adalah REST API yang dibuat sebagai bagian dari layanan autentikasi Apache Knox. Ini memungkinkan pengguna yang diautentikasi dan berwenang untuk menukar satu set kredensial atau token untuk token akses vendor cloud.

Database Operasional dalam Seri CDP 

Artikel ini memberi Anda pengenalan tentang OpDB di CDP dan arsitekturnya. Anda dapat mempelajari lebih lanjut tentang setiap aspek OpDB, dan mencari tahu tentang fitur dan kemampuan baru OpDB di artikel mendatang dari seri ini. Kami akan memperbarui tautan ke setiap posting blog saat dipublikasikan.

Aksesibilitas

OpDB Cloudera memastikan bahwa pengguna dapat mengakses atau mengambil data yang tersimpan. Ini mendukung sharding otomatis dan sharding yang telah ditentukan sebelumnya, tiga mesin kueri, dan beberapa alat integrasi data. Artikel ini memberikan gambaran umum tentang kemampuan ini dan fitur lainnya yang memastikan tercapainya tingkat aksesibilitas yang tinggi.

Administrasi

OpDB Cloudera menyediakan beberapa alat dan fitur administrasi untuk mengelola beban kerja OpDB Anda. Administrator dapat menerapkan OpDB sebagai penawaran semi-terkelola yang sepenuhnya aman di CDP Public Cloud – Data Hub dan sebagai penawaran yang sepenuhnya dapat disesuaikan di Pusat Data CDP (mirip dengan apa yang tersedia di CDH dan HDP). Artikel ini memberi Anda gambaran umum tingkat tinggi tentang fitur dan alat apa saja yang didukung untuk mengelola OpDB di CDP.

Manajemen

OpDB Cloudera menyediakan alat manajemen yang membantu Anda mengelola beban kerja OpDB secara efektif. Artikel ini memberi Anda gambaran umum tentang alat dan fitur pengelolaan OpDB di CDP.

Ketersediaan

OpDB Cloudera mempertahankan tingkat ketersediaan data yang tinggi, memastikan data yang diperlukan dapat diakses kapan dan di mana diperlukan, bahkan jika terjadi kegagalan node. Artikel ini memberikan ikhtisar fitur yang memungkinkan ketersediaan tingkat tinggi, seperti Ketersediaan Tinggi, Replikasi Data, dan Perlindungan Kesalahan yang siap pakai.

Integritas

OpDB Cloudera menyediakan berbagai kemampuan integritas data termasuk integritas entitas dan domain, transaksi ACID, dan integritas nonrelasional. Artikel ini memberikan gambaran umum tentang kemampuan integritas data OpDB.

Dukungan Aplikasi

OpDB Cloudera mendukung berbagai bahasa, kerangka kerja, dan aplikasi populer yang dapat Anda gunakan untuk mengakses data yang tersimpan di OpDB Anda. Artikel ini memberikan gambaran umum tentang bahasa, kerangka kerja, dan aplikasi yang didukung.

NoSQL dan Kemampuan Terkait

Karena Cloudera's OpDB menyertakan database NoSQL HBase untuk menyimpan data, OpDB memiliki kemampuan NoSQL, seperti nilai kunci, kemampuan gaya tabel, dan tipe data yang fleksibel. Integrasi ketat di seluruh ekosistem Hadoop juga disediakan, termasuk HDFS, Spark, dan Kafka. Artikel ini memberikan gambaran umum tentang kemampuan ini.

Skalabilitas

OpDB Cloudera dirancang untuk skalabilitas tinggi, mendukung skalabilitas vertikal dan horizontal dengan tipe data yang fleksibel dan tanpa batasan ukuran data. Artikel ini memberikan ikhtisar tentang fitur dan alat terkait skalabilitas yang didukung.

Keamanan

OpDB Cloudera menyediakan beberapa solusi keamanan di berbagai tingkat, terkait enkripsi, autentikasi, otorisasi, dan audit. Artikel ini memberikan ikhtisar tentang fitur dan alat terkait keamanan ini.

Untuk informasi lebih lanjut, silakan kunjungi:Memulai Basis Data Operasional.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Peningkatan HBase di atas Sumber Acara dan arsitektur CQRS dalam 3 minggu

  2. Pengodean Penghapusan HDFS dalam Hadoop Data Besar

  3. Spark-on-HBase:konektor HBase berbasis DataFrame

  4. Membuat Standar Terbuka:Tata Kelola Pembelajaran Mesin menggunakan Apache Atlas

  5. Pengantar Cache Terdistribusi di Hadoop