Database
 sql >> Teknologi Basis Data >  >> RDS >> Database

ScyllaDB Trends – Bagaimana Pengguna Menyebarkan Basis Data Besar Real-Time

ScyllaDB adalah penyimpanan data NoSQL terdistribusi open-source, diimplementasikan kembali dari database Apache Cassandra yang populer. Dirilis hanya empat tahun yang lalu pada tahun 2015, Scylla memiliki rata-rata lebih dari 220% pertumbuhan tahun-ke-tahun dalam popularitas menurut DB-Engine. Kami telah mendengar banyak tentang basis data yang meningkat ini dari komunitas DBA dan pengguna kami, dan memutuskan untuk menjadi sponsor Scylla Summit tahun ini untuk mempelajari lebih lanjut tentang tren penerapan dari penggunanya. Dalam postingan ini, kami membagi cloud ScyllaDB vs. penerapan di lokasi, penyedia cloud paling populer, database SQL dan NoSQL yang digunakan dengan ScyllaDB, tugas manajemen yang paling memakan waktu, dan mengapa Anda harus menggunakan ScyllaDB vs. Cassandra.

  • ScyllaDB vs. Cassandra
  • ScyllaDB Cloud vs. ScyllaDB Lokal
  • Penyedia Cloud Paling Populer untuk ScyllaDB
  • Database Paling Umum Digunakan dengan ScyllaDB
  • Tugas Manajemen ScyllaDB yang Paling Banyak Menghabiskan Waktu

ScyllaDB vs. Cassandra – Mana yang Lebih Baik?

Bertanya-tanya toko kolom lebar mana yang akan digunakan untuk penerapan Anda? Sementara Cassandra masih yang paling populer, ScyllaDB naik dengan cepat sebagai toko kolom lebar paling populer ke-7 menurut DB-Engines. Jadi apa beberapa alasan mengapa pengguna memilih ScyllaDB vs. Cassandra?

ScyllaDB menawarkan latensi yang jauh lebih rendah yang memungkinkan Anda memproses volume data yang tinggi dengan penundaan minimal. Faktanya, menurut laporan benchmark kinerja ScyllaDB, latensi persentil 99,9 mereka hingga 11X lebih baik daripada Cassandra pada bare metal AWS EC2. Jadi performa seperti ini harus dibayar, bukan? Memang, tetapi mereka mengklaim dalam laporan ini bahwa ini adalah pengurangan biaya 2,5X dibandingkan dengan menjalankan Cassandra, karena mereka dapat mencapai kinerja ini hanya dengan 10% node.

Ada lusinan artikel berkualitas di ScyllaDB vs. Cassandra, jadi kita akan berhenti di sini agar kita bisa mencapai tujuan sebenarnya dari artikel ini, memecah data pengguna ScyllaDB .

ScyllaDB Cloud vs. ScyllaDB Lokal

ScyllaDB dapat dijalankan di cloud publik dan lokal. Faktanya, ScyllaDB paling populer digunakan di cloud publik dan lingkungan lokal dalam satu organisasi. 44% penerapan ScyllaDB yang memanfaatkan cloud dan komputasi lokal dapat melalui lingkungan cloud hybrid yang memanfaatkan keduanya untuk aplikasi tertentu, atau menggunakan lingkungan ini secara terpisah untuk mengelola aplikasi yang berbeda.

Penerapan di lokasi ScyllaDB dan penerapan cloud ScyllaDB mati-bahkan pada masing-masing 28%. Anda dapat menjalankan ScyllaDB dan ScyllaDB Enterprise open source gratis di cloud atau di lokasi, dan lisensi ScyllaDB Enterprise mulai dari $28.8k/tahun dengan total 48 core.

Apa Cara Terbaik untuk Menyebarkan #ScyllaDB? Cloud vs. LokalKlik Untuk Tweet

Penyedia Cloud Paling Populer untuk ScyllaDB

Dengan 28% klaster ScyllaDB secara eksklusif diterapkan di cloud, dan 72% menggunakan cloud dalam beberapa kapasitas, kami tertarik untuk melihat penyedia cloud mana yang paling populer untuk beban kerja ScyllaDB .

#1. AWS

Kami menemukan bahwa 39,1% dari semua penerapan cloud ScyllaDB berjalan di AWS dari peserta survei kami. Meskipun kami mengharapkan AWS menjadi penyedia cloud #1 untuk ScyllaDB, persentasenya jauh lebih rendah daripada respons dari semua jenis database cloud dalam survei ini yang melaporkan 55% diterapkan di AWS. Jumlah ini lebih sesuai dengan Laporan Tren Basis Data Sumber Terbuka 2019 terbaru kami di mana 56,9% penerapan cloud dilaporkan berjalan di AWS. Ini mungkin karena AWS tidak mendukung ScyllaDB melalui Layanan Database Relasional (RDS), jadi kami dapat berhipotesis bahwa karena semakin banyak organisasi yang terus memigrasikan data mereka ke ScyllaDB, AWS mungkin mengalami penurunan basis pelanggan mereka.

#2. Google Cloud

Google Cloud Platform (GCP) adalah penyedia cloud terpopuler kedua untuk ScyllaDB, dengan jumlah 30,4% dari semua penerapan cloud. Google Cloud memang menawarkan penyimpanan kolom lebar dan database data besar mereka sendiri yang disebut Bigtable yang sebenarnya berada di peringkat #111, satu di bawah ScyllaDB di #110 di DB-Engine. Biaya rendah dan kemampuan kinerja tinggi ScyllaDB menjadikannya pilihan yang menarik bagi pengguna GCP, terutama karena ini adalah open source dibandingkan dengan Bigtable yang hanya tersedia secara komersial di GCP.

#3. Azure

Azure mengikuti di tempat ketiga yang mewakili 17,4% dari semua penerapan ScyllaDB di cloud dari responden survei kami. Azure adalah penyedia cloud yang menarik untuk organisasi yang memanfaatkan rangkaian layanan Microsoft.

Penyedia Cloud Mana yang Paling Populer untuk #ScyllaDB? AWS vs. Azure vs. GCPKlik Untuk Tweet

Sisa 13,0% penerapan cloud ScyllaDB ditemukan berjalan di layanan komputasi awan DigitalOcean, Alibaba, dan Tencent.

Layanan terkelola mereka, Scylla Cloud, saat ini hanya tersedia di AWS, dan Anda harus menggunakan versi ScyllaDB Enterprise untuk memanfaatkan DBaaS mereka. Scylla Cloud berencana untuk menambahkan dukungan untuk GCP dan Azure di masa mendatang, tetapi dengan hanya 39% pelaporan di AWS, kami dapat mengasumsikan lebih dari 60% penerapan ScyllaDB dikelola sendiri di cloud.

Database yang Paling Umum Digunakan dengan ScyllaDB

Seperti yang juga kami temukan dari Laporan Basis Data Sumber Terbuka 2019, organisasi rata-rata memanfaatkan 3,1 jenis basis data yang berbeda. Namun, dalam survei ini, organisasi yang menggunakan ScyllaDB dilaporkan hanya menggunakan rata-rata 2,3 jenis database yang berbeda, penurunan 26% dibandingkan dengan hasil kami dari semua pengguna database open source. Kami juga menemukan bahwa 39% penerapan ScyllaDB hanya menggunakan ScyllaDB, dan tidak memanfaatkan jenis database lain apa pun dalam aplikasi mereka.

Jadi, database mana yang paling sering digunakan bersama dengan ScyllaDB? Kami menemukan bahwa pengguna ScyllaDB juga menggunakan database SQL MySQL 20% dari waktu dan PostgreSQL 20% juga. Basis data kedua yang paling umum digunakan dengan ScyllaDB adalah Cassandra yang diwakili dalam 16% penerapan, dan kami dapat berasumsi bahwa ini adalah organisasi yang menguji ScyllaDB sebagai alternatif untuk Cassandra dalam aplikasi mereka karena kedua jenis basis data tersebut merupakan penyimpanan kolom yang luas.

MongoDB adalah database keempat yang paling populer digunakan dengan ScyllaDB sebesar 12%. Redis dan Elasticsearch berada di urutan kelima, keduanya memanfaatkan 8% dari waktu dengan penerapan ScyllaDB.

Kami juga menemukan 20% penerapan Scylla memanfaatkan jenis basis data lain, termasuk Oracle, Aerospike, Kafka (yang sekarang berubah menjadi basis data streaming acara), DB2, dan Tarantool.

Tugas Manajemen ScyllaDB yang Paling Banyak Menghabiskan Waktu

Kami tahu bahwa ScyllaDB sangat kuat, tetapi seberapa mudahkah menggunakannya? Kami bertanya kepada pengguna ScyllaDB apa tugas manajemen mereka yang paling memakan waktu, dan mendengar dari 28% bahwa Perbaikan Scylla adalah tugas manajemen terlama. Perbaikan Scylla adalah proses sinkronisasi yang berjalan di latar belakang untuk memastikan semua replika pada akhirnya menyimpan data yang sama. Pengguna harus menjalankan perintah perbaikan nodetool secara teratur, karena tidak ada cara untuk mengotomatiskan perbaikan di sumber terbuka ScyllaDB atau versi ScyllaDB Enterprise, tetapi Anda dapat menyiapkan jadwal perbaikan melalui Scylla Manager.

Analisis kueri lambat ScyllaDB mengaitkan pencadangan dan pemulihan ScyllaDB di posisi kedua dengan masing-masing 14% untuk tugas manajemen yang paling memakan waktu. Sepertinya ScyllaDB saat ini tidak memiliki penganalisis kueri yang tersedia untuk mengidentifikasi kueri yang perlu dioptimalkan, tetapi pengguna dapat menggunakan Pencatatan Kueri Lambat untuk melihat kueri mana yang memiliki waktu respons terlama. Pencadangan ScyllaDB juga tidak dapat diotomatisasi melalui sumber terbuka dan versi perusahaan, tetapi mereka menyatakan bahwa pencadangan berulang akan tersedia di edisi Scylla Manager mendatang. Juga tidak ada cara otomatis untuk memulihkan cadangan ScyllaDB, karena ini harus dilakukan secara manual di semua versi.

10% pengguna ScyllaDB melaporkan bahwa menambahkan, menghapus, atau mengganti node adalah tugas yang paling memakan waktu, menempati urutan keempat. Ini adalah proses manual yang dapat memakan waktu cukup lama, terutama jika Anda berurusan dengan ukuran data yang besar. Menambahkan node digunakan untuk memperkecil penerapan sambil menghapusnya akan menurunkan skala penerapan Anda. Node harus diganti jika down, atau mati, meskipun sebuah cluster masih dapat tersedia ketika lebih dari satu node down.

Peringkat kelima dengan 7% adalah peningkatan dan pemecahan masalah. ScyllaDB Enterprise dan open source keduanya memerlukan langkah ekstensif untuk meningkatkan klaster. Metode yang direkomendasikan adalah melalui prosedur bergulir sehingga tidak ada waktu henti, tetapi ini adalah proses manual sehingga pengguna harus menurunkan satu node pada satu waktu, melakukan semua langkah peningkatan, memulai ulang dan memvalidasi node sebelum melanjutkan untuk melakukan langkah yang sama untuk node yang tersisa di cluster. Memang memakan waktu, tapi untungnya bukan tugas harian! Pemecahan masalah tentu saja merupakan lubang besar untuk dipelajari, tetapi pelanggan ScyllaDB Enterprise menerima dukungan kritis misi 24/7, dan pengguna open source memiliki akses ke sejumlah besar sumber daya, termasuk dokumentasi, milis, Universitas Scylla, dan saluran slack untuk pengguna diskusi.

Apa Tugas Manajemen #ScyllaDB yang Paling Menghabiskan Waktu? Klik Untuk Tweet

Sisa 21% dari tugas yang memakan waktu yang dilaporkan oleh pengguna ScyllaDB meliputi pemantauan, migrasi, penyediaan, penyeimbangan pecahan, pemadatan, dan penambalan.

Jadi, bagaimana hasil ini dibandingkan dengan penerapan ScyllaDB Anda? Apakah Anda mencari cara untuk mengotomatiskan tugas-tugas manajemen yang memakan waktu ini? Meskipun saat ini kami mendukung Database MySQL, PostgreSQL, Redis™* dan MongoDB®, kami selalu mencari masukan tentang database mana yang akan ditambahkan dukungan untuk selanjutnya melalui paket DBaaS kami. Beri tahu kami di komentar atau di Twitter di @scalegridio jika Anda mencari cara yang lebih mudah untuk mengelola kluster ScyllaDB Anda di cloud atau lokal!


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Klausa SQL UNION untuk Pemula

  2. Kesalahan umum:Versi OS tidak cocok

  3. Pemangkasan waktu dari datetime – tindak lanjut

  4. Tabel Referensi SQL:Cara Membuat dan Menulis Query Dasar

  5. Bongkar Database Sangat Besar