Database
 sql >> Teknologi Basis Data >  >> RDS >> Database

Visualisasi Data Menggunakan Apache Zeppelin – Tutorial

Di dunia saat ini, data dihasilkan dengan kecepatan eksponensial, sedemikian rupa sehingga para analis memperkirakan pembuatan data global kami akan meningkat 10x lipat pada tahun 2025. Bisnis kini mengumpulkan data di setiap sistem internal dan sumber eksternal yang memengaruhi perusahaan mereka; dan dengan itu muncul kebutuhan yang terus berkembang untuk menganalisis data untuk mendapatkan wawasan tentang bagaimana hal itu dapat digunakan untuk meningkatkan dan meningkatkan keputusan bisnis mereka. Apache Zeppelin, platform analisis dan visualisasi data open source, dapat membawa kita jauh untuk mencapai tujuan tersebut.

Dalam artikel ini, Anda akan mempelajari cara menambahkan juru bahasa khusus untuk MongoDB dan MySQL serta cara menggunakannya untuk membuat kueri dan memvisualisasikan data koleksi. Pertama, mari kita mulai dengan ikhtisar Apache Zeppelin dan set fiturnya:

Apa itu Apache Zeppelin?

Apache Zeppelin adalah “notebook” open-source berbasis web yang memungkinkan analitik data interaktif dan dokumen kolaboratif. Notebook ini terintegrasi dengan sistem pemrosesan data tujuan umum terdistribusi seperti Apache Spark (pemrosesan data skala besar), Apache Flink (framework pemrosesan streaming), dan banyak lainnya. Apache Zeppelin memungkinkan Anda membuat dokumen interaktif yang indah, berdasarkan data, dengan SQL, Scala, R, atau Python langsung di browser Anda.

Fitur Apache Zeppelin

Antarmuka Interaktif

Apache Zeppelin memiliki antarmuka interaktif yang memungkinkan Anda melihat hasil analisis secara instan dan langsung terhubung dengan kreasi Anda:

Buku Catatan Peramban

Buat buku catatan yang berjalan di browser Anda (baik di mesin Anda dan dari jarak jauh) dan eksperimen dengan berbagai jenis diagram untuk menjelajahi kumpulan data Anda:

Integrasi

Integrasikan dengan banyak open source yang berbeda, alat data besar seperti proyek Apache Spark, Flink, Hive, Ignite, Lens, dan Tajo.

Bentuk Dinamis

Buat formulir masukan secara dinamis langsung di buku catatan Anda.

Kolaborasi &Berbagi

Komunitas developer yang beragam dan dinamis memberi Anda akses ke sumber data baru yang terus ditambahkan dan didistribusikan melalui lisensi Apache 2.0 open source mereka.

Penerjemah

Konsep penerjemah Apache Zeppelin memungkinkan setiap bahasa/pemrosesan data-backend dicolokkan ke Zeppelin. Saat ini, Apache Zeppelin mendukung banyak interpreter seperti Apache Spark, Python, JDBC, Markdown, dan Shell.

Sekarang, mari mulai membuat juru bahasa khusus Anda untuk MongoDB dan MySQL.

Tambahkan Penerjemah MySQL

Di platform Apache Zeppelin, buka menu tarik-turun di kanan atas dan klik Interpreter:

Di sinilah Anda dapat menemukan daftar semua juru bahasa. Kita perlu membuat yang baru untuk MySQL, jadi klik tombol “Buat” di sudut kanan atas:

Masukkan nama yang dapat dikenali untuk penerjemah (mis. mysql), dan pilih grup sebagai JDBC:

Simpan semua opsi default, tetapi masukkan detail yang diperlukan dan pastikan koneksi ke server MySQL Anda telah dibuat:

Kita juga perlu menambahkan artefak khusus ke JAR konektor MySQL sehingga Zeppelin tahu dari mana harus menjalankannya. Unduh konektor di sini, letakkan di folder interpreter/jdbc, lalu berikan jalur yang tepat ke artefak:

Dan itu saja! Untuk menguji penerjemah kami, kami perlu membuat catatan baru. Tapi pertama-tama, mari kita siapkan juga penerjemah MongoDB kita.

Tambahkan Juru Bahasa MongoDB

Kembali ke halaman Interpreter Anda dan klik tombol "Buat". Kami akan menggunakan penerjemah MongoDB sumber terbuka ini, jadi Anda selanjutnya harus mengunduh file .zip dan mengganti namanya menjadi .jar.

Setelah itu, buka interpreter/, buat folder mongodb/, dan paste .jar ke dalam folder tersebut.

Sekarang Anda memiliki grup Interpreter baru bernama mongodb. Buka halaman Interpreter Anda, masukkan nama yang ramah seperti mongodb, lalu pilih mongodb di bawah dropdown grup Interpreter.

Sekarang, mari masukkan detail cluster ScaleGrid MongoDB yang baru dibuat di “Properties” yang terdapat di halaman Detail Cluster di bawah bagian Ikhtisar / Mesin.

Dan kita selesai! Sekarang saatnya untuk menguji penerjemah kami yang baru dibuat.

Buat Catatan Zeppelin

Untuk menjalankan kueri yang akan membantu memvisualisasikan data kita, kita perlu membuat catatan. Dari panel header Zeppelin, klik “Notebook”, lalu “Create a new note”:

Pastikan header notebook menunjukkan status terhubung sebagai dilambangkan dengan titik hijau di pojok kanan atas:

Saat membuat catatan, Anda akan disajikan dengan dialog untuk memasukkan informasi lebih lanjut. Pilih penerjemah default sebagai mysql yang baru dibuat dan klik “Buat Catatan”.

Jalankan Kueri pada Catatan

Sebelum kita dapat menjalankan pertanyaan apa pun, kami juga perlu menyebutkan jenis juru bahasa yang akan kami gunakan untuk catatan kami. Kita dapat melakukannya dengan memulai catatan kita dengan “%mysql”. Ini akan memberi tahu Zeppelin untuk mengharapkan kueri MySQL dalam catatan itu.

Dan sekarang, kami siap untuk meng-query database kami. Untuk tujuan contoh ini, saya akan menggunakan instalasi WordPress saya yang berisi tabel wp_options khas untuk mengkueri dan memvisualisasikan datanya.

Berhasil! Sekarang Anda dapat mengeklik berbagai bagan untuk memvisualisasikan data dalam format grafik yang berbeda.

Demikian pula untuk MongoDB, pastikan Anda memiliki data di cluster MongoDB. Anda dapat menambahkan beberapa dengan membuka Tab Admin dan menjalankan kueri Mongo.

Berikut adalah contoh dari beberapa data MongoDB dalam catatan:

Bagikan Tautan ke Catatan Anda

Sekarang setelah data Anda siap untuk visualisasi dan kueri, Anda mungkin ingin memamerkannya kepada tim Anda. Anda dapat melakukannya dengan sangat mudah dengan membuat tautan yang dapat dibagikan ke catatan:

Tautan yang dapat dibagikan ini akan tersedia untuk dilihat siapa saja, dan Anda juga dapat memilih untuk membagikan tautan ke grafik tertentu saja:

Kesimpulan Apache Zeppelin

Apache Zeppelin adalah alat yang sangat membantu yang memungkinkan tim mengelola dan menganalisis data dengan banyak opsi visualisasi, tabel, dan tautan yang dapat dibagikan untuk kolaborasi. Berikut adalah beberapa tautan bermanfaat untuk membantu Anda memulai:

Unduh Apache Zeppelin

Penerjemah MongoDB

Konektor MySQL

Anda juga dapat menjelajahi cara lain untuk memvisualisasikan data Anda melalui GUI MongoDB, termasuk empat teratas:Kompas MongoDB, Robomongo, Studio 3T, dan MongoBooster.

Seperti biasa, jika Anda membuat sesuatu yang luar biasa, kirimkan tweet kepada kami tentangnya @scalegridio

Jika Anda memerlukan bantuan dengan hosting dan manajemen untuk Redis™*, hubungi kami di [email protected] untuk informasi lebih lanjut.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Menyajikan Makanan Lezat (dan Data) – Model Data untuk Restoran

  2. Game MMO dan Desain Basis Data

  3. Menggunakan Geekbench 3.2 Untuk Menguji Server Basis Data Besar

  4. Model Database untuk Sistem Reservasi Sekolah Mengemudi. Bagian 2

  5. Mengubah Bagaimana isql Mengeksekusi SQL