Cloudera Manager 4.7 menambahkan dukungan untuk mengelola Cloudera Search 1.0. Dengan demikian, pengguna Cloudera Manager dapat dengan mudah menerapkan semua komponen Cloudera Search (termasuk Apache Solr) dan mengelola semua layanan terkait, sama seperti setiap layanan lain yang disertakan dalam CDH (distribusi Cloudera untuk Apache Hadoop dan proyek terkait).
Dalam panduan ini, Anda akan mempelajari langkah-langkah yang terlibat dalam menambahkan Cloudera Search ke cluster Cloudera Enterprise (CDH + Cloudera Manager).
Memasang Paket SOLR
Dalam contoh kami, cluster menggunakan paket CDH 4.4 dan menjalankan layanan Apache ZooKeeper, HDFS, dan Apache HBase. (Paket adalah cara yang sangat berguna untuk menerapkan perangkat lunak baru dan melakukan peningkatan yang mudah melalui Cloudera Manager.)
Jika Anda ingin mengunduh paket SOLR langsung dari Cloudera, Anda dapat menggunakan pengaturan default untuk “URL Repositori Paket Jarak Jauh” (di bawah Paket bagian di tab Administrasi) seperti yang ditunjukkan di bawah ini:
Menyetel URL repositori Parcel
Jika Anda ingin menggunakan repositori lokal (yaitu, pertama-tama unduh paket dari Cloudera dan kemudian instal dari salinan lokal), Anda dapat mengikuti instruksi di sini. Langkah selanjutnya adalah “Download”, “Distribute”, dan “Aktifkan” parsel dari halaman Parcels pada tab Hosts.
Menerapkan paket SOLR
Setelah paket diaktifkan, Anda memiliki semua komponen Pencarian Cloudera (Solr, Lily HBase Indexer, dan Morphlines Sink Apache Flume) yang siap digunakan bersama dengan CDH.
Langkah selanjutnya adalah menambahkan layanan Apache Solr ke cluster Anda. Di menu "Tindakan" cluster Anda pada tab Layanan, pilih "Tambah Layanan", yang akan membawa Anda ke "Tambahkan Layanan Wizard" di Cloudera Manager. Setelah Anda mengikuti langkah-langkah di wizard dan memilih di mana server Solr harus dijalankan, Anda akan mendarat di halaman alur kerja yang akan menginisialisasi layanan Solr dan memulai semua server Solr.
Menyiapkan dan menjalankan layanan Solr
Itu saja — layanan Solr sekarang siap digunakan! Ikuti petunjuk di Panduan Pengguna Cloudera Search untuk membuat koleksi dan menambahkan dokumen ke dalamnya untuk pengindeksan. Tangkapan layar di bawah menunjukkan cara membuat koleksi menggunakan skema Solr default.
Membuat koleksi pertama
Menambahkan Pengindeks Lily HBase
Cloudera Manager 4.7 juga menyediakan dukungan untuk Lily HBase Indexer yang disertakan dengan paket SOLR. Layanan Pengindeks Lily HBase adalah sistem yang fleksibel, dapat diskalakan, toleran terhadap kesalahan, transaksional, hampir real-time untuk memproses aliran pembaruan sel HBase yang berkelanjutan ke dalam indeks pencarian langsung. Untuk menggunakannya, tambahkan layanan “Pengindeks Keystore” melalui “Add Service Wizard”.
Sebelum Anda dapat menggunakan Lily HBase Indexer, Anda perlu memastikan bahwa replikasi dan pengindeksan diaktifkan di layanan HBase di cluster. Anda dapat mengubah properti ini di halaman konfigurasi layanan HBase di bawah bagian “Cadangan”.
Menyetel properti HBase untuk Lily HBase Indexer
Perhatikan juga bahwa Cloudera Manager menyertakan file Cloudera Morphlines default yang dapat digunakan oleh Lily HBase Indexer. Untuk memodifikasi file tersebut untuk menggunakan fungsi Anda sendiri, Anda harus menavigasi ke layanan Keystore Indexer dan memodifikasi konfigurasi Morphlines seperti yang ditunjukkan di bawah ini:
Mengedit Morflin Cloudera untuk Pengindeks Lily HBase
Setelah perubahan ini dibuat, Anda dapat mulai menggunakan Lily HBase Indexer untuk mengindeks data apa pun yang masuk ke HBase dengan mengikuti petunjuk di Panduan Pengguna Lily HBase Indexer . Postingan blog ini juga memberikan contoh yang bagus tentang cara mengindeks email menggunakan HBase dan Cloudera Search.
Kesimpulan
Sekarang Anda tahu betapa mudahnya menerapkan, mengonfigurasi, dan mengelola layanan Cloudera Search ke klaster CDH Anda menggunakan Cloudera Manager. Dimulai dengan Cloudera Enterprise 5 (dalam versi beta pada saat penulisan), Cloudera Search dan pengindeks Lily HBase akan menginstal dan memulai secara default – membuat proses ini semakin mudah.
Vikram Srivastava adalah Software Engineer di Cloudera.