Cloudera Data Platform (CDP) Data Center adalah platform data lengkap yang menyatukan analitik open-source terbaru – Spark, Impala, Hive, HBase, Kafka, Hadoop, dan banyak lagi – ke dalam analitik multi-fungsi dan sistem manajemen data yang menampilkan:
- Analisis SQL berkinerja lebih tinggi
- Pemrosesan dan pengelolaan streaming waktu nyata
- Kontrol akses berbasis atribut granular
- Pemfilteran kolom dinamis dan penyembunyian baris
- Peningkatan skalabilitas file dan objek 10x lipat
Saya menggunakan modul Terraform (v0.12) yang menerapkan Pusat Data CDP di Oracle Cloud Infrastructure (OCI).
Template ini memiliki dukungan untuk menargetkan VCN/Subnet yang ada untuk penerapan cluster. Untuk menggunakan fungsi ini, cukup gunakan sistem menu skema untuk memilih target VCN yang ada, lalu pilih subnet yang sesuai untuk setiap jenis host cluster.
1. Unduh file zip untuk penerapan Cloudera Terraform dengan Resource Manager .
2. Masuk ke Oracle Cloud Infrastructure (OCI)
3. Pilih Pengelola Sumber Daya dan klik Tumpukan
4. Klik Buat Tumpukan .
5. Pada Informasi Tumpukan halaman unggah file zip yang Anda unduh pada langkah 1 lalu klik Berikutnya .
6. Pada Konfigurasikan Variabel halaman, masukkan konten "kunci yang disediakan SSH" (opsional). Catatan:Jika Anda menerapkan Cloudera Manager ke subnet pribadi, Anda akan memerlukan VPN atau SSH Tunnel melalui Edge Node untuk mengakses manajemen cluster. Saat membuat VPC, Anda harus menentukan rentang alamat IPv4 untuk VPC dalam bentuk blok Classless Inter-Domain Routing (CIDR) misalnya 10.0.0.0/16. Klik Berikutnya .
7. Verifikasi konfigurasi Anda dan Klik Buat.
9. Dari Tindakan Terraform pilih menu Rencana
10. Klik Rencanakan
11. Tunggu beberapa saat hingga pekerjaan ini selesai.
12. Terraform telah berhasil diinisialisasi.
13. Pekerjaan selesai Berhasil
14. Diagram yang menunjukkan apa yang biasanya digunakan menggunakan template ini. Sumber daya tersebut didistribusikan secara otomatis di antara “Domain Kesalahan” dalam “Domain Ketersediaan” untuk memastikan toleransi kesalahan.
Referensi
Pelajari tentang men-deploy Hadoop di Oracle Cloud Infrastructure. Tersedia di https://docs.Oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Deploy Hadoop dengan Mudah di Infrastruktur Cloud Oracle Menggunakan Resource Manager. Tersedia di https://blogs.Oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-Oracle-cloud-infrastructure-using-resource-manager
Cloudera di Oracle Cloud Infrastructure (template penerapan Terraform). Tersedia di https://github.com/Oracle-quickstart/oci-cloudera
Sekilas tentang Manajer Sumber Daya. Tersedia di https://docs.cloud.Oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
Pusat Data CDP. Tersedia di https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html