Di blog kami sebelumnya, kami telah mempelajari Hadoop HDFS secara rinci, sekarang di blog ini, kita akan membahas fitur-fitur HDFS. Hadoop HDFS memiliki fitur seperti Toleransi Kesalahan, Replikasi, Keandalan, Ketersediaan Tinggi, Penyimpanan Terdistribusi, Skalabilitas, dll.
Semua fitur HDFS di Hadoop ini akan dibahas dalam tutorial HDFS Hadoop ini.
Pengantar Hadoop HDFS
Sistem file terdistribusi Hadoop (HDFS) adalah sistem penyimpanan utama Hadoop. Ini menyimpan file yang sangat besar yang berjalan pada sekelompok perangkat keras komoditas. HDFS didasarkan pada GFS (Google FileSystem). Ini menyimpan data dengan andal bahkan jika terjadi kegagalan perangkat keras.
HDFS juga menyediakan akses throughput tinggi ke aplikasi dengan mengakses secara paralel. Menurut prediksi pada akhir tahun 2017, 75% dari data yang tersedia di planet ini akan berada di HDFS.
6 Fitur Penting HDFS
Setelah mempelajari pengenalan Hadoop HDFS, sekarang mari kita bahas fitur terpenting dari HDFS.
1. Toleransi Kesalahan
Toleransi kesalahan di Hadoop HDFS adalah kekuatan kerja sistem dalam kondisi yang tidak menguntungkan. Ini sangat toleran terhadap kesalahan. Kerangka kerja Hadoop membagi data menjadi blok-blok. Setelah itu buat beberapa salinan blok pada mesin yang berbeda di dalam cluster.
Jadi, ketika ada mesin di cluster yang down, maka klien dapat dengan mudah mengakses data mereka dari mesin lain yang berisi salinan blok data yang sama.
2. Ketersediaan Tinggi
Hadoop HDFS adalah sistem file yang sangat tersedia. Di HDFS, data direplikasi di antara node dalam cluster Hadoop dengan membuat replika blok pada slave lain yang ada di cluster HDFS. Jadi, kapan pun pengguna ingin mengakses data ini, mereka dapat mengakses datanya dari slave yang berisi bloknya.
Pada saat situasi yang tidak menguntungkan seperti kegagalan sebuah node, pengguna dapat dengan mudah mengakses data mereka dari node lain. Karena salinan blok duplikat ada di node lain di cluster HDFS.
3. Keandalan Tinggi
HDFS menyediakan penyimpanan data yang andal. Itu dapat menyimpan data dalam kisaran 100-an petabyte. HDFS menyimpan data dengan andal di sebuah cluster. Ini membagi data menjadi blok. Kerangka kerja Hadoop menyimpan blok-blok ini pada node yang ada di cluster HDFS.
HDFS menyimpan data dengan andal dengan membuat replika dari setiap blok yang ada di cluster. Oleh karena itu menyediakan fasilitas toleransi kesalahan. Jika node dalam cluster yang berisi data down, maka pengguna dapat dengan mudah mengakses data tersebut dari node lain.
HDFS secara default membuat 3 replika dari setiap blok yang berisi data yang ada di node. Jadi, data dengan cepat tersedia untuk pengguna. Oleh karena itu pengguna tidak menghadapi masalah kehilangan data. Dengan demikian, HDFS sangat andal.
4. Replikasi
Replikasi Data adalah fitur unik dari HDFS. Replikasi memecahkan masalah kehilangan data dalam kondisi yang tidak menguntungkan seperti kegagalan perangkat keras, kerusakan node, dll. HDFS mempertahankan proses replikasi pada interval waktu yang teratur.
HDFS juga terus membuat replika data pengguna pada mesin berbeda yang ada di cluster. Jadi, ketika ada node yang down, pengguna dapat mengakses data dari mesin lain. Dengan demikian, tidak ada kemungkinan kehilangan data pengguna.
5. Skalabilitas
Hadoop HDFS menyimpan data pada beberapa node dalam cluster. Jadi, setiap kali persyaratan meningkat, Anda dapat menskalakan klaster. Dua mekanisme skalabilitas tersedia di HDFS:Vertikal dan Skalabilitas Horizontal.
6. Penyimpanan Terdistribusi
Semua fitur dalam HDFS dicapai melalui penyimpanan dan replikasi terdistribusi. HDFS menyimpan data secara terdistribusi di seluruh node. Di Hadoop, data dibagi menjadi beberapa blok dan disimpan di node yang ada di cluster HDFS.
Setelah itu HDFS membuat replika dari setiap blok dan menyimpannya di node lain. Ketika satu mesin di cluster mengalami crash, kami dapat dengan mudah mengakses data kami dari node lain yang berisi replikanya.
Kesimpulan
Kesimpulannya, kita dapat mengatakan, HDFS sangat toleran terhadap kesalahan. Ini andal menyimpan sejumlah besar data meskipun kegagalan perangkat keras. Ini juga menyediakan skalabilitas tinggi dan ketersediaan tinggi. Karenanya HDFS memberdayakan fungsionalitas Hadoop. Jika Anda menemukan fitur HDFS lainnya, silakan bagikan dengan kami di bagian komentar di bawah.