Data Besar
Data Besar menggambarkan volume besar data, baik terstruktur atau tidak terstruktur, yang membanjiri bisnis setiap hari. Big Data menangani cara untuk menganalisis, mengekstrak informasi dari, atau menangani kumpulan data yang terlalu besar atau rumit untuk ditangani oleh perangkat lunak pemrosesan data biasa.
Data besar memiliki karakteristik sebagai berikut:
- Volume: Jumlah data yang dihasilkan dan disimpan
- Variasi: Jenis dan sifat data
- Kecepatan: Kecepatan data dihasilkan dan diproses
- Kebenaran: Kualitas data dan nilai data
Pengaruh Azure pada Data Besar
Microsoft Azure mengubah data menjadi wawasan yang dapat ditindaklanjuti dengan menggunakan alat pembelajaran mesin. Ini memungkinkan Anda untuk menggabungkan data apa pun dalam skala apa pun, dan untuk membangun serta menerapkan model pembelajaran mesin dalam skala besar.
Dengan produk Azure berikut, analitik tingkat lanjut dapat dilakukan pada Big Data:
- Gudang Data SQL
- Pabrik Data
- Penyimpanan BLOB Azure
- Brick Data Biru
- Azure Cosmos DB
- Power BI
Mari kita lihat satu per satu.
Gudang Data SQL
SQL Data Warehouse adalah EDW (Enterprise Data Warehouse) berbasis Cloud yang menggunakan Massively Parallel Processing (sejumlah besar prosesor yang melakukan serangkaian komputasi secara paralel) untuk menjalankan kueri kompleks di seluruh petabyte data.
Anda cukup mengimpor data besar ke SQL Data Warehouse dengan kueri T-SQL PolyBase (kueri yang membaca data dari Hadoop), lalu, dengan kekuatan MPP, jalankan analitik performa tinggi. Gudang data kemudian akan menjadi satu-satunya versi kebenaran yang dapat Anda andalkan untuk wawasan.
Pabrik Data
Data Factory adalah layanan integrasi data Cloud yang menyusun layanan penyimpanan, pergerakan, dan pemrosesan data ke dalam saluran data otomatis. Azure Data Factory adalah layanan integrasi data hibrid yang memungkinkan Anda membuat, menjadwalkan, dan mengatur alur kerja ETL/ELT (Extract, Transform, Load).
Penyimpanan BLOB Azure
Penyimpanan Azure BLOB adalah penyimpanan objek yang sangat skalabel untuk dokumen, gambar, video, dan audio yang tidak terstruktur. Penyimpanan Azure BLOB dioptimalkan untuk menyimpan sejumlah besar data tidak terstruktur (data yang tidak mengikuti model atau definisi data tertentu), seperti teks atau data biner, misalnya.
Penyimpanan Azure BLOB memiliki fungsi berikut:
- Menyajikan dokumen atau gambar langsung ke browser
- Menyimpan file untuk akses terdistribusi
- Streaming audio dan video
- Menulis ke log file
- Menyimpan data untuk pemulihan bencana, pencadangan dan pemulihan, serta pengarsipan
Azure Databricks
Azure Databricks adalah platform analitik berbasis Apache Spark yang mudah, cepat, dan kolaboratif (kerangka kerja komputasi klaster tujuan umum terdistribusi sumber terbuka, yang menyediakan antarmuka untuk klaster pemrograman dengan paralelisme data implisit) platform analitik.
Azure Cosmos DB
Azure Cosmos DB adalah layanan database yang didistribusikan secara global. Ini dirancang untuk memberikan latensi rendah, skalabilitas throughput yang elastis, semantik yang terdefinisi dengan baik untuk konsistensi data, dan ketersediaan tinggi.
Power BI
Power BI adalah rangkaian alat analisis bisnis yang memberikan wawasan. Power BI memungkinkan Anda terhubung ke sejumlah sumber data, menyederhanakan persiapan data, mendorong analisis ad hoc, serta menghasilkan laporan untuk digunakan di Web dan di seluruh perangkat seluler.
Kesimpulan
Big Data telah berevolusi, dan terus berkembang. Dengan bantuan alat Azure, Big Data menjadi semakin mudah dikelola.