Basis data pembelajaran mesin sekarang sudah dewasa. Ini menghadirkan peluang besar bagi para profesional basis data yang mampu berevolusi untuk memanfaatkan perubahan ini.
Saat ini profesional basis data, misalnya administrator basis data (DBA) dan pengembang basis data adalah beberapa posisi terpenting dalam organisasi TI mana pun. Seorang profesional database bertanggung jawab untuk membuat, mengelola, dan menyediakan akses terkontrol ke database. Memiliki orang yang tepat sebagai DBA dapat membantu perusahaan menghemat waktu dan mempersingkat waktu pengembangan aplikasi. Namun, dengan meningkatnya akses ke sejumlah besar data, tanggung jawab profesional database berkembang pesat.
Beberapa teknologi telah dikembangkan yang dapat digunakan untuk tidak hanya mengelola dan mengeksplorasi data tetapi dapat membantu membuat keputusan yang tepat berdasarkan data. Pembelajaran mesin adalah salah satu teknologi yang mengalami lonjakan besar dalam dekade terakhir. Artikel ini memberikan gambaran singkat tentang bagaimana pembelajaran mesin dapat memengaruhi profesi basis data, dan apa keuntungan memiliki pembelajaran mesin sebagai seperangkat keterampilan.
Apa itu Pembelajaran Mesin?
Pembelajaran mesin adalah proses memahami dan mengekstraksi pola yang berguna dari data dengan bantuan berbagai algoritma statistik. Pembelajaran mesin dibagi lagi menjadi teknik pembelajaran yang diawasi dan tidak diawasi. Pembelajaran mesin saat ini digunakan untuk memecahkan banyak masalah kompleks seperti mengklasifikasikan email ham dan spam, prediksi harga rumah, pembuatan puisi, klasifikasi gambar, dan sebagainya.
Apakah Machine Learning akan Menggantikan Profesi Database?
Salah satu kesalahpahaman paling umum tentang pembelajaran mesin adalah bahwa itu akan menggantikan manusia di banyak pekerjaan. Meskipun ini mungkin benar untuk beberapa tugas yang berulang, AI dan pembelajaran mesin pada dasarnya akan melengkapi otak manusia, bukan menggantikannya. Untuk profesional basis data, basis data pembelajaran mesin tidak akan menggantikannya, melainkan akan sangat membantu mereka.
Ini akan memungkinkan para profesional database untuk lebih fokus pada perencanaan dan tugas-tugas strategis, karena akan mengotomatiskan tugas-tugas yang lebih membosankan dan otonom seperti instalasi, konfigurasi, dan pembaruan basis data reguler. Oleh karena itu, alih-alih mengkhawatirkan dampak pembelajaran mesin pada pekerjaan mereka, profesional basis data harus menerimanya sebagai cara untuk menyelesaikan tugas yang tidak terlalu menantang dengan lebih cepat dan efisien. .
Menangani Big Data adalah Tantangan
Karena munculnya web di seluruh dunia selama dua dekade terakhir, data tersedia dalam segala bentuk dan ukuran. Faktanya, istilah big data sering digunakan untuk kumpulan data yang sangat besar volumenya, datang dengan kecepatan tinggi dan berisi berbagai konten.
Menangani sejumlah besar data tidak terstruktur seperti itu telah menjadi tantangan bagi DBA. Algoritme yang dijalankan pada database pembelajaran mesin telah terbukti berfungsi dengan baik dengan data yang tidak terstruktur juga. Sejumlah besar data dapat dengan mudah dipecah menjadi informasi yang bermakna melalui teknik pembelajaran mesin yang menyoroti kebutuhan profesional database untuk memperoleh keterampilan pembelajaran mesin.
Database Machine Learning Ada Di Sini
Perusahaan seperti Microsoft dan Oracle sudah mulai menggabungkan kemampuan pembelajaran mesin yang berbeda ke dalam database. Misalnya, Microsoft Azure SQL Database memiliki modul yang menyarankan dan merekomendasikan berbagai strategi peningkatan kinerja yang dapat diterapkan secara otomatis. Demikian pula, Penyimpanan Kueri SQL Server menyediakan rencana untuk mengidentifikasi kueri yang menyebabkan kemacetan kinerja. Database Oracle 18c berisi kemampuan self-healing dan dapat menerapkan self-patches dan upgrade setiap kali terjadi masalah database. Pengetahuan yang baik tentang pembelajaran mesin sebenarnya membantu pengembang basis data memahami alasan di balik berbagai rekomendasi yang dibuat oleh alat basis data pembelajaran mesin.
Kemunculan Basis Data Otonom Sepenuhnya
Basis data pembelajaran mesin saat ini memiliki kemampuan yang terbatas. Fokus penelitian saat ini adalah untuk mengembangkan database yang sepenuhnya otomatis. Bukankah lebih baik memiliki database yang dapat mengantisipasi masalah yang akan terjadi dan cukup proaktif untuk mengambil tindakan pencegahan terlebih dahulu? Atau tidakkah ini akan membuat kehidupan seorang profesional database menjadi lebih mudah jika database membuat cadangan sendiri secara otomatis setiap kali transaksi penting terjadi? Ada banyak skenario di mana database pembelajaran mesin sangat berguna.
Misalnya, database yang ada melakukan pencadangan otomatis pada waktu tertentu tetapi tidak semua transaksi database layak untuk didukung. Dalam skenario semacam ini, database pembelajaran mesin bisa menjadi cukup pintar untuk mengetahui kapan harus mencadangkan dan kapan tidak mencadangkan.
Selain itu, banyak masalah database dapat diantisipasi sebelumnya. Misalnya, dalam skenario di mana banyak pengguna mengakses sumber daya database yang berbeda, kemungkinan kebuntuan meningkat berlipat ganda. Jika ini terjadi, database pembelajaran mesin dapat beralih ke penyediaan akses terkontrol ke sumber daya dan menghindari kebuntuan.
Ada beberapa kelompok penelitian akademis yang telah mencoba mengembangkan database yang sepenuhnya otonom.
Grup Riset Basis Data Carnegie Mellon telah mengembangkan proyek OtterTune yang menggunakan teknik pembelajaran mesin dan data beban kerja dari sejumlah besar database lama untuk membuat model yang mampu menyesuaikan beban kerja baru secara otomatis. Basis data pembelajaran mesin OtterTune juga secara otomatis merekomendasikan pengaturan optimal untuk peningkatan throughput dan pengurangan latensi untuk aplikasi basis data baru.
MIT juga telah mengembangkan kerangka kerja manajemen basis data sumber terbuka yang disebut DBSee r yang memprediksi kinerja untuk kumpulan sumber daya database tertentu dan juga mengidentifikasi hambatan kinerja.
Kurva Pembelajaran
Pembelajaran mesin sering didefinisikan sebagai persimpangan ilmu komputer dan statistik. Siapa pun yang memiliki pengetahuan ilmu komputer dapat dengan relatif cepat membangun keterampilan pembelajaran mesin mereka ke tingkat menengah jika mereka mengembangkan pemahaman statistik yang masuk akal.
Banyak alat GUI dan platform cloud seperti Google AI, IBM Watson, Amazon Sagemaker, Azure ML telah menyederhanakan proses penerapan teknik pembelajaran mesin dengan menyediakan antarmuka seret dan lepas berbasis GUI untuk database pembelajaran mesin. Pengguna hanya perlu mengetahui cara menggunakan alat karena sebagian besar pekerjaan (menambahkan kumpulan data, memilih teknik pra-pemrosesan, melatih model, dan terakhir mengevaluasi model) dapat dilakukan dengan beberapa klik mouse.
Jika seorang profesional database benar-benar ingin membangun karir dalam pembelajaran mesin tingkat lanjut, namun mereka perlu membangun pemahaman statistik yang menyeluruh. Latar belakang ilmu komputer dari seorang profesional database akan lebih dari cukup untuk memahami konsep pembelajaran mesin terkait CS dengan cepat.
Namun, seperti yang kami katakan di atas, jika seorang profesional basis data hanya tertarik menggunakan pembelajaran mesin untuk mengotomatiskan tugas yang berulang, pengetahuan tentang alat pembelajaran mesin berbasis GUI akan lebih dari cukup.
Jalur Karir Beragam
Keberhasilan pembelajaran mesin dan kecerdasan buatan telah mendorong organisasi untuk mengembangkan tim ilmu data khusus yang berisi pakar pembelajaran mesin yang terampil.
Saat ini, pakar pembelajaran mesin dan profesional basis data memiliki jalur karier yang berbeda, namun semakin banyak organisasi yang mengharapkan pakar pembelajaran mesin atau ilmu data memiliki tingkat keahlian basis data tertentu, dan sebaliknya.
Mengingat bahwa saat ini sedang berubah, profesional basis data dengan pengetahuan keterampilan pembelajaran mesin lebih disukai dan memiliki peluang lebih baik untuk dipekerjakan sebagai profesional basis data, atau pakar pembelajaran mesin, atau seseorang dengan kedua tanggung jawab pekerjaan tersebut.
Putusan Akhir
Munculnya data besar dan teknik pembelajaran mesin terkait kemungkinan akan membawa perubahan substansial dalam tanggung jawab pekerjaan profesional basis data karena fokus mereka akan beralih ke data dari basis data, karena basis data pembelajaran mesin semakin mengelola diri mereka sendiri.
Pembelajaran mesin akan membantu profesional database mengotomatiskan banyak tugas manual dan melelahkan, dan membebaskan mereka untuk menginvestasikan waktu dan upaya untuk merangkul keterampilan pembelajaran mesin dan menggunakannya.
Mempelajari statistik yang diperlukan untuk berkembang dari profesional basis data menjadi basis data yang lebih luas dan pembelajaran mesin tidak mudah, tetapi akan memberikan keuntungan besar dalam hal pertumbuhan dan peluang karier.