Database
 sql >> Teknologi Basis Data >  >> RDS >> Database

Pivoting, Unpivoting, dan Pemisahan Kolom di Power BI Query Editor

Sebagai referensi, Power BI adalah visualisasi data dan perangkat lunak analitik yang dikembangkan oleh Microsoft. Power BI dapat digunakan untuk visualisasi data statis maupun interaktif. Sebelum Anda dapat membuat visualisasi yang sebenarnya dengan Power BI, Anda dapat melakukan pra-pemrosesan data menggunakan editor Power BI Query.

Dengan editor kueri, Anda dapat melakukan berbagai tugas transformasi data, seperti mengubah jenis kolom, menangani nilai yang hilang, menghapus baris dan kolom, memutar dan melepas kolom, memisahkan kolom, dll.

Dalam artikel ini, Anda akan melihat cara melakukan pivot, unpivot, dan membagi kolom menggunakan editor Power BI Query.

Mengimpor Kumpulan Data ke Editor Kueri

Dataset yang digunakan sebagai contoh dalam artikel ini adalah dalam format file CSV yang dapat diunduh menggunakan tautan kaggle ini. Unduh file CSV ke sistem file lokal Anda.

Selanjutnya, buka Power BI Desktop, klik tombol "Dapatkan Data" dari menu atas. Dari daftar dropdown, pilih “Teks/CSV” seperti yang ditunjukkan di bawah ini.

Power BI akan memakan waktu lama untuk mengimpor data. Setelah data dimuat, Anda akan melihat jendela di bawah ini.

Dataset berisi informasi tentang Populasi, Luas, Angka Kelahiran, Angka Kematian, Kepadatan Penduduk, PDB Per kapita, Telepon per 1000, dll. untuk semua negara di dunia. Untuk memuat data ke editor kueri, klik tombol “Transformasi Data”.

Editor kueri terlihat seperti ini:

Di editor kueri, Anda dapat melakukan berbagai prapemrosesan seperti kolom pivoting, unpivoting, dan splitting.

Teori Pivoting dan Unpivoting

Sebelum kita benar-benar turun ke kolom pivot dan unpivoting dengan editor kueri Power BI. Mari kita pertimbangkan contoh yang sangat mendasar dari unpivoting.

Membatalkan putaran

Misalnya Anda memiliki kumpulan data yang berisi informasi berikut. Baris dalam tabel berikut sesuai dengan negara, sedangkan kolom menunjukkan informasi tentang PDB Per Kapita dan Tingkat Melek Huruf untuk negara terkait dalam baris. (Catatan:Ini hanya nilai dummy, bukan nilai sebenarnya)

Negara PDB Per Kapita Tingkat Melek Huruf
Prancis 30.000 95%
Jerman 25.000 96%

Jika Anda melepaskan satu kolom, misalnya, GDP Per Kapita, kumpulan data dengan kolom yang tidak diputar akan terlihat seperti ini.

Negara Atribut Nilai Melek Huruf
Prancis PDB Per Kapita 30.000 95%
Jerman PDB Per Kapita 25.000 96%

Anda dapat melihat bahwa kolom GDP Per Capita telah diganti dengan dua kolom, yaitu Attribute dan Value. Nilai di kolom “Atribut” sesuai dengan nama kolom yang tidak dipivot, sedangkan kolom “Nilai” berisi nilai yang sebelumnya ada di kolom yang tidak dipivot. Karena hanya satu kolom yang tidak dipivot, nilai di kolom "Atribut" akan selalu sama. Selain itu, jumlah baris dalam kumpulan data dengan satu kolom yang tidak dipilih akan tetap sama.

Sekarang mari kita coba melihat apa yang terjadi ketika kita melepaskan dua kolom. Kami akan menghapus kolom PDB Per Kapita dan Tingkat Melek huruf di kumpulan data asli. Kumpulan data dengan dua kolom yang tidak dipivot terlihat seperti ini.

Negara Atribut Nilai
Prancis PDB Per Kapita 30.000
Prancis Tingkat Melek Huruf 95%
Jerman PDB Per Kapita 25.000
Jerman Tingkat Melek Huruf 96%

Dalam kumpulan data di atas, Anda dapat melihat bahwa untuk setiap nama negara, kolom “Atribut” sekarang berisi dua nilai unik:PDB Per Kapita dan Tingkat Melek Huruf. Kolom "Nilai" berisi nilai yang sesuai untuk Atribut. Perhatikan bahwa jumlah baris telah berlipat ganda. Demikian pula, jika Anda melepaskan tiga kolom, jumlah baris dalam kumpulan data meningkat tiga kali lipat.

Memutar

Pivoting, seperti namanya, mengacu pada proses yang digunakan untuk membalikkan dataset yang tidak di-pivot ke bentuk aslinya. Misalnya, dalam memutar tabel input terlihat seperti ini:

Negara Atribut Nilai
Prancis PDB Per Kapita 30.000
Prancis Tingkat Melek Huruf 95%
Jerman PDB Per Kapita 25.000
Jerman Tingkat Melek Huruf 96%

Setelah menerapkan pivot pada kolom “Atribut” dan “Nilai”, kumpulan data mengambil bentuk berikut:

Negara PDB Per Kapita Tingkat Melek Huruf
Prancis 30.000 95%
Jerman 25.000 96%

Setelah mengetahui apa itu pivot dan unpivoting, mari kita lihat cara menerapkannya dengan Power BI.

Pivoting dan Unpivoting dengan Power BI

Pertama-tama, mari kita lihat contoh cara melepaskan kolom tunggal dengan editor kueri Power BI. Jika Anda melihat dataset, itu berisi kolom bernama "Populasi". Untuk melepaskan kolom "Populasi", klik tajuk kolom, lalu pilih opsi "Transformasi" dari menu atas. Anda akan melihat menu baru dengan beberapa opsi muncul di bagian atas, klik opsi "Unpivot Columns" dari menu dan kemudian klik "Unpivot Columns" dari daftar dropdown, seperti yang ditunjukkan di bawah ini:

Kolom “Population” akan diganti dengan kolom “Attribute” dan “Value”, seperti gambar di bawah ini:

Sekarang, untuk memutar kolom, Anda memiliki dua opsi. Anda dapat mengklik opsi “x Unpivoted Columns” dari jendela “Applied Steps”, seperti yang ditunjukkan pada tangkapan layar berikut.

Pilihan lainnya adalah memilih kolom lalu pilih “Transform -> Pivot Column” dari menu atas, seperti yang ditunjukkan di bawah ini.

Saat memutar kolom, Anda harus menentukan kolom yang berisi nilai untuk kolom yang tidak diputar. Dalam kasus kami, kolom "Nilai" berisi nilai untuk kolom "Atribut" yang tidak dipilih. Lihat tangkapan layar berikut untuk referensi.

Kolom "Populasi" yang diputar terlihat seperti ini:

Pindahkan kolom “Population” tepat di samping kolom “Pop. Kepadatan (per sq. mi.)” dengan mengklik tajuk kolom “Populasi” dan menyeret, seperti yang ditunjukkan pada tangkapan layar berikut.

Selanjutnya, kita akan melepas dua kolom, yaitu, “Population” dan “Pop. Kepadatan (per sq. mi.)”. Pilih kedua tajuk kolom, lalu batalkan pivotnya, seperti yang ditunjukkan di bawah ini:

Setelah unpivoting, Anda akan melihat dua kolom berikut dibuat di dataset. Anda dapat melihat bahwa kolom “Atribut” sekarang berisi informasi tentang “Populasi” dan “Pop. Kepadatan (per sq. mi.)”.

Pilih kedua tajuk kolom (CTRL + Klik) lalu seret kolom tepat di samping kolom “Negara”, seperti yang ditunjukkan di bawah ini.

Sekarang, Anda dapat melihat nama "Negara", total populasi dan kepadatan penduduk per mil persegi. Mari kita ubah nama kolom “Atribut” menjadi “Jenis Populasi” karena kolom “Atribut” menunjukkan dua jenis populasi:total populasi dan kepadatan populasi per mil persegi. Dataset dengan nama header kolom yang diperbarui terlihat seperti ini:

Memisahkan Kolom

Sebelum memisahkan kolom, kita akan mengganti beberapa nilai pada kolom “Population Type”.

Nilai “Population” pada kolom “Population Type” mengacu pada total populasi. Kita akan mengganti nilai “Population” dengan “Pop. Total” sehingga memiliki pola yang sama dengan “Pop. Kepadatan (per sq. mi.)”. Untuk mengganti nilai dalam kolom, buka “Transform -> Replace Values”, seperti yang ditunjukkan pada tangkapan layar berikut.

Setelah mengganti nilainya, dataset akan terlihat seperti ini.

Sekarang, kita akan membagi kolom “Population Type” menjadi dua. Lima karakter pertamanya akan ditambahkan ke kolom pertama, sedangkan karakter yang tersisa akan ditambahkan ke kolom lainnya. Untuk membagi kolom, buka "Transform -> Split Columns". Kami akan membagi dengan lima karakter pertama, oleh karena itu, pilih opsi "Split by Number of Characters" dari dropdown. Kami akan membagi kolom dengan 5 karakter paling kiri pertama. Untuk referensi, lihat tangkapan layar berikut.

Setelah kolom dipisah, Anda akan melihat dua kolom berikut.

Kita hanya membutuhkan kolom “Jenis Penduduk.2” karena berisi informasi tentang jenis atau skala populasi. Klik kolom “Population Type.1” lalu pilih “Delete”.

Terakhir, Anda dapat mengganti nama kolom “Population Type.2” menjadi “Population Type” seperti yang ditunjukkan di bawah ini.

Dari gambar berikut, Anda dapat melihat bahwa ada dua jenis nilai populasi yang berbeda untuk setiap negara. Nilai “Total” pada kolom “Jenis Penduduk” mengacu pada jumlah penduduk negara tersebut. Nilai sebenarnya dari total populasi disimpan pada kolom “Population Value”. Demikian pula, nilai “Kepadatan (per sq. mi.)” menunjukkan bahwa nilai populasi ini mengacu pada kepadatan penduduk.

Kesimpulan

Singkatnya, artikel menunjukkan cara melakukan pivot dan unpivoting di editor kueri Power BI. Selain itu, ini mencakup teori dasar di balik kolom pivot dan unpivoting yang diilustrasikan dengan contoh yang jelas. Terakhir, artikel menjelaskan bagaimana proses pemisahan kolom diimplementasikan di editor kueri Power BI.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SQL MIN() untuk Pemula

  2. Merancang Database untuk Portal Pekerjaan Online

  3. Membuat Database di Situs Cloud

  4. Menerapkan pengurutan khusus

  5. SQL Setara (=) Operator untuk Pemula