Total Kumulatif, juga dikenal sebagai total berjalan, adalah metrik KPI yang berguna untuk memantau jumlah nilai total dari waktu ke waktu. Jika data Anda disimpan di Amazon Redshift, maka cukup mudah untuk menghitung jumlah kumulatif di Redshift. Mari kita lihat cara menghitung total lari di Redshift.
Cara Menghitung Total Berjalan di Pergeseran Merah
Berikut adalah langkah-langkah untuk menghitung total lari di Redshift. Katakanlah Anda memiliki tabel berikut yang berisi penjualan harian
postgres-#> create table sales(order_date date,sale int); postgres-#> insert into sales values('2020-03-01',30), ('2020-03-02',35),('2020-03-03',25),('2020-03-04',40),('2020-03-05',30); postgres-#> select * from sales; +------------+------+ | order_date | sale | +------------+------+ | 2020-03-01 | 30 | | 2020-03-02 | 35 | | 2020-03-03 | 25 | | 2020-03-04 | 40 | | 2020-03-05 | 30 | +------------+------+
Katakanlah Anda ingin menghitung jumlah penjualan kumulatif, seperti,
+------------+------+-----------------+ | order_date | sale | cumulative_sale | +------------+------+-----------------+ | 2020-03-01 | 30 | 30 | | 2020-03-02 | 35 | 65 | | 2020-03-03 | 25 | 90 | | 2020-03-04 | 40 | 130 | | 2020-03-05 | 30 | 160 | +------------+------+-----------------+
Inilah kueri SQL untuk menghitung total berjalan di Redshift. Karena Redshift pada dasarnya adalah PostgreSQL, semua fungsi dan ekspresinya tersedia di PostgreSQL. Jadi kita akan menggunakan Fungsi Jendela, tersedia di PostgreSQL, untuk melakukannya.
postgres=# SELECT order_date , sum(sale) over (order by order_date asc rows between unbounded preceding and current row) FROM sales ORDER BY order_date; order_date | sum ------------+----- 2020-03-01 | 30 2020-03-02 | 65 2020-03-03 | 90 2020-03-04 | 130 2020-03-05 | 160
Mari kita lihat kueri di atas secara detail. Fungsi SUM di atas menghitung jumlah kumulatif untuk setiap baris. Namun, kami menggunakan Fungsi Jendela OVER yang membantu kami menentukan jumlah baris yang akan digunakan untuk menghitung total berjalan di Redshift.
Bonus Baca:Cara Menghitung Moving Average di Redshift
Pertama, kami mengurutkan data secara kronologis sebelum tanggal_pesanan untuk memastikan bahwa kita menjumlahkan baris yang tepat untuk setiap jumlah kumulatif. Selanjutnya, untuk setiap baris, kami memberi tahu Redshift untuk menjumlahkan penjualan kolom untuk semua baris sebelumnya. Kami melakukannya menggunakan fungsi jendela OVER, dan menyebutkan baris antara baris sebelumnya dan saat ini yang tidak dibatasi . Artinya, untuk setiap baris, pertimbangkan hanya baris sebelumnya untuk jumlah kumulatif.
Saat bingkai jendela berubah untuk setiap baris, hanya baris sebelumnya yang akan digunakan untuk menghitung total lari.
Jika Anda ingin memfilter data Anda sebelum menghitung total berjalan di Redshift, Anda dapat melakukannya dengan menambahkan klausa WHERE, seperti yang ditunjukkan di bawah ini.
postgres=# SELECT order_date , sum(sale) over (order by order_date asc rows between unbounded preceding and current row) FROM sales ORDER BY order_date WHERE <condition>;
Bonus Baca : Cara Membuat Tabel Pivot di PostgreSQL
Selain itu, karena Redshift pada dasarnya adalah PostgreSQL, Anda juga dapat menggunakan kueri di atas untuk menghitung total yang berjalan di PostgreSQL.
Setelah menghitung jumlah kumulatif di Pergeseran Merah, Anda dapat menggunakan alat visualisasi data Pergeseran Merah untuk memplotnya pada bagan garis. Berikut adalah contoh diagram garis untuk total kumulatif, dibuat menggunakan Ubiq.
Jika Anda ingin membuat grafik &dasbor dari database Redshift, Anda dapat mencoba Ubiq. Kami menawarkan uji coba gratis selama 14 hari.