Ya itu benar. UTF-8 adalah pengkodean untuk rangkaian karakter Unicode, yang mendukung hampir semua bahasa di dunia.
Saya pikir satu-satunya perbedaan datang dengan menyortir hasil Anda, huruf yang berbeda mungkin datang dalam urutan yang berbeda dalam bahasa lain (aksen, umlaut, dll.). Juga, membandingkan a ke ä mungkin berperilaku berbeda di susunan lain.
_ci akhiran berarti pengurutan dan perbandingan terjadi c as saya sensitif.
https://www.collation-charts.org/ mungkin menarik bagi Anda.