Ya itu benar. UTF-8 adalah pengkodean untuk rangkaian karakter Unicode, yang mendukung hampir semua bahasa di dunia.
Saya pikir satu-satunya perbedaan datang dengan menyortir hasil Anda, huruf yang berbeda mungkin datang dalam urutan yang berbeda dalam bahasa lain (aksen, umlaut, dll.). Juga, membandingkan a
ke ä
mungkin berperilaku berbeda di susunan lain.
_ci
akhiran berarti pengurutan dan perbandingan terjadi c as saya sensitif.
http://www.collation-charts.org/ mungkin menarik bagi Anda.