kolasi adalah kekhawatiran Anda yang paling kecil, yang perlu Anda pikirkan adalah kumpulan karakter untuk kolom/tabel/database. Pengumpulan (aturan yang mengatur bagaimana data dibandingkan dan diurutkan ) hanyalah akibat wajar dari itu.
MySQL mendukung beberapa set karakter Unicode, utf8
dan utf8mb4
menjadi yang paling menarik. utf8
mendukung karakter Unicode di BMP
, yaitu subset dari semua Unicode. utf8mb4
, tersedia sejak MySQL 5.5.3, mendukung semua dari Unicode.
kolasi untuk digunakan dengan salah satu penyandian Unicode kemungkinan besar xxx_general_ci
atau xxx_unicode_ci
. Yang pertama adalah algoritma penyortiran dan perbandingan umum yang tidak bergantung pada bahasa, yang terakhir adalah lebih lengkap algoritme independen bahasa yang mendukung lebih banyak fitur Unicode (misalnya, memperlakukan "ß" dan "ss" sebagai setara), tetapi karena itu juga lebih lambat.
Lihat https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .