Anda harus menggunakan susunan Unicode. Anda dapat mengaturnya secara default di sistem Anda, atau di setiap bidang tabel Anda. Berikut ini adalah nama-nama susunan Unicode, dan inilah perbedaannya:
utf8_general_ci adalah susunan yang sangat sederhana. Itu hanya- menghilangkan semua aksen- kemudian mengonversinya menjadi huruf besar dan menggunakan kode huruf hasil "huruf dasar" semacam ini untuk membandingkan.
utf8_unicode_ci menggunakan tabel elemen collation Unicode default.
Perbedaan utamanya adalah:
- utf8_unicode_ci mendukung apa yang disebut ekspansi dan ligatur, misalnya:Huruf Jerman (U+00DF LETTER SHARP S) diurutkan mendekati "ss" Huruf (U+0152 LATIN CAPITAL LIGATURE OE) diurutkan mendekati "OE".
utf8_general_ci tidak mendukung ekspansi/ligatur, ini mengurutkan semua huruf ini sebagai karakter tunggal, dan terkadang dalam urutan yang salah.
- utf8_unicode_ci adalah umumnya lebih akurat untuk semua skrip. Misalnya, pada blok Cyrillic:utf8_unicode_ci baik untuk semua bahasa ini:Rusia, Bulgaria, Belarusia, Makedonia, Serbia, dan Ukraina. Sementara utf8_general_ci baik-baik saja hanya untuk subset Cyrillic Rusia dan Bulgaria. Huruf tambahan yang digunakan dalam bahasa Belarusia, Makedonia, Serbia, dan Ukraina tidak diurutkan dengan baik.
+/- Kerugian dari utf8_unicode_ci adalah sedikit lebih lambat dari utf8_general_ci.
Jadi tergantung pada, jika Anda tahu atau tidak, bahasa/karakter spesifik mana yang akan Anda gunakan, saya sarankan Anda menggunakan utf8_unicode_ci yang memiliki cakupan yang lebih luas.