Merujuk ke http://mysql.rjweb.org/utf8_collations.html
, saya melihat bahwa ı=i
dalam 3 susunan:utf8_general_ci, utf8_general_mysql500_ci, utf8_turkish_ci. Namun, untuk susunan bahasa Turki, I=ı
macam sebelum aku beraksen lainnya. Di semua koleksi lainnya ı
semacam aku, seolah-olah itu diperlakukan sebagai surat yang terpisah.
Sementara itu İ=I
di semua susunan kecuali utf8_turkish_ci.
Plot mengental dengan MySQL 8.0. utf8mb4_tr_0900_ai_ci (hanya) memiliki urutan ini:
I=Ì=Í=Î=Ï=Ĩ=Ī=Ĭ=Į=ı sort before i=ì=í=î=ï=ĩ=ī=ĭ=į=İ
Sementara itu ä=Ä
dan mereka cocok dengan sebagian besar aksen A lainnya untuk sebagian besar koleksi (termasuk yang Turki).
Intinya:Tampaknya utf8[mb4]_general_ci adalah satu-satunya susunan di 5.7 atau 8.0 yang akan selalu memperlakukan dotless-i (atau dotted-I) sama dengan 'i/I biasa dan pada saat yang sama abaikan umlaut.
Peringatan:Pengumpulan "umum" tidak menguji lebih dari satu karakter sekaligus. Artinya, "umlaut tanpa spasi" ditambah vokal tidak akan diperlakukan sama dengan kombinasi tersebut.
Di link itu... Satu karakter æ
diurutkan sama dengan dua huruf ae
untuk beberapa koleksi. Itu ditunjukkan oleh:Aa ae=æ az
. Di sekitar setengah dari susunan lainnya, karakter æ
diperlakukan sebagai surat tersendiri; ini ditunjukkan dengan itu setelah az
dan sebelum b
. Atau bahkan setelah zz
untuk koleksi Skandinavia. Konsep huruf terpisah ini terkadang berlaku untuk pasangan huruf, misalnya cs
(Hongaria) dan ch
(Spanyol tradisional).