Dengan asumsi bahwa $str
adalah UTF-8 dikodekan:
function maxThreeBytes($str) {
return preg_match('@[\\xf0-\\xff][\\x80-\\xff][\\x80-\\xff][\\x80-\\xff]@', $str) ? false : true;
}
Ini memeriksa apakah string berisi empat karakter yang cocok dengan 11110xxxb 10xxxxxxb 10xxxxxxb 10xxxxxxb
yang merupakan pengkodean untuk karakter antara U+10000 dan U+10FFFF.