tl;dr Tidak, itu tidak valid, apa pun penyandiannya bermasalah atau diberi tahu informasi penyandian yang salah tentang input.
55357 dan 56842 masing-masing adalah 0xD83D dan 0xDE0A dalam heksa.
Di Unicode, masing-masing berada dalam rentang yang disebut "Pengganti Tinggi" dan "Pengganti Rendah".
Itu berarti mereka tidak codepoint Unicode yang tepat, melainkan digunakan dalam UTF-16 untuk membuat satu nilai Unicode yang tidak sesuai dengan 16 bit (yaitu Basic Multilingual Plane).
Kedua nilai spesifik ini diterjemahkan menjadi U+1F60A WAJAH TERSENYUM DENGAN MATA TERSENYUM . Entitas HTML desimal yang benar untuk itu adalah 😊
.
Alasan yang paling mungkin untuk ini adalah bahwa beberapa transformasi yang entah tidak tahu tentang UTF-16 atau pemikiran teks ini bukan UTF-16 yang melakukan pengkodean (tetapi seharusnya mendeteksi bahwa nilai tersebut tidak valid dan melaporkan kesalahan bahkan dalam kasus tersebut).