Saya menemukan cara menyelesaikannya, jadi semoga ini bermanfaat bagi seseorang.
Pertama, SQL_Latin1_General_CP1_CI_AS adalah campuran aneh dari CP-1252 dan UTF-8. Karakter dasarnya adalah CP-1252, jadi inilah mengapa yang harus saya lakukan adalah UTF-8 dan semuanya bekerja. Karakter Asia dan UTF-8 lainnya dikodekan pada 2 byte dan driver php pdo_mssql tampaknya membenci karakter panjang yang bervariasi sehingga tampaknya melakukan CAST ke varchar (bukan nvarchar) dan kemudian semua karakter 2 byte menjadi tanda tanya (' ?').
Saya memperbaikinya dengan mentransmisikannya ke biner dan kemudian saya membangun kembali teks dengan php:
SELECT CAST(MY_COLUMN AS VARBINARY(MAX)) FROM MY_TABLE;
Di php:
//Binary to hexadecimal
$hex = bin2hex($bin);
//And then from hex to string
$str = "";
for ($i=0;$i<strlen($hex) -1;$i+=2)
{
$str .= chr(hexdec($hex[$i].$hex[$i+1]));
}
//And then from UCS-2LE/SQL_Latin1_General_CP1_CI_AS (that's the column format in the DB) to UTF-8
$str = iconv('UCS-2LE', 'UTF-8', $str);