PostgreSQL tidak mendukung kelas karakter berdasarkan Basis Data Karakter Unicode seperti .NET. Anda mendapatkan [[:alpha:]]
. yang lebih standar kelas karakter, tetapi ini bergantung pada lokal dan mungkin tidak akan mencakupnya.
Anda mungkin dapat lolos hanya dengan memasukkan karakter ASCII yang tidak Anda inginkan ke daftar hitam, dan mengizinkan semua karakter non-ASCII. misalnya sesuatu seperti
[^\s!"#$%&'()*+,\-./:;<=>?\[\\\]^_`~]+
(JavaScript juga tidak memiliki kelas karakter non-ASCII. Atau bahkan [[:alpha:]]
.)
Misalnya, diberikan v_text
sebagai variabel teks yang akan dibersihkan:
-- Allow internationalized text characters and remove undesired characters
v_text = regexp_replace( lower(trim(v_text)), '[!"#$%&()*+,./:;<=>?\[\\\]\^_\|~]+', '', 'g' );