Ide lain untuk mencoba mungkin untuk mengidentifikasi string umum dan mewakili mereka dengan bitmap. Misalnya, memiliki dua bit untuk mewakili protokol (http, https, ftp atau yang lainnya), bit lain untuk menunjukkan apakah domain dimulai dengan "wwww", dua bit untuk menunjukkan apakah domain diakhiri dengan ".com", ". org", ".edu" atau yang lainnya. Anda harus melakukan beberapa analisis pada data Anda dan melihat apakah ini masuk akal, dan jika ada string umum lainnya yang dapat Anda identifikasi.
Jika Anda memiliki banyak URL ke situs yang sama, Anda juga dapat mempertimbangkan untuk membagi tabel Anda menjadi dua yang berbeda, satu memegang domain dan yang lainnya berisi jalur relatif domain (dan string kueri &id fragmen, jika ada). Anda akan memiliki tabel tautan yang memiliki id URL, id domain, dan id jalur, dan Anda akan mengganti tabel URL asli Anda dengan tampilan yang menggabungkan tiga tabel. Tabel domain tidak harus dibatasi pada domain, Anda dapat menyertakan URL sebanyak biasanya (mis., 'http://stackoverflow.com/questions'). Ini tidak akan membutuhkan terlalu banyak kode untuk diterapkan, dan memiliki keuntungan karena masih dapat dibaca. Encoding numerik Anda bisa lebih efisien, setelah Anda mengetahuinya, Anda harus menganalisis data Anda untuk melihat mana yang lebih masuk akal.