Saya sarankan Anda harus menggunakan Perpustakaan DOM PHP . Ini sangat kuat dan memungkinkan penguraian struktur DOM apa pun. Lihat beberapa contohnya dan Anda dapat menerapkannya dengan mudah.
Idenya adalah Anda mempelajari struktur HTML halaman yang dikembalikan oleh Google dan karenanya menggunakan perpustakaan DOM untuk menguraikan tag tertentu. Dari apa yang saya lihat, gambar diatur sebagai <ul>
dan <li>
tag, seperti:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
Dalam setiap <li>
tag ada tag tambahan salah satunya <a>
. Tag ini tampaknya memiliki 2 atribut - "imgrefurl" dan "imgurl" - yang mungkin memberi Anda gambar yang Anda butuhkan. Manakah dari 2 atribut ini yang Anda perlukan untuk Anda jelajahi.
Atau, ada <img>
tag di dalam <li>
yang memiliki atribut "src" yang berisi biner gambar sebenarnya. Jadi Anda dapat menguraikannya juga. Harap dicatat bahwa biner adalah untuk gambar yang Anda lihat di halaman pencarian dan bukan gambar sebenarnya.
Untuk beberapa petunjuk ke DOM, metode ini mungkin berguna - http://www .php.net/manual/en/domelement.getelementsbytagname.php
dan http://www.php.net/manual/en/domelement. hasattribute.php
- untuk membaca semua <li>
tag dan kemudian parsing untuk yang menggunakan kelas "rg_li".
Saya harap hal di atas masuk akal