Sepertinya masalah dengan kode alecxe adalah ia mengembalikan tabel yang merupakan saudara langsung dari h2, tetapi yang Anda inginkan sebenarnya ada di dalam div (yang merupakan saudara h2). Ini berhasil untuk saya:
import requests
from bs4 import BeautifulSoup
urls = [
'https://www.hl7.org/fhir/valueset-account-status.html',
'https://www.hl7.org/fhir/valueset-activity-reason.html',
'https://www.hl7.org/fhir/valueset-age-units.html'
]
def extract_table(url):
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
div = h2.find_next_sibling('div')
return div.find('table')
for url in urls:
print extract_table(url)