Mit Python PDFs herunterladen
Mit dem folgenden Python-Skript lassen sich auf einfache Weise alle PDFs von einer Webseite herunterladen.
from bs4 import BeautifulSoup import urllib.request import requests url = 'http://irgendeineurl.de' r = requests.get(url) data = r.text soup = BeautifulSoup(data) for link in soup.find_all('a'): if link.get('href').endswith('.pdf'): urllib.request.urlretrieve(url + link.get('href'), link.get('href')) print(url + link.get('href')) |