n°32
Aspirateur des images du site Baunetz
Web, Python
30 sept 2020

Script Python pour automatiser le téléchargement des images des galeries du site d'architecture Baunetz. Nécessite Python et les librairies Requests et BeautifulSoup (commandes pip dans le code ci-dessous).

#! python3

import re
import shutil
import requests # "pip install requests" to install package
from bs4 import BeautifulSoup # "pip install beautifulsoup4" to install package

headers = {'User-Agent': 'Mozilla/5.0'}

inputURL = input("Adresse de la page Baunetz à aspirer :")

response = requests.get(inputURL, headers=headers)

soup = BeautifulSoup(response.text,"html.parser")
scriptTags = soup.find_all("script")

for scriptTag in scriptTags:
    s = str(scriptTag)
    if s.find("xxlGalerie.xxlimages") >= 0:
       imgs = re.findall(r"'url': '(https?://[^']*)'",s)
       print (len(imgs),"image(s) trouvée(s).")

       c = 1
       for img in imgs:
           filename = img.split("/")[-1]
           response = requests.get(img, stream=True)
           with open(filename, 'wb') as out_file:
               shutil.copyfileobj(response.raw, out_file)
               del response
               print("Téléchargement", c, "/", (len(imgs)))
               c += 1

corentin héraud-louisadat

architecte & développeur
75018 Paris
heraud-arobase-laponies-point-fr

*1992, Strasbourg

Diplômé d'état en 2016 de l'ENSA Paris-Malaquais et de la RWTH Aachen puis habilité à maîtrise d'oeuvre en nom propre (HMONP) en 2019, j'ai travaillé pour diverses agences telles que Nicolas Reymond architectes urbanistes, Dietmar Feichtinger architectes ou Julian Breinersdorfer. Je développe sur mon temps libre des applications pour le Web et la 3D. Vous pouvez également consulter l'archive des travaux laponies.fr ainsi que la carte des bonnes adresses.

Amis, famille et blogroll : Anaïs Héraud-Louisadat, Héraud–Baumann, Till Baumann, Anne-Claire Héraud, La Boucle.

alsace europe