Questions marquées «web-scraping»

Le scraping Web est le processus d'extraction d'informations spécifiques à partir de sites Web qui ne fournissent pas facilement une API ou d'autres méthodes de récupération automatisée de données. Les questions sur "Comment démarrer avec le scraping" (par exemple avec Excel VBA) doivent être * soigneusement recherchées * car de nombreux exemples de code fonctionnel sont disponibles. Les méthodes de scraping Web incluent des applications tierces, le développement de logiciels personnalisés ou même la collecte manuelle de données de manière standardisée.

386
Comment trouver des éléments par classe

J'ai du mal à analyser les éléments HTML avec l'attribut "class" à l'aide de Beautifulsoup. Le code ressemble à ceci soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div J'obtiens une erreur sur la même ligne "après" la fin du...

178
Page JavaScript de Web-scraping avec Python

J'essaye de développer un simple grattoir Web. Je souhaite extraire du texte sans le code HTML. En fait, j'atteins cet objectif, mais j'ai vu que dans certaines pages où JavaScript est chargé, je n'obtenais pas de bons résultats. Par exemple, si du code JavaScript ajoute du texte, je ne peux pas le...

16
Comment puis-je gratter plus vite

Le travail ici consiste à supprimer une API d'un site qui commence à partir https://xxx.xxx.xxx/xxx/1.jsonde https://xxx.xxx.xxx/xxx/1417749.jsonet à l'écrire exactement sur mongodb. Pour cela j'ai le code suivant: client = pymongo.MongoClient("mongodb://127.0.0.1:27017") db = client["thread1"] com...