Questions marquées «beautifulsoup»

Beautiful Soup est un package Python permettant d'analyser HTML / XML. La dernière version de ce package est la version 4, importée en tant que bs4.

386
Comment trouver des éléments par classe

J'ai du mal à analyser les éléments HTML avec l'attribut "class" à l'aide de Beautifulsoup. Le code ressemble à ceci soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div J'obtiens une erreur sur la même ligne "après" la fin du...

224
bs4.FeatureNotFound: Impossible de trouver un générateur d'arborescence avec les fonctionnalités que vous avez demandées: lxml. Avez-vous besoin d'installer une bibliothèque d'analyseur?

... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Les sorties ci-dessus sur...

107
pouvons-nous utiliser xpath avec BeautifulSoup?

J'utilise BeautifulSoup pour gratter une URL et j'ai eu le code suivant import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" req = urllib2.Request(url) response = urllib2.urlopen(req) the_page = response.read()...

89
table d'analyse Python BeautifulSoup

J'apprends python requestset BeautifulSoup. Pour un exercice, j'ai choisi d'écrire un analyseur rapide de ticket de parking à New York. Je peux obtenir une réponse html qui est assez moche. J'ai besoin de récupérer lineItemsTableet d'analyser tous les tickets. Vous pouvez reproduire la page en...