Comment extraire des tableaux HTML à l'aide du package XML?
Prenez, par exemple, cette page wikipedia sur l' équipe de football brésilienne . Je voudrais le lire en R et obtenir le tableau "Liste de tous les matchs que le Brésil a disputés contre des équipes reconnues par la FIFA" sous forme de data.frame. Comment puis-je faire ceci?
Réponses:
… Ou un essai plus court:
la table choisie est la plus longue de la page
la source
Modifié pour ajouter:
Exemple de sortie
la source
Une autre option utilisant Xpath.
Produit ce résultat
la source
Le
rvest
avecxml2
est un autre package populaire pour l'analyse des pages Web html.La syntaxe est plus facile à utiliser que le
xml
package et pour la plupart des pages Web, le package fournit toutes les options dont vous avez besoin.la source