Comment analyser HTML / XML et en extraire des
Comment analyser HTML / XML et en extraire des
Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement de réponses. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 6 ans . Améliorez cette question Je pense à essayer...
J'ai cherché une solution mais rien n'était pertinent, voici donc mon problème: Je souhaite analyser une chaîne contenant du texte HTML. Je veux le faire en JavaScript. J'ai essayé cette bibliothèque mais il semble qu'elle analyse le code HTML de ma page actuelle, pas à partir d'une chaîne. Parce...
Il semble que chaque question sur stackoverflow où le demandeur utilise regex pour récupérer des informations HTML aura inévitablement une "réponse" qui dit de ne pas utiliser regex pour analyser HTML. Pourquoi pas? Je suis conscient qu'il existe de "vrais" analyseurs HTML entre guillemets comme...
Dans l'état actuel des choses, cette question ne convient pas à notre format de questions / réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, des sondages ou une...
Je recherche un module d'analyse HTML pour Python qui peut m'aider à obtenir les balises sous la forme de listes / dictionnaires / objets Python. Si j'ai un document du formulaire: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div...
Quelle est la meilleure façon de sélectionner tout le texte entre 2 balises - ex: le texte entre toutes les balises «pré» de la
Je vois des questions tous les jours demandant comment analyser ou extraire quelque chose d'une chaîne HTML et la première réponse / commentaire est toujours "N'utilisez pas RegEx pour analyser le HTML, de peur de ressentir la colère!" (cette dernière partie est parfois omise). C'est assez...
J'ai besoin d'analyser (côté serveur) de grandes quantités de pages HTML. Nous sommes tous d'accord pour dire que l'expression rationnelle n'est pas la voie à suivre ici. Il me semble que javascript est la manière native d'analyser une page HTML, mais cette hypothèse repose sur le code côté...
J'ai un fichier qui ressemble à ceci: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id">...
Les balises peuvent avoir plusieurs attributs. L'ordre dans lequel les attributs apparaissent dans le code n'a pas d'importance. Par exemple: <a href="#" title="#"> <a title="#" href="#"> Comment puis-je "normaliser" le HTML en Javascript, pour que l'ordre des attributs soit toujours...