Juste un court et simple sur l'excellent module Requests pour Python.
Je n'arrive pas à trouver dans la documentation ce que la variable «proxies» devrait contenir. Quand je lui envoie un dict avec une valeur standard "IP: PORT", il l'a rejeté en demandant 2 valeurs. Donc, je suppose (parce que cela ne semble pas être couvert dans la documentation) que la première valeur est l'ip et la seconde le port?
Les documents mentionnent uniquement ceci:
proxies - (facultatif) Protocole de mappage du dictionnaire vers l'URL du proxy.
Alors j'ai essayé ça ... que dois-je faire?
proxy = { ip: port}
et devrais-je les convertir en un certain type avant de les mettre dans le dict?
r = requests.get(url,headers=headers,proxies=proxy)
la source
urllib3
donc je vais devoir me pencher là- dessus . Merci pour l'information.J'ai trouvé qu'urllib a un très bon code pour récupérer les paramètres de proxy du système et qu'ils se trouvent dans la bonne forme à utiliser directement. Vous pouvez utiliser ceci comme:
Cela fonctionne très bien et urllib sait également comment obtenir les paramètres Mac OS X et Windows.
la source
module 'urllib' has no attribute 'getproxies'
Vous pouvez consulter la documentation du proxy ici .
Si vous devez utiliser un proxy, vous pouvez configurer des requêtes individuelles avec l'argument proxies pour n'importe quelle méthode de requête:
Pour utiliser HTTP Basic Auth avec votre proxy, utilisez la syntaxe http: // user: [email protected]/ :
la source
La réponse acceptée a été un bon début pour moi, mais j'ai continué à recevoir l'erreur suivante:
La solution à ce problème était de spécifier le http: // dans l'URL du proxy ainsi:
Je serais intéressé de savoir pourquoi l'original fonctionne pour certaines personnes mais pas pour moi.
Edit: Je vois que la réponse principale est maintenant mise à jour pour refléter cela :)
la source
Si vous souhaitez conserver les cookies et les données de session, vous feriez mieux de le faire comme suit:
la source
8 ans de retard. Mais j'aime:
la source
voici ma classe de base en python pour le module de requêtes avec quelques configs proxy et chronomètre!
la source
Je viens de créer un graber de proxy et je peux également me connecter avec le même proxy noté sans aucune entrée, voici:
la source
Il est un peu tard mais voici une classe wrapper qui simplifie le scraping des proxies puis la création d'un http POST ou GET:
Demandes de proxy
la source
Je partage du code pour récupérer des proxies sur le site "https://free-proxy-list.net" et stocker des données dans un fichier compatible avec des outils comme "Elite Proxy Switcher" (format IP: PORT):
## PROXY_UPDATER - obtenez des proxys gratuits sur https://free-proxy-list.net/
la source