L'API Google Web Search a été déconseillée et remplacée par l'API Custom Search (voir http://code.google.com/apis/websearch/ ).
Je voulais rechercher sur tout le Web, mais il semble qu'avec la nouvelle API, seuls les sites personnalisés peuvent être recherchés.
Existe-t-il un moyen de rechercher l'ensemble du Web par programmation? J'ai pu interroger l'ancienne API en utilisant JSON à partir d'un programme Java.
Réponses:
Vous pouvez simplement les envoyer comme un navigateur, puis analyser le code html, c'est ce que j'ai toujours fait, même pour des choses comme Youtube.
la source
Oui, Google Custom Search a désormais remplacé l'ancienne API de recherche, mais vous pouvez toujours utiliser Google Custom Search pour effectuer une recherche sur l'ensemble du Web , bien que les étapes ne soient pas évidentes dans la configuration de la recherche personnalisée.
Pour créer un moteur de recherche personnalisé Google qui effectue des recherches sur l'ensemble du Web:
Maintenant, votre moteur de recherche personnalisé effectuera une recherche sur l'ensemble du Web.
Tarification
Source: https://developers.google.com/custom-search/json-api/v1/overview#Pricing
la source
Google Custom Search (comme préconisé dans les réponses les mieux notées) fonctionne bien, mais est très cher, par rapport à ses concurrents (ci-dessous) ou par rapport à d'autres API Google. Il a un petit niveau gratuit (100 requêtes / jour) et un prix très élevé de 5 $ pour 1000 requêtes.
Ils offrent la possibilité de passer à Site Search, qui a des prix légèrement meilleurs, mais qui sont destinés à rechercher un site (le vôtre), donc c'est vraiment quelque chose de très différent - pas une mise à niveau.
Les principales alternatives semblent être:
API Bing Search
https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44
qui a un niveau gratuit de 5000q / mois, et des prix à partir de 5 requêtes par centime, et sans limite stricte.
MISE À JOUR: Fin 2016, cette API a été arrêtée au profit de son homologue Azure "API Cognitive Services Bing Search":
https://azure.microsoft.com/en-us/services/cognitive-services/search/
Voir ici pour un tableau des prix, qui commence à 3 $ US / m pour 1 000 transactions. Sauf si je manque quelque chose, c'est assez cher.
MISE À JOUR DE L' API Yahoo BOSS Search : a été interrompue le 31 mars 2016. http://developer.yahoo.com/boss/search/
Avec des prix commençant à environ 12 requêtes / centime pour des recherches sur le Web entier.
Et certains dont je n'ai jamais entendu parler auparavant:
http://www.gigablast.com/searchfeed.html
http://www.faroo.com/hp/api/api.html
http://www.commoncrawl.org/
http://www.entireweb.com/search_api/implementation/
[interrompu - comme indiqué ci-dessous]
Il y a un peu de discussion sur certains d'entre eux sur ce message SO .
[a été fermé pour être hors sujet et est maintenant parti]
la source
Voici une option en bas du panneau de configuration de la recherche personnalisée: "Sites à rechercher" , vous pouvez choisir "Rechercher sur tout le Web mais mettre l'accent sur les sites inclus"
la source
Faroo a une API de recherche Web gratuite
la source
Je viens de découvrir cela de Common Crawl.
http://www.commoncrawl.org/
Peut-être la réponse que nous recherchons tous !!
la source
Il y a une note au-dessus des documents :
La politique de dépréciation indique qu'ils continueront à exécuter l'API pendant 3 ans. Donc, si vous avez déjà une application qui utilise l'ancienne API, vous n'avez pas à vous précipiter pour changer les choses tout de suite. Si vous écrivez une nouvelle application, utilisez l' API de recherche personnalisée . Voir ma réponse ici pour savoir comment faire cela en Python, mais l'idée est la même pour n'importe quelle langue.
la source
Il existe une API Java gratuite appelée JFreeWebSearch qui utilise le Faroo déjà mentionné: http://www.ke.tu-darmstadt.de/resources/jfreewebsearch
la source
Vous pouvez créer un moteur de recherche personnalisé "partout" directement depuis la page d'accueil de la recherche personnalisée Google ( http://www.google.com/cse/ ). Vous devez simplement cliquer sur «avancé» lors de l'ajout d'un nouveau moteur. Là, vous pouvez fournir le type de site Schema.org. « Thing » est le type le plus générique, qui couvre tout le Web.
la source
Gigablast propose une API de recherche Web bon marché: http://www.gigablast.com/searchfeed.html
la source