Comment trouver tous les domaines contenant une chaîne spécifique

11

Je veux savoir quels sont les différents pedia.

Je veux une liste de tous les domaines enregistrés, qui se terminent par pedia.org, pedia.comou pedia.info, (par exemple WIKIpedia.orgou Anotherpedia.info).

kobame
la source

Réponses:

5

Si vous souhaitez y parvenir en utilisant un moteur de recherche existant, vous pouvez utiliser les opérateurs de moteur de recherche de Google , qui peuvent être très puissants:


Cette requête de recherche vous donnera une liste de tous les domaines enregistrés se terminant par pedia.org, pedia.comou pedia.info(ce n'est pas aussi puissant que la deuxième requête de recherche, car elle est limitée - mais c'est ce que vous avez demandé):

"pedia.org" OR "pedia.com" OR "pedia.info"

Opérateurs de recherche utilisés:

  • Citations: Recherchez un mot ou une expression exacte: "search query"

  • Opérateur OU: Recherchez l'un ou l'autre des mots: query OR query


ÉDITER:

Dave Rook a suggéré cette requête de recherche: site:*pedia.*.

Le problème avec cette requête est que, pour une raison quelconque, elle répertorie uniquement les domaines qui précèdent -ou .avant pedia, comme indiqué unor . Cela semble être un bug et, à cause de cela, wikipedia.orgn'apparaîtra pas dans les résultats de recherche.

Cependant , il existe un autre opérateur de recherche (moins populaire) qui est en fait très utile:

  • dans: Rechercher dans l'URL / le titre de la page / le corps de la page / les backlinks:

    inurl:query intitle:query intext:query inanchor:query

Donc , si vous voulez une recherche plus large ( au lieu de vous limiter à .org, .com, les .infosites pedia), deux requêtes de recherche très puissants seraient:

inurl:*"pedia"* intitle:*"pedia"*
inurl:*pedia* intitle:*pedia*

allin pourrait être plus puissant, mais il n'est pas possible de le combiner avec un autre opérateur de recherche, et il est donc préférable de l'utiliser à la place.

Puisqu'il cherche pediaà la fois dans l'URL et dans le titre, il ne vous donnera que de vrais sites pedia.

amiregelz
la source
Je vous remercie. Je cherchais un script shell pour imprimer une liste de domaines, mais l'approche du moteur de recherche est utilisable, il suffit de travailler davantage pour creuser le résultat de la recherche. Acceptant. ;)
kobame
@kobame J'ai ajouté une puissante requête de recherche supplémentaire, que vous pourriez trouver utile. Voir ma réponse (modifiée).
amiregelz
5

Vous devez utiliser le caractère générique qui est un astrix *autour d'une chaîne de requête et le mot clé "site:" pour dire à Google que vous recherchez un site. Tapez ce qui suit dans Google: (pas d'espaces et exactement tel quel)

site:*pedia.*

ou cliquez sur ce lien Google.co.uk (qui est un raccourci pour afficher Google avec le terme de recherche ci-dessus).

Cependant, comme vous le verrez, cela ne fera pas que les sites de style Wikipédia et ne vous limitera pas uniquement aux .com, .org et .info.

Vous devrez également noter que faire une recherche sur Google.co.uk fournira éventuellement des résultats différents par rapport à Google.com, Google.fr, Google.de etc.

Chaque * ne représente qu'un ou plusieurs mots. Google traite le * comme un espace réservé pour un mot ou plusieurs mots. Par exemple, ["Google * ma vie"] indique à Google de trouver des pages contenant une phrase commençant par "Google" suivi d'un ou plusieurs mots, suivi de "ma vie". Les phrases qui correspondent à la facture comprennent: «Google a changé ma vie», «Google dirige ma vie» et «Google est ma vie».

L'opérateur sauvage de Google

Dave
la source
Merci aussi (+1), mais accepté la solution amiregelz car ses résultats sont plus cohérents. Avec votre approche, j'ai obtenu plus d'un résultat pour chaque domaine trouvé, par exemple www.energy-pedia.com ou soo.
kobame
Avec cette requête, je n'obtiens pas du tout wikipedia.org. Il semble qu'il ne répertorie que les domaines qui précèdent " -" ou " ." avant " pedia".
unor
@unor J'ai mis à jour ma réponse avec une requête de recherche améliorée, merci de l'avoir signalé.
amiregelz