J'ai un site hérité assez grand avec littéralement des milliers de PDF qui représentent parfois une base de données, mais ne sont souvent que des liens sur la page, et sont stockés dans la plupart des répertoires du site.
J'ai écrit un robot php pour suivre tous les liens sur mon site, puis je compare cela à un vidage de la structure du répertoire, mais y a-t-il quelque chose de plus facile?
site-maintenance
web-crawlers
dead-links
MrChrister
la source
la source
Réponses:
J'ai utilisé Link Sleuth de Xenu . Cela fonctionne plutôt bien, assurez-vous simplement de ne pas faire de DOS vous-même!
la source
Si vous utilisez Windows 7, le meilleur outil est le SEO Toolkit 1.0 d'IIS7. C'est gratuit et vous pouvez le télécharger gratuitement.
L'outil analysera n'importe quel site et vous indiquera où se trouvent tous les liens morts, quelles pages prennent trop de temps à charger, quelles pages ont des titres manquants, des titres en double, de même pour les mots-clés et les descriptions, et quelles pages ont rompu HTML.
la source
Essayez l'outil open source du W3C, Link Checker . Vous pouvez l'utiliser en ligne ou l'installer localement
la source
Je suis un grand fan de linklint pour la vérification de liens de grands sites statiques, si vous avez une ligne de commande unix (que j'ai utilisée sur linux, MacOS et FreeBSD). Voir leur site pour les instructions d'installation. Une fois installé, je crée un fichier appelé
check.ll
et fais:Voici à quoi ressemble mon fichier check.ll
Cela analyse
www.example.com
et génère des fichiers HTML avec des rapports croisés pour ce qui est cassé, manquant, etc.la source
Il existe plusieurs produits de Microsys , en particulier leur générateur de sitemap A1 et l' analyseur de site Web A1 qui exploreront votre site Web et rapporteront tout ce que vous pouvez imaginer à ce sujet.
Cela inclut des liens brisés, mais aussi une vue sous forme de tableau de toutes vos pages afin que vous puissiez comparer des éléments tels que des balises <title> et des méta-descriptions identiques, des liens nofollow, des méta-noindex sur les pages Web et de nombreuses maladies qui ont juste besoin d'un œil aiguisé et une main rapide à réparer.
la source
Link Examiner est aussi un très bon logiciel gratuit pour vos besoins.
la source