Les URL de mon site Web sont actuellement insensibles à la casse. Par exemple, les deux liens suivants affichent exactement la même page:
http://example.com/about
http://example.com/About
Cependant, en jetant un œil au site wordpress.org, j'ai remarqué que les URL sont sensibles à la casse. Par exemple, le deuxième lien ci-dessous est une page d'erreur 404:
http://wordpress.org/about
http://wordpress.org/About
Mes pensées sont de rendre les URL de mon site Web sensibles à la casse. Mis à part le problème évident d'éviter le contenu en double, quels sont les avantages et les inconvénients d'avoir des URL sensibles à la casse?
Mettre à jour
Google semble appliquer une politique d'URL sensible à la casse sur ses propres URL. Par exemple, le deuxième lien ci-dessous est un 404:
http://google.com/doodles
http://google.com/Doodles
Update 2
Merci pour vos réponses. J'ai décidé de suivre les conseils mentionnés dans la réponse acceptée et d'implémenter des redirections 301 si nécessaire. Puisque je travaille avec WordPress, ma solution de code est la suivante (au cas où quelqu'un serait intéressé):
function force_lowercase_urls() {
if ( is_admin() )
return;
if ( preg_match( '/[A-Z]/', $_SERVER['REQUEST_URI'] ) ) {
wp_redirect( strtolower( $_SERVER['REQUEST_URI'] ), 301 );
exit();
}
}
add_action( 'init', 'force_lowercase_urls' );
la source
But wouldn't that result in duplicate content? – henrywright
Vous n'avez jamais à vous soucier des liens en double si votre site utilise correctement les liens canoniques et vous pouvez avoir accès à 1 page d'un million de façons et ne jamais être affecté pour le contenu en double.Réponses:
Par défaut, deux des systèmes de fichiers du système d'exploitation les plus utilisés pour servir le contenu Web ont des paramètres très différents pour la sensibilité à la casse des URL. La sensibilité à la casse de vos URL est probablement une fonction que vous utilisez:
À mon avis, aucune des valeurs par défaut n'est idéale:
La solution idéale serait d'afficher la page uniquement lorsque l'URL est correctement mise en majuscule. Pour une capitalisation incorrecte, l'utilisateur doit être 301 redirigé vers la capitalisation préférée. Il y a plusieurs façons d'y parvenir:
la source
/iNdEx.HtMl
ou/InDeX.hTml
le retourne/index.html
(à condition qu'il s'agisse d'/index.html
un fichier physique sur le système de fichiers).Voici la position de Google à partir d'une session de chat en direct archivée (le lien est maintenant mort):
L'équipe IE recommande de choisir une convention de casse de fichier et de la respecter strictement car elle peut améliorer les performances.
la source
La RFC 3986 6.2.2.1 définit les URI comme insensibles à la casse, donc ce n'est pas une bonne idée de les rendre sensibles à la casse comme wordpress.org le fait.
la source
http://
) - insensible à la casse, normalisé en minuscules. 2 - Le nom d'hôte (example.com
) - insensible à la casse, normalisé en minuscules. 3. Pourcentage de caractères codés (%3F
) - insensible à la casse, normalisé en majuscules. Le reste de l'URL est généralement sensible à la casse