Y a-t-il des problèmes techniques avec un nom de domaine «internationalisé»?

20

Dans ma langue, il existe de nombreux caractères qui ne sont pas autorisés dans le nom de domaine standard. Cependant, la plupart d'entre eux peuvent être facilement remplacés par des équivalents sûrs (la plupart du temps, la suppression d'accents ídevient ietc.). Ainsi, bien que nous ayons souvent enregistré les deux formulaires (par exemple, timarit.iset le bon islandais tímarit.is), nous avons toujours fait du formulaire «sûr» la valeur par défaut et l'autre ne fait que le rediriger.

Cependant, nous sommes maintenant dans la position où la substitution est moins favorable ( ædevient ae) et préférerions utiliser le nom internationalisé par défaut.

Ma question est simplement s'il y a des problèmes connus avec cela? L'incompatibilité du navigateur vient d'abord à l'esprit, mais je crains également qu'il y ait d'autres choses qui ne me viennent pas à l'esprit.

PRIME

J'ai commencé une prime à ce sujet, donc je n'aurai pas à poster une question en double. J'aimerais savoir s'il y a des conséquences pratiques à utiliser des IDN avec (1) FTP et (2) serveurs / clients de messagerie; et (3) quels navigateurs rencontrent des difficultés avec les domaines? (4) Qu'en est-il des appareils mobiles? (5) a également changé quelque chose sur le sujet - cela fait presque un an que la question a été posée.

Kris
la source
2
Je me demande comment les robots des moteurs de recherche gèrent ce type de nom de domaine?
Toby

Réponses:

10

Les moteurs de recherche n'ont généralement aucun problème avec les IDN (je ne peux pas parler pour les autres, mais c'est du moins le cas pour Google). Mis à part les problèmes de votre côté (maintenance, etc.) et du côté des utilisateurs (problèmes de navigateur - qui disparaissent heureusement car plus d'utilisateurs ont des navigateurs modernes), je ne vois pas beaucoup de problème.

Certaines des choses plus générales et indirectement liées aux moteurs de recherche qui me viennent à l'esprit sont:

  • Certains utilisateurs peuvent avoir des difficultés à se connecter à votre contenu, surtout s'ils n'ont pas la bonne disposition de clavier, il est donc généralement préférable de fournir aux utilisateurs un moyen simple de copier et coller un lien pour le réutiliser. Si vous fournissez un extrait HTML, assurez-vous d'utiliser la version punycode du nom de domaine afin de ne pas avoir de problèmes avec les encodages de page.
  • Parfois, vous souhaiterez peut-être utiliser plusieurs noms de domaine pour intercepter les fautes de frappe (par exemple, timarit.is vs tímarit.is). Si vous le faites, assurez-vous de choisir un nom de domaine préféré et utilisez des redirections 301 à l'échelle du site vers ce nom de domaine.
  • Si vous utilisez un ASCII non 7 bits dans les paramètres de chemin, de fichier ou de requête, assurez-vous d'utiliser UTF-8 pour cela. Assurez-vous également que ceux-ci sont correctement codés pour les extraits de lien (voir le premier point).
John Mueller
la source
Nous aurons le formulaire de «substitution» enregistré et redirigeant afin de répondre aux deux premières préoccupations que vous mentionnez. Pour le reste, nous nous sommes habitués à utiliser UTF-8 :)
Kris
10

L'encodage des caractères de votre système de gestion de contenu est un problème qui me vient à l'esprit. De plus, si vous faites la promotion de votre site Web, de nombreuses entrées de validation d'URL se briseront probablement sur votre URL.

Virtuosi Media
la source
Bons points. Nous utilisons notre propre logiciel, nous n'aurons donc pas à nous soucier des particularités du CMS, mais je peux voir que cela peut être un problème pour les autres. Quant aux promotions ... Je ne m'attends pas à ce que nous fassions beaucoup de cela.
Kris
8

(1) FTP

Il semble que vous ayez besoin d'un client FTP capable de gérer les IDN car il nécessite un support spécial. Sur la base de ce que j'ai lu lors de mes recherches, ce support semble être répandu et une caractéristique commune à tous les principaux clients FTP.

(2) serveurs / clients de messagerie;

D'après l'article de wikipedia pour International Email, il semble que l'assistance par e-mail n'est pas complète:

Étant donné que les normes de courrier électronique traditionnelles contraignent toutes les valeurs d'en-tête de courrier électronique à des caractères ASCII uniquement, il est possible que la présence de caractères UTF-8 dans les en-têtes de courrier électronique diminue la stabilité et la fiabilité du transport de ce courrier électronique. En effet, la plupart des serveurs de messagerie, sinon tous, au moment de la rédaction de ce document, ne prennent pas en charge ces caractères.

Une méthode a été proposée par les membres de l'IETF, par laquelle le courrier électronique peut être rétrogradé au format "hérité" tout ASCII que tous les serveurs de courrier électronique standard devraient prendre en charge. Ce mécanisme de rétrogradation répond à l'exigence selon laquelle le transport de courrier électronique doit être aussi robuste et fiable que possible.

.

(3) Quels navigateurs ont du mal avec les domaines?

Il semble que tous les principaux navigateurs prennent en charge les IDN et le font depuis au moins deux ans. Le seul vrai problème que vous pourriez avoir concerne les anciens navigateurs qui ne prennent pas en charge l'IDN. Mais comme IE semble l'avoir pris en charge depuis IE7 et la mise à jour rapide de la base d'utilisateurs des autres principaux navigateurs, cela devrait être un petit nombre d'utilisateurs.

(4) Qu'en est-il des appareils mobiles?

Bonne question. Il semble que le nom de domaine .mobi ne prenne pas en charge les IDN. Je n'ai rien trouvé de spécifique aux appareils eux-mêmes, mais j'ai trouvé des entreprises affirmant avoir des solutions pour les IDN sur mobile, donc je suppose que le support natif peut ne pas exister ou n'est pas complet.

(5) a quelque chose changé sur le sujet - cela fait presque un an que la question a été posée.

Certains TLD spécifiques à un pays ont ajouté un support et il semble que les spammeurs ont trouvé un moyen de les exploiter . Mais c'est à peu près autant de choses qui ont changé.

John Conde
la source
1
  1. Squatters ou de la concurrence * se * acheter la version romanisée de votre nom de domaine, par la suite.

    Donc, si cela a une importance (ou qui peut prendre de l'importance avec le temps), vous devrez acheter les deux .

  2. Spammeurs et hameçonneurs .
    Unicode est plein de caractères qui ressemblent beaucoup à des caractères latins.

    Ils commencent seulement à les utiliser en ce moment, mais dans quelques mois, les noms IDN inutiles pourraient commencer à sembler être du phishing .

  3. Les visiteurs internationaux avec une disposition de clavier non islandaise pourraient simplement vous détester. Mais alors, si vous ne prévoyez pas de mettre ce nom sur une carte de visite, ce n'est peut-être pas si grave.

Quoi qu'il en soit ... ☺.com doit être l' état de l'art de l'utilisation non nécessaire des IDN

Post-Scriptum: Devinez qui ne prend pas en charge les IDN comme ☺.com ? Stackexchange :)
J'ai dû creuser pour le code xn à la main. : /

ZJR
la source
2
Nous achetons toujours les deux formes. En fait, le registraire .is réduit considérablement le formulaire IDN dans ces cas, donc ce n'est pas vraiment un problème.
Kris
C'est très bien de savoir que les bureaux d'enregistrement le font. Ça a du sens pour eux.
ZJR
0

Nous avons essayé d'utiliser la version IDN du domaine par défaut, mais nous avons finalement rencontré des problèmes avec certains navigateurs (y compris Firefox) et Adobe Reader où le nom de domaine IDN venait d'être modifié dans le transfert au plug-in du navigateur.

Alors maintenant, nous utilisons le mode «sans échec» et l'IDN y fait simplement une redirection 301.

Kris
la source