Depuis l'avènement de twitter et ses messages limités à 140 caractères (tweets), l'économie de caractères a fait apparaitre un nouveau type de service sur le web : les raccourcisseurs d'url. Le principe est simple : transformer une url (souvent très longue) en une url beaucoup plus courte d'une vingtaine de caractères. Ainsi lorsqu'on clique sur le lien raccourcit, celui-ci redirige vers la page originale.
Le plus utilisé est sans conteste bit.ly puisque utilisé par défaut pas Twitter. Mais si ces centaines de raccourcisseurs d'url offrent des prestations plus ou moins utiles (stats, mot de passe, personnalisation), les internautes oublient souvent le principe même du service : une redirection. Et c'est là que le bas blesse.
la redirection se fait souvent via un header http qui contient l'adresse de la page de destination (celle avec la longue url). Si pour les êtres humains le header n'est pas quelque chose d'important, pour les robots c'est leur raison d'être. Les headers envoient de nombreuses informations comme le type de la page (texte, image, vidéo), sa taille, sa date de modification, son encodage et son code http.
Lne page normale renvoie un code 200 signifiant que la page a bien été trouvée. La fameuse erreur 404 indique au contraire que la page n'a pas été trouvée. Il y a ensuite les pages de redirections qui renvoient un code 301, 302 voire 303 selon le type de redirection.
- Redirection 301 : ce type de redirection est une redirection permanente, les robots ne vont donc indexer que la page de destination, celle qui vous intéresse.
- Redirection 302 : ce type de redirection est une redirection temporaire (utilisée par exemple lorsqu'un site web est en maintenance). Les robots ne vont donc pas indexer la page de destination car pour eux elle n'est là que temporairement.
- Redirection 303 : même chose que pour une redirection 302 mais en changeant de méthode (passage de POST à GET par exemple).
Donc si vous voulez que les robots d'indexation suivent votre lien raccourci, il faut que celui-ci renvoie une redirection 301. Or parmi tous les raccourcisseurs d'url, une grande partie renvoie un code de redirection 302 ce qui est très mauvais pour le référencement du lien de destination.
Le problème est donc de savoir quelle type de redirection utilise votre raccourcisseur d'url préféré. j'ai donc codé un petit outil qui vous permet de tester les liens courts fournis pour déterminer le type de redirection. Et pour chaque service le type de redirection est gardé pour comparer ces services entre eux.
A l'heure actuelle, une bonne partie des service testés utilisent des redirections 302 alors que les poids lourds tels que bit.ly ou encore tinyurl utilisent bien une redirection 301 qui assure un bon suivi par les robots. Et dans le tas il y aussi de nombreux services qui utilisent une simple frame pour afficher le site de destination, ce qui est encore plus mauvais.
Le 22/10/09 à 15h20
Bonjour,
"Le plus utilisé est sans conteste bit.ly puisque utilisé par défaut pas Twitter"
La logique est inverse, c'est parce qu'il était le plus utilisé (incontestablement grâce à son système de stat.) qu'il a été intégré à Twitter, ce qui in fine lui garantit le quasi monopole du marché des raccourcisseurs d'url.
D'autre part, pour ceux dont les rouages d'un tel script intéresserait : http://lilurl.sourceforge.net/
Le 22/10/09 à 15h31
[désolé pour le double post]
Concernant, ton script de test, il serait peut-être judicieux de préciser que c'est une adresse raccourcie qu'il faut entrer, pas l'adresse du raccourcisseur.
Ça semble évident mais ça peut porter à confusion et générer des verdicts erronés.
Le 15/11/09 à 11h34
Si un tel raccourcisseur vous intéresse : http://code.google.com/p/phurl/