Le web n'est pas le print

Finalement tous mes efforts pour faire du web quelque chose de comparable au “print” sont vains. Depuis quelque temps j’essaye d’intégrer une mise en place de la césure optionnelle dans les textes affichés (billets et commentaires) afin d’obtenir un gris typographique du plus bel effet sur des textes justifiés. J’ai donc récupéré un code qui permet de le faire pour quelques langues comme le français, l’anglais, etc. Dans l’absolu pas de soucis. La transformation s’applique correctement, bien qu’elle augmente de manière significative la taille des textes enregistrés dans la base de données. Mais quand on aime la belle typo, on ne compte pas, n’est-ce pas ? Tous les navigateurs ont l’air de le supporter correctement, la vie est belle.

Et puis quelqu’un m’a demandé comment le moteur de recherche de Dotclear allait réagir à la présence de cette entité (­) dans les mots. Évidemment l’indexation n’en tient pas compte, en fait il considère ce caractère spécial comme n’importe quel autre caractère — ainsi le mot “discipline” sera indexé sous la forme “disci­pline” et pas sous sa forme naturelle — ce qui dénature complètement cette fonction. J’ai alors décidé de ne plus enregistrer la mise en place de la césure optionnelle mais de faire en sorte de l’appliquer uniquement au moment de l’affichage. On retrouve alors un moteur de recherche fonctionnel et une économie au niveau de la place occupée dans la base de données, tout ceci au détriment — que je n’ai pas expressément mesuré — de la vitesse d’affichage des pages HTML, puisque les caractères de césure sont dorénavant mis en place à la volée dans les textes juste avant leur affichage.

Et puis quelqu’un — le même d’ailleurs — m’a demandé comment les moteurs de recherche comme Google et consort allaient réagir à la présence de cette entité. Et bien soit ils réagissent comme le moteur de Dotclear, à savoir qu’ils considèrent ce caractère comme n’importe quel autre caractère constitutif du mot, soit, comme Google, comme un caractère séparateur de mot tout comme l’espace, le tiret, etc peuvent l’être. Du coup un texte correctement modifié pour permettre la césure, ce que prennent en compte les moteurs de rendu des navigateurs, n’est plus du tout indexé correctement par les moteurs de recherche !

Conclusion, il n’est pas possible aujourd’hui de proposer une césure optionnelle qui soit efficace et non intrusive pour les moteurs de recherche. Il va falloir attendre que ces derniers s’adaptent, ce qui peut prendre un certain temps voire même un temps incertain, et supprimer cette fonction en attendant des jours meilleurs. Peut-être d’ailleurs que les générations futures de nos navigateurs auront la bonne idée d’appliquer la césure eux-même, sans troubler les robots d’indexation et rendront du coup obsolète cette entité HTML qui existe pourtant depuis 1993 (au moins) !

Dommage…

Ajouter un commentaire

Les champs suivis d'un * sont obligatoires

Les commentaires peuvent être formatés en utilisant la syntaxe Markdown Extra.

Ajouter un rétrolien

URL de rétrolien : https://open-time.net/trackback/3201

Haut de page