Vidéo: Advisory Council Meeting, 14 October, Berlin 2025
Les identifiants de session peuvent rendre la vie du moteur de recherche intéressante. Un ID de session identifie une personne particulière visitant le site à un moment donné, ce qui permet au serveur de suivre les pages consultées par le visiteur et les actions qu'il effectue pendant la session.
Si vous demandez une page sur un site Web, le serveur Web auquel la page est associée l'envoie à votre navigateur. Ensuite, si vous demandez une autre page, le serveur envoie également cette page, mais le serveur ne sait pas que vous êtes la même personne. Si le serveur a besoin de savoir qui vous êtes, il doit pouvoir vous identifier chaque fois que vous demandez une page. Il le fait en utilisant des identifiants de session.
Les ID de session sont utilisés pour diverses raisons, mais leur but principal est de permettre aux développeurs Web de créer différents types de sites interactifs. Par exemple, si les développeurs ont créé un environnement sécurisé, ils voudront peut-être forcer les visiteurs à passer d'abord par la page d'accueil. Ou, les développeurs peuvent vouloir un moyen de reprendre une session inachevée.
En configurant des cookies contenant l'ID de session sur l'ordinateur du visiteur, les développeurs peuvent voir où se trouvait le visiteur sur le site à la fin de la dernière session du visiteur.
Les ID de session sont courants lors de l'exécution d'applications logicielles qui nécessitent des procédures de sécurité, qui doivent stocker des variables ou vaincre le cache du navigateur, c'est-à-dire s'assurer que le navigateur affiche toujours les informations à partir du serveur, jamais à partir de son propre cache. Les systèmes de panier d'achat utilisent généralement des identifiants de session - c'est ainsi que le système peut vous permettre de placer un article dans le panier, puis de partir et de continuer à magasiner. Il vous reconnaît en fonction de votre identifiant de session.
Un identifiant de session peut être créé de deux façons:
-
Stockez-le dans un cookie.
-
L'afficher dans l'URL elle-même.
Certains systèmes sont configurés pour stocker l'ID de session dans un cookie, puis utiliser un ID de session d'URL si le navigateur de l'utilisateur est configuré pour ne pas accepter les cookies. Voici un exemple d'URL contenant un ID de session:
// votredomaine. com / index. jsp; jsessionid = 07D3CCD4D9A6A9F3CF9CAD4F9A728F44
L'élément 07D3CCD4D9A6A9F3CF9CAD4F9A728F44 de l'URL est l'identifiant unique attribué à la session.
Si un moteur de recherche reconnaît une URL incluant un ID de session, il ne lit probablement pas la page référencée, car chaque fois que le moteur de recherche renvoie vers votre site, l'ID de session a expiré. suivant:
-
Afficher une page d'erreur plutôt que la page indexée ou peut-être afficher la page par défaut du site. En d'autres termes, le moteur de recherche a indexé une page qui n'existe pas si quelqu'un clique sur le lien dans la page de résultats de recherche.
-
Attribuer un nouvel identifiant de session. L'URL que le moteur de recherche utilisé à l'origine a expiré, de sorte que le serveur remplace l'ID par un autre et modifie l'URL. Ainsi, l'araignée pourrait être alimenté plusieurs URL pour la même page.
Même si le chercheur lit la page référencée, il peut ne pas l'indexer. Les webmasters se plaignent parfois qu'un moteur de recherche est entré sur leur site, a demandé la même page encore et encore, et est parti sans indexer la majeure partie du site. Le chercheur s'est simplement embrouillé et est parti. Ou, parfois, le moteur de recherche ne reconnaît pas un identifiant de session dans une URL. Un client avait des centaines d'URL indexées par Google, mais comme il s'agissait d'identifiants de session expirés depuis longtemps, ils indiquaient tous la page principale du site.
Ce sont tous des pires scénarios, car les moteurs de recherche des principaux moteurs de recherche font de leur mieux pour reconnaître les identifiants de session et contourner ces derniers. En outre, Google recommande que si vous utilisez des ID de session, vous utilisez la directive canonique pour indiquer aux moteurs de recherche l'URL correcte pour la page. Par exemple, disons que vous utilisez des identifiants de session, et que vos URL ressemblent à ceci:
// www. youdomain. com / produit. php? item = rodent-racing-gear & xyid = 76345 & sessionid = 9876
Un moteur de recherche peut se retrouver avec des centaines d'URL référençant effectivement la même page. Ainsi, vous pouvez mettre l'étiquette dans la section de vos pages web pour dire aux moteurs de recherche l'URL correcte, comme ceci:
Les problèmes d'identification de session sont plus rares qu'ils étaient autrefois; Dans le passé, la correction d'un problème d'identification de session ressemblait à de la magie: les sites invisibles aux moteurs de recherche deviennent soudainement visibles! Un propriétaire de site dans un groupe de discussion sur les moteurs de recherche a expliqué que son site n'avait jamais enregistré plus de 6 pages indexées par Google. Pourtant, moins d'une semaine après la suppression des identifiants de session, Google avait indexé plus de 600 pages.
Si votre site comporte un problème d'identifiant de session, vous pouvez effectuer d'autres opérations en plus de l'utilisation de la directive canonique:
-
Plutôt que d'utiliser des ID de session dans l'URL, stockez les informations de session dans un cookie l'ordinateur de l'utilisateur. Chaque fois qu'une page est demandée, le serveur peut vérifier le cookie pour voir si les informations de session y sont stockées. Toutefois, le serveur ne doit pas exiger des cookies , sinon vous risquez de rencontrer d'autres problèmes.
-
Demandez à votre programmeur d'omettre les ID de session si le périphérique demandant une page Web à partir du serveur est un robot de recherche. Le serveur fournit la même page au moteur de recherche, mais n'attribue pas d'ID de session, de sorte que le moteur de recherche peut parcourir tout le site sans utiliser d'ID de session. Ce processus est connu sous le nom de distribution d'agent utilisateur, , dans lequel l'agent utilisateur fait référence à l'appareil - navigateur, moteur de recherche ou autre programme - qui demande une page.
La méthode de l'agent utilisateur a un problème potentiel: Dans la technique parfois appelée dissimulation, un serveur envoie une page aux moteurs de recherche et une autre aux visiteurs du site réel.Les moteurs de recherche n'aiment généralement pas le camouflage parce que certains sites tentent de les tromper en fournissant un contenu différent du contenu que les visiteurs du site voient.
Bien sûr, dans le contexte de l'utilisation de cette technique pour éviter le problème d'identification de session, ce n'est pas l'intention; c'est une façon de montrer le même contenu que le visiteur du site voit, donc ce n'est pas vrai camouflage. Cependant, le danger est que les moteurs de recherche peuvent le voir comme un camouflage s'ils découvrent ce qui se passe.
