Session-URLs und Ihre Folgen
April 27th, 2008
Viele Shops setzen zur Verfolgung der Kunden-Sessions sowohl Cookie- als auch URL-Tracking ein. Letzteres stellt für Suchmaschinen ein großes Problem dar. Die Uniqueness einer Seite wird normalerweise über die URL ermittelt, da diese per Definition eindeutig ist. Session-Parameter vereiteln dieses Verfahren, da nach jeder Sitzung ein neuer zufälliger Session-Wert generiert wird. Es ist für einen Suchmaschinen-Crawler daher nicht ohne weiteres feststellbar, ob eine dynamische Seite bereits indexiert wurde oder nicht.
Um dieses Problem ohne manuelles Eingreifen umgehen zu können haben wir eine Technologie entwickelt, die dynamische Session-Bestandteile einer URL erkennt und entfernt. Wir arbeiten dabei mit einer Kombination aus Text-Mustererkennung (reguläre Ausdrücke) und einem statistischen Verfahren. Der Algorithmus muss für jeden Shop initial parametrisiert werden und durchläuft dann eine kurze, voll automatisierte Lernphase.
Wir setzen das Verfahren seit einigen Monaten sehr erfolgreich bei über 300 Shops ein. Einige wenige Versandhäuser verwenden die URL, um komplexe Informationen kodiert und teilweise chiffriert zu transportieren. Hier scheitert unser Ansatz bisher. Wir sind jedoch zuversichtlich, dass sich diese Form der Zweckentfremdung der URL nicht durchsetzen wird.
Entry Filed under: Allgemein
Einen Kommentar schreiben
Erlaubte HTML-Tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>
Trackback zu diesem Beitrag | Kommentar-RSS-Feed abonnieren