http://www.zanox.com/de/publisher/success_stories/success-story-cheap-charlie.html
]]>Um dieses Problem ohne manuelles Eingreifen umgehen zu können haben wir eine Technologie entwickelt, die dynamische Session-Bestandteile einer URL erkennt und entfernt. Wir arbeiten dabei mit einer Kombination aus Text-Mustererkennung (reguläre Ausdrücke) und einem statistischen Verfahren. Der Algorithmus muss für jeden Shop initial parametrisiert werden und durchläuft dann eine kurze, voll automatisierte Lernphase.
Wir setzen das Verfahren seit einigen Monaten sehr erfolgreich bei über 300 Shops ein. Einige wenige Versandhäuser verwenden die URL, um komplexe Informationen kodiert und teilweise chiffriert zu transportieren. Hier scheitert unser Ansatz bisher. Wir sind jedoch zuversichtlich, dass sich diese Form der Zweckentfremdung der URL nicht durchsetzen wird.
]]>Der vielleicht wichtigste Unterschied zu den großen Universal-Suchmaschinen besteht im Konzept des geschlossenen Indexes, d.h. welche Domains der Crawler mit welcher Tiefe durchsucht muss für jede Domain manuell konfiguriert werden. Mit diesem Ansatz können wir sehr präzise kontrollieren, welche Inhalte in den Index aufgenommen werden und so Experten-Suchmaschinen generieren. Aufwand fällt fast ausschließlich bei der initialen Konfiguration an, während die sich anschließenden Prozesse voll automatisch ablaufen.
Die erste mit der neuen Technologie generierte Expertensuchmaschine geht das Shopping-Thema an. Die Fokussierung auf Online-Shops ermöglicht es uns, bei Shopping-Suchen überdurchschnittlich relevante Suchergebnisse zu liefern. Gegenwärtig haben wir etwas mehr als 300 Online-Shops in der Suchmaschine - für Suchanfragen im Long Tail Bereich viel zu wenig. Um auch bei Nischenprodukten gute Suchergebnisse liefern zu können, werden wir das Shop-Angebot noch stark ausbauen müssen.
]]>