Analyse von Nutzerverhalten basierend auf Web-Protokoll-Daten am Beispiel von billiger.de

Statistische Aussagen auf Basis von Webseitenbesuchsprotokollen, wie beispielsweise die Click-Through-Rate, also die Anzahl der Klicks auf gelistete Angebote im Verhältnis
zu den gesamten Besuchen auf der Webseite, sind durch den deutlich dominierenden Bot-Anteil unter den Nutzern stark verfälscht. Preisvergleichsportale wie billiger.de haben das Bedürfnis, Nutzer ihrer Webseite in homogene Gruppen zu unterteilen, um präzise und zuverlässige betriebswirtschaftliche Kennzahlen aus den Gruppen zu berechnen. In dieser Masterarbeit soll das Navigationsverhalten (Traces) der Nutzer aus serverseitigen Web-Protokoll-Daten ermittelt werden. Aus den (heuristisch) rekonstruierten Traces sollen verschiedene Features extrahiert werden, sodass mit Hilfe von (un- und semi-überwachten) maschinellen Lernverfahren das Nutzerverhalten in homogene Gruppen unterteilt werden kann. Im Anschluss soll die Qualität dieser Unterteilung untersucht werden.

Data Innovation Community

Industrie 4.0

Projektpartner

Billiger.de – ein Projekt der solute gmbh
Harun Sentürk (KIT)

Ansprechpartner

Harun Sentürk (KIT), harun.sentuerk@student.kit.edu
Ulrich Wünstel (solute gmbh), ulw@solute.de

Zeitraum

Oktober 2017 – März 2018