Wir renovieren (Teil 6): Noch bessere Suche im Web-O-Mat

22. Oktober 2015

Bisher konnten die Ergebnisse einer Suche entweder nach Datum oder nach Relevanz sortiert werden. Beide Varianten waren nicht perfekt:

  • bei der Datums-Sortierung standen manchmal recht unwichtige Ergebnisse weit oben
  • bei der Relevanz-Sortierung standen manchmal ziemlich alte Ergebnisse weit oben

Ab sofort ergibt sich die Gesamtrelevanz eines Suchtreffers (also die Position innerhalb der Treffer-Liste) aus beiden Kriterien, nämlich der Bewertung durch die Volltextsuche und der Aktualität des Eintrags. In anderen Worten: Einträge werden zwar nach ihrer Trefferqualität sortiert, aber gleichzeitig in der Liste nach unten gedrückt, wenn sie älter werden.

Damit wird die manuelle Einstellung der Sortierung überflüssig, die Suche ist leichter zu bedienen und liefert bessere Ergebnisse.

Es ist Mathematik

Mathematisch betrachtet multiplizieren wir zwei Zahlen zu einer Gesamtrelevanz.

Die erste Zahl ist die Bewertung durch die Volltext-Suche. Sie berücksichtigt hauptsächlich:

  • die Häufigkeit der Suchworte in Titel und Text eines Eintrags
  • die Gesamthäufigkeit der Suchworte in allen gespeicherten Einträgen – wenn ein Wort insgesamt selten ist, hat ein Treffer ein höheres Gewicht
  • die Länge der durchsuchten Textteile – da z.B. die Titel kürzer sind als die Texte, ist das Gewicht eines Treffers hier höher

Die zweite Zahl bewegt sich zwischen 1 (für eine Meldung, die genau zum Zeitpunkt der Suche veröffentlicht wurde) und nahezu 0 (für eine sehr alte Meldung). Der Verlauf dieser Bewertung über dem Alter – also der Differenz aus dem Zeitpunkt der Suche und Datum/Uhrzeit eines Eintrags – wird durch eine Gauß-Funktion (auch: Gaußsche Glockenkurve) beschrieben.

Feedback

Fragen, Kritik oder Anregungen? Schreib' an internet@bayernspd.de.

Das war's für heute. Bis bald!
Euer Web-O-Mat-Team

PS: Im Archiv auf der Website zum Web-O-Mat kannst Du alle Newsletter nachlesen.

Teilen