Apache Lucene Basics

Hat man sich denn nicht immer mal gefragt was so hinter dem Vorhang bei Suchmaschinen abläuft. Warum sind sie so schnell? Wie lautet der Such-Algorithmus von Google?

Vielleicht können wir wenigstens eine der beiden Fragen klären. Google hütet sein Geheimnis gut, aber wer z.B. auch alternative Suchmaschinen wie DuckDuckGo kennt, der kann hier einmal hinter die Kulissen schauen. Den DuckDuckGo funktioniert mit der Suchmaschinen API Lucene.

Apache Lucene ist eine hochperformante Suchmaschinen Bibliothek, die komplett in Java geschrieben ist. Wer direkt in die Tiefen der API eintauchen will kann sich das Projekt von der Homepage runterladen und in den Quellcode reinschnuppern: Apache Lucene.

Wer aber erst einmal ein grobes Verständnis über die Technologie dahinter erhalten möchte, kann sich den Einstieg auch mit diesem Artikel erleichtern.

1 2 3 6