Stichwort

German

Browsing

Früher war alles besser? Für Analytics-Projekte gilt das sicherlich nicht. Mit modernen Auswertungstools, Künstlicher Intelligenz und vielen neuen Möglichkeiten der Datenspeicherung und Verarbeitung in der Cloud, sprich Modern Cloud Analytics, stehen uns heute mehr Möglichkeiten offen als je zuvor. Doch eines kann man wahrscheinlich schon sagen: Früher war vieles einfacher. Denn um diese neuen Möglichkeiten voll ausschöpfen zu können, greifen viele Rädchen ineinander. Daten aus verschiedensten Quellen und in unterschiedlicher Form werden gesammelt, aufbereitet, mit…

Hat man sich denn nicht immer mal gefragt was so hinter dem Vorhang bei Suchmaschinen abläuft. Warum sind sie so schnell? Wie lautet der Such-Algorithmus von Google?

Vielleicht können wir wenigstens eine der beiden Fragen klären. Google hütet sein Geheimnis gut, aber wer z.B. auch alternative Suchmaschinen wie DuckDuckGo kennt, der kann hier einmal hinter die Kulissen schauen. Den DuckDuckGo funktioniert mit der Suchmaschinen API Lucene.

Apache Lucene ist eine hochperformante Suchmaschinen Bibliothek, die komplett in Java geschrieben ist. Wer direkt in die Tiefen der API eintauchen will kann sich das Projekt von der Homepage runterladen und in den Quellcode reinschnuppern: Apache Lucene.

Wer aber erst einmal ein grobes Verständnis über die Technologie dahinter erhalten möchte, kann sich den Einstieg auch mit diesem Artikel erleichtern.