Kategorie

Tools & Methoden

Kategorie

Kaum ein Tag vergeht, ohne, dass neue Meldungen über die Digitalisierung veröffentlicht werden, die über Potenziale, Herausforderungen oder neue Technologien berichten. Was steckt aber eigentlich dahinter? Im Grunde genommen lassen sich verschiedene Trends beobachten, die sich gegenseitig treiben: Auf Seiten der Infrastruktur sind Rechenleistung und Bandbreite extrem gestiegen, sodass immer…

Hat man sich denn nicht immer mal gefragt was so hinter dem Vorhang bei Suchmaschinen abläuft. Warum sind sie so schnell? Wie lautet der Such-Algorithmus von Google?

Vielleicht können wir wenigstens eine der beiden Fragen klären. Google hütet sein Geheimnis gut, aber wer z.B. auch alternative Suchmaschinen wie DuckDuckGo kennt, der kann hier einmal hinter die Kulissen schauen. Den DuckDuckGo funktioniert mit der Suchmaschinen API Lucene.

Apache Lucene ist eine hochperformante Suchmaschinen Bibliothek, die komplett in Java geschrieben ist. Wer direkt in die Tiefen der API eintauchen will kann sich das Projekt von der Homepage runterladen und in den Quellcode reinschnuppern: Apache Lucene.

Wer aber erst einmal ein grobes Verständnis über die Technologie dahinter erhalten möchte, kann sich den Einstieg auch mit diesem Artikel erleichtern.

Apache Kafka ist eine verteilte Streaming-Plattform und wird benötigt um verschiedenste Datenströme zu verteilen. Mit seiner Skalierungsfähigkeit und dem extrem hohen Datendurchsatz ist Kafka wie geschaffen für die Big Data Welt. In dieser kleinen Serie werde ich Kafka vorstellen und eine kurze Einführung geben.