Im vorherigen Beitrag haben wir uns mit den drei Fragen “Warum ist automatisierte Textklassifikation sinnvoll?”, “Wo kann Textklassifikation eingesetzt werden?” und “Was sind die Schritte von den Daten bis zur Klassifizierung?” beschäftigt. In diesem Blogbeitrag möchten wir den ersten Schritt genauer erläutern, den Daten in einem typischen Textklassifizierungsszenario durchlaufen: Die Datenvorverarbeitung (s. Abbildung 1).  Als Beispiel dient uns ein Projekt, in dem deutschsprachige Zeitschriftenartikel klassifiziert werden. An ihm lassen sich die Grundlagen der Datenvorverarbeitung sehr…

An Old Book and Candles on Wooden Table with Glass Bottles

Kann eine Word Cloud Gedanken lesen? Welche Magie steckt hinter NLP, Python und Power BI? In einem Experiment durften wir Harry Potter, Ron und Hermine mit Methoden des Natural Language Processings (NLP) in Word Clouds verwandeln. Was haben wir über sie erfahren? Und haben Harry, Ron und Hermine den Versuch überlebt? Der Tagesprophet traf die Zauberlehrlinge zu einem exklusiven Interview.

In der heutigen Zeit entsteht eine gewaltige Menge an Daten, die von Menschen nicht in absehbarer Zeit verarbeitet werden können. Ein großer Teil davon sind Texte, in denen wertvolle Informationen stecken können. Mithilfe von Textklassifikation – ein Teilgebiet im Feld des Natural Language Processings, ist es möglich, große Volumen von unstrukturierten Textdaten auf verschiedene Weise zu organisieren und ihnen wichtige Informationen zu entnehmen. Dafür werden Machine-Learning-Modelle entwickelt, deren Ziel ist, einem neuen, noch nie gesehenen Text, eine Kategorie aus einer Gruppe von vorgegebenen Kategorien zuzuweisen. Ein gutes Beispiel für Textklassifikation ist die Spam-Filterung.

Sicherheit ist aktuell wichtiger denn je und wird auch in Zukunft immer wichtiger werden. Um diese Sicherheit zu gewährleisten sind gute, schnelle und effiziente Verschlüsselungsalgorithmen von Nöten. Blockchiffren sind Verschlüsselungen für große Dateien und zählen zur sog. symmetrischen Kryptographie, wo Sender und Empfänger den gleichen Schlüssel für Ver- und Entschlüsselung nutzen. Einer der genannten Verschlüsselungen ist die 1998 veröffentlichte Blockchiffre AES, deren Aufbau hier genauer erläutert wird.