Im dritten und letzten Teil unserer Artikelreihe zur Textklassifikation geht es mit dem Training und der Evaluation von Modellen tief hinein ins Machine Learning: Das heißt, du wirst dabei sein, wenn wir anhand eines Beispieldatensatzes Modelle trainieren und evaluieren.
In der heutigen Zeit entsteht eine gewaltige Menge an Daten, die von Menschen nicht in absehbarer Zeit verarbeitet werden können. Ein großer Teil davon sind Texte, in denen wertvolle Informationen stecken können. Mithilfe von Textklassifikation – ein Teilgebiet im Feld des Natural Language Processings, ist es möglich, große Volumen von unstrukturierten Textdaten auf verschiedene Weise zu organisieren und ihnen wichtige Informationen zu entnehmen. Dafür werden Machine-Learning-Modelle entwickelt, deren Ziel ist, einem neuen, noch nie gesehenen Text, eine Kategorie aus einer Gruppe von vorgegebenen Kategorien zuzuweisen. Ein gutes Beispiel für Textklassifikation ist die Spam-Filterung.
„Hilfe, die Roboter kommen“, „Roboter nehmen uns die Arbeitsplätze weg“ diese und ähnliche Schlagzeilen gehen immer wieder durch die Medien.…