— „Mögen die Daten mit euch sein!“ —
Einwahldaten und Zugangscode #ChrisBacca
Unter dem Motto: „Mögen die Daten mit euch sein!“ begann am Mittwoch, den 28.06.2017 auf der TDWI Konferenz in München der Star Wars Hackathon.
Als TDWI Young Guns möchten wir euch einen kurzen Eindruck über die Veranstaltung geben. Bereits um 9 Uhr trafen wir uns im Raum E124 um mit dem Hackathon zu starten. Nach einer kurzen Präsentation über „Cognitive Computing“ folgte eine Vorstellung der TDWI Young Guns. Wie es bereits auf dem Young Guns Barcamp in Köln (Link) üblich war, stellten sich die rund 15 Teilnehmer mit ihren drei persönlichen Hashtags vor.
Anschließend wurde der Showcase vorgestellt und die grobe Aufgabenstellung erläutert. Dabei fragten wir uns, ob es möglich ist, neue und vor allem verwertbare Erkenntnisse aus unstrukturierten Daten mithilfe von „Cognitive Computing“ automatisiert in wenigen Stunden zu generieren.
Ziemlich schnell zeigten sich nach ein paar organisatorischen Informationen wie Benutzername und Wlan die ersten großen Fragezeichen über den Teilnehmern. Wir sollten Teams mit gleichen Interessen und Zielen innerhalb des Hackathons bilden. Denn jedes Team hatte eine andere Aufgabe bzw. Analyse vorzubereiten. Zur Auswahl standen:
#PersonalityInsights
Identifiziert aus transaktionsorientierten- und Social-Media-Daten (Psychologische Charaktermerkmale)
#ToneAnalyzer
Identifiziert anhand des Tonfalls in einem Text Emotionen wie zum Beispiel Ü„rger, Ekel, Furcht, Freude und Traurigkeit und erkennt soziale Eigenschaften (Offenheit, Gewissenhaftigkeit, Extrovertiertheit und Freundlichkeit).
#NaturalLanguageUnderstandig
Analysiert semantische Merkmale von Texteingaben in unstrukturierten Texten. Diese Merkmale können sein: Kategorien, Konzepte, Emotionen, Entitäten, Schlüsselwörter, Metadaten, Beziehungen, semantische Rollen und Stimmungen.
#NaturalLanguageClassifier
Verwendet Algorithmen für maschinelles Lernen, um für kurze Texteingaben die vordefinierten Klassen zurückzugeben, die die höchste Übereinstimmung aufweisen.
Das hörte sich extrem spannend an und alle wollten sofort loslegen und die hinterlegen Star Wars Daten mit den entsprechenden Funktionen analysieren. Allerdings fiel es den meisten Teilnehmern schon relativ schwer, sich in der neuen Oberfläche von IBM Bluemix zurecht zu finden. Die erste Zeit war man tatsächlich mehr damit beschäftigt, einen groben Überblick über Bluemix und die Services zu bekommen, als mit der eigentlichen Aufgabe zu starten.
Nach der etwas länger ausfallenden Einarbeitung haben wir uns innerhalb unseres Teams darauf geeinigt, uns mit dem #NaturalLanguageClassifier zu beschäftigen. In unserem Szenario wollten wir herausfinden, welche Texteingaben, in unserem Fall Filmzitate, zu welchem Star Wars Charakter gehören.
Dafür war es notwendig, die bereits vorhandenen Textdokumente mit allen entsprechenden Filmzitaten aufzubereiten und zu trainieren. Dabei wurden die Daten für Trainingszwecke des Algorithmus in Trainings- und Testdaten, im Verhältnis 80%/20%, aufgeteilt. Hiermit sollte der Algorithmus ausreichend trainiert werden, um die richtigen Resultate zu zeigen. In der Theorie hört sich dies tatsächlich bedeutend leichter an als in der Praxis. Die Trainingsdaten reichten bis zum Ende einfach nicht aus, um gute Trefferquoten bei eingegebenen Zitaten zu erhalten. Dies ließ sich auch nach mehrfachem Trainieren nicht signifikant verbessern.
Alles in allem war der Hackathon eine sehr spannende und lehrreiche Veranstaltung. Wir haben viel Neues über Machine-Learning-Verfahren und auch ein wenig über Star Wars gelernt. 😉
Von daher“¦
#Danke #YoungGuns #MögeDieMachtMitEuchSein!
Viele Grüße
Fabian und Christian
2 Kommentare
Klingt wirklich sehr interessant! 🙂
Pingback: TDWI 2017 – Ein Erfahrungsbericht der OC Young Guns | The Cattle Crew Blog