Die Wahl Donald Trumps zum Präsidenten der USA ist ein Ereignis des Jahres 2016, das auch hierzulande überrascht und, um es vorsichtig zu formulieren, gemischte Gefühle ausgelöst hat. Der kommende Amtswechsel am 20. Januar gibt Anlass zur Frage: Wie muss sich das als Bürger anfühlen? Haben Sie sich schon überlegt, wer in Deutschland Bundeskanzler werden müsste, um gleichermaßen zu polarisieren?

Unsere Forschungsabteilung hat im Entwicklungsprozess eine Antwort darauf entdeckt. Wie? Mit einer modernen Methode der Textanalyse, die sich Word Embedding nennt.

Im Laufe unseres Lebens lernen wir logisches Denken. Uns fällt es leicht, Wörter in Kategorien zu sortieren oder ähnliche Begriffe zu erkennen. Suchen wir nach einem deutschen Pendant zu Donald Trump, dann scannen wir automatisch die Kategorie „Deutsche in der Öffentlichkeit“. Verlangen wir das Gleiche von Programmen, kommen diese schnell an ihre Grenzen. Denn die Logik der Maschinen besteht nicht aus Wörtern, sondern aus Zahlen.

Unser Data Scientist Simone Di Stefano arbeitet zurzeit mit einer Methode, die es erlaubt, Wörter auf einen Zahlenraum abzubilden (Vektorisierung). Damit bringt er Maschinen bei, Begriffe ähnlich zu systematisieren wie wir Menschen, indem sie lernen diese zu vergleichen und in Beziehung zu setzen.

Das Ganze funktioniert vereinfacht dargestellt so:

Wir stellen dem System einen großen Index aus Texten zur Verfügung. Aktuell dienen uns dabei über 650 Millionen Wörter als Grundlage für unsere Abfragen. Daraus registriert das System, welche Wörter in welchem Kontext genutzt werden. Diese Wortbedeutungen werden in über 300 Dimensionen als Vektoren dargestellt. In unserem Fall könnten die Dimensionen zu Donald Trump zum Beispiel „Erfolg“, „TV“, „Männlichkeit“, „Frisur“, usw. sein. Da diese Anzahl an Dimensionen die menschliche Vorstellungskraft deutlich übersteigt, stellen wir uns vereinfacht Vektoren im zweidimensionalen Koordinatensystem vor.

(Die Abbildung zeigt Vektoren, die Ländern die jeweiligen Hauptstädte zuordnen.)

 

Anhand der räumlichen Anordnung der Vektoren erkennt das System Wortzusammenhänge und -ähnlichkeiten und ist in der Lage Kategorien zu bilden. Es ordnet Donald Trump also wahrscheinlich den Kategorien „Präsidenten“ und „USA“ zu aber möglicherweise auch der Kategorie „temperamentvolle Promis“.

So ist unser Echobot System ist jetzt in der Lage, mit einfachen Formeln ähnliche Wörter und Wortzusammenhänge zu berechnen. Dies ist zwar nicht der eigentliche Zweck der Methode, funktioniert in vielen Fällen aber überraschend gut. Die Anfrage, die sich übersetzen lässt als „Was verhält sich zu Deutschland, wie Rom zu Italien“ wird korrekt mit „Berlin“ beantwortet. Auch Klischees hat das System gelernt: „Was verhält sich zu Baguette, wie Italiener zu Pizza“? Die Antwort: der „Franzose“.

(Franzose liegt am nächsten innerhalb des Ergebnisradius um <REF>.)

 

Intelligente Begriffserkennung

Wir arbeiten für Sie mit den modernsten Methoden der Sprachforschung. Momentan befinden wir uns in der Entwicklungsphase und zielen darauf ab, mit dieser Methode unsere Signalerkennung für Echobot SalesTARGET zu erweitern. Diese ermöglicht Echobot Nutzern geschäftsrelevante Ereignisse zu ihren Kunden, Lieferanten und Geschäftspartnern automatisch zu erkennen. Der intelligente Crawler erkennt mit dem oben dargestelltem Verfahren künftig auch Begriffe, die ihm nicht beigebracht wurden, aber für ein bestimmtes Signal relevant sind. Das kann für umgangssprachliche Begriffe genauso wichtig sein, wie für Wortneuschöpfungen, die auf geschäftsrelevante Ereignisse hinweisen. Für Sie bedeutet das: Ihre Vertriebseffizienz steigt, weil Sie mit noch geringerem Rechercheaufwand umso treffendere Ergebnisse erzielen.

Fragen wir doch mal die Maschine:

Wer verhält sich zu Deutschland, wie Donald Trump zu den USA?

Soll heißen: Wen müssten wir Deutschen uns als Sieger der anstehenden Bundestagswahl vorstellen um das Trump-Feeling nach Deutschland zu übertragen? Wir suchen also eine Person für das Kanzleramt, deren Fähigkeitsprofil man nicht unbedingt mit einem Politikerjob in Verbindung bringen würde. Einen Regierungschef, der bei einem Teil der Bevölkerung beliebt und erfolgreich ist, was wiederum dem anderen Teil der Bevölkerung ein völlig unergründliches Rätsel aufgibt.

Die Maschine hat errechnet:

In knapper Konkurrenz zu Wolfgang Joop erscheint Dieter Bohlen auf dem Bildschirm:

 

Foto/Visualisierung Donald Trump: johnhain / pixabay