Machine Learning

Intelligente Datenanalyse, Text-Mining und Entity Recognition

Aktuelle Verfahren aus dem Bereich Machine Learning – eine der wichtigsten Zukunftstechnologien – werden von Echobot eingesetzt, erforscht und weiterentwickelt. Durch maschinelles Lernen erreicht man mit weniger Aufwand über die Zeit bessere Ergebnisse. Machine Learning bedeutet, dass Algorithmen automatisch Entscheidungsregeln berechnen, z.B. ob in einem Text ein relevantes Business-Signal vorkommt oder nicht. Auch kann man automatisiert erkennen, von welcher Firma der Text handelt.

Sowohl für den Ja- als auch für den Nein-Fall wird eine große Anzahl von Beispielen benötigt, um gute Ergebnisse zu erzielen, da die Anzahl der möglichen Formulierungen für ein und denselben Sachverhalt sehr hoch ist. Da die Beispiele von Menschen selektiert werden müssen, ist die Erzeugung von Lern-Beispielen normalerweise teuer und langwierig. Grundlage der Echobot-Technologie ist eine intelligente Vorverarbeitung auf der Basis von Expertenwissen („Feature Engineering“), sodass die Machine-Learning-Algorithmen nicht nur den „rohen“ Text, sondern bereits abstrahierte und vereinfachte Datenstrukturen als Eingabe erhalten. Dadurch können mit erheblich weniger Beispielen bessere Ergebnisse erzielt werden und Echobot ist in der Lage, schneller neue Text-Analyse-Module zu entwickeln und einzusetzen.

“Das Internet ist die umfangreichste Quelle für Informationen zu Firmen und für aktuelle geschäftsrelevante Ereignisse. Echobot erforscht und entwickelt Machine-Learning-Technologien, um solche Erkenntnisse automatisch aus den in Textform vorliegenden Daten zu extrahieren, zu strukturieren und für unsere Kunden optimal nutzbar zu machen. Durch intelligente Datenverknüpfung erhält man neues Wissen über Firmenstrukturen, Bilanzen und die mit Firmen verbundenen Personen.”
Dr.-Ing. Matthias Keller, Data Scientist

Unsere Machine-Learning-Technologie

Die Echobot Advanced Semantic Engine (EASE) ist eine von Echobot entwickelte Technologie, die es erlaubt, geschäftsrelevante Informationen in Texten zu erkennen und automatisch den entsprechenden Firmen zuzuordnen. Angewandt auf mehrere Millionen Online-Artikel und Social-Media-Postings pro Tag sowie die Website-Inhalte von ca. 600.000 Firmen, entsteht einer der umfangreichsten und aktuellsten Datenbestände mit Informationen zu Firmen und Firmenbeziehungen.

Unsere Software erkennt beispielsweise Hinweise auf einen Führungswechsel, einen geplanten Erweiterungsbau, eine Firmenkooperation oder die Einstellung von neuen Mitarbeitern. Gleichzeitig werden wichtige Nachrichten den entsprechenden Firmen zugeordnet und Kontaktdaten von Entscheidern extrahiert. Die Analyse von Themen, die mit der Tätigkeit einer Firma verbunden sind, erlaubt es automatisch die Branche zu bestimmen.

Auch die Berechnung von „ähnlichen Firmen“ ist auf Knopfdruck möglich. Auf Basis dieses Datenbestands lässt sich geschäftsrelevantes Wissen in vielen Formen ableiten, etwa um neue potentielle Kunden zu identifizieren („Wie lauten die Kontaktdaten von Firmen aus Baden-Württemberg, die momentan den Bau einer neuen Produktionshalle planen?“) oder Risiken für Ihre Geschäfte abzuwenden („Welcher meiner Lieferanten hat in den letzten drei Monaten Mitarbeiter entlassen oder Werkshallen geschlossen?“).

Die automatische Generierung von umfangreichen aktuellen Firmen-Exposés mit allen relevanten Informationen und die automatische Benachrichtigung bei wichtigen Ereignissen aus Ihrer Bestandskundengruppe runden das Angebot ab.

Business-Signale

Der Erkennung von Business-Signalen (Managementwechsel, Neubau, …) liegt ein Klassifikationsproblem zugrunde, bei dem aus dem textuellen Zusammenhang automatisch entschieden wird, ob ein bestimmtes geschäftsrelevantes Ereignis beschrieben wird oder nicht.

Firmen-Erkennung

Im Rahmen der Firmenerkennung nutzen wir Named Entity Recognition in Kombination mit einer Datenbank aller Firmen aus dem D-A-CH-Raum. Besonders herausfordernd sind allgemeine Namen wie z.B. “Allianz” oder “Software AG”

Personen-Erkennung

Wenn auf einer Firmenwebseite oder in einer Pressemeldung ein Personenname erkannt wird, gilt es herauszufinden, ob diese Person tatsächlich ein Mitarbeiter der Firma ist. Hierzu nutzen wir Cross-Referenzierungen.

Branchen-Erkennung

Klassischerweise wurden Branchen von Adresshändlern manuell zugeordnet. Mithilfe von Machine Learning lässt sich dieser Prozess deutlich verbessern und beschleunigen. Die Echobot-Technologie basiert auf Parallelverarbeitung mit Grafikprozessoren (GPUs)