Weak Signal Analysen identifizieren schwache Signale

Weak Signals, oder auch schwache Signale, sind frühe Anzeichen für mögliche, aber nicht bestätigte Veränderungen im Unternehmensumfeld. Das umfasst sowohl das technologische, politische, soziale als auch das wettbewerbsbezogene Umfeld.

Saritas und Smith (2011) definieren Weak Signals als “early signs of possible but not confirmed changes that may later become more significant indicators of critical forces”.

Dementsprechend dient eine Weak Signal Analysis der Identifikation dieser schwachen Anzeichen, und werden somit als Frühwarnsystem für die strategische Planung eingesetzt. Weak Signal Analysen sind in der Regel IT basierte angewandte statistische/ mathematische Methoden zur Auswertung großer Datenmengen, die allein manuell aufgrund von Menge und Komplexität nicht mehr auszuwerten sind. Weak Signal Analysen lassen sich also den Bereichen Big Data und Data Mining zuordnen.

Weak Signal Analysen im unternehmerischen Kontext

Für Unternehmen bieten sich unterschiedliche Einsatzmöglichkeiten von Weak Signal Analysen an. Die wesentlichsten sind die Anwendung im Kontext von Sentiment-, Branchen-/Markt– und Wettbewerbsanalysen:

  • Sentiment-Analysen: Mit Hilfe von Sentiment-Analysen können Stimmungslagen innerhalb von Textinformationen analysiert und identifiziert werden. Sentiment-Analysen greifen auf Natural Language Processing (NLP) zurück, einem Teilbereich der künstlichen Intelligenz (KI). Unternehmen können so aus großen Datenmengen, bspw. durch Social Media, die emotionale Stimmungslage der eigenen Kunden analysieren, oder die der Konkurrenz.

  • Wettbewerbsanalysen: Sentiment-Analysen können auch für die Analyse von Wettbewerbern und deren Kunden genutzt werden. Mit Hilfe von Latent Dirichlet Allocation (LDA) können aber auch nicht direkt sichtbare („latente“) Themen aus einer großen Menge an Textinformation identifiziert werden (so genanntes Topic Modelling). So lassen sich beispielsweise User-Generated-Content (UCG) oder unstrukturierte Inhalte über Wettbewerber thematisch einordnen und somit analysieren. Die Frage, was die Kunden bestimmter Wettbewerber bewegt, interessiert oder stört, lässt sich so beispielsweise identifizieren und analysieren.

  • Marktanalysen: Sentiment Analysen und Latent Dirichlet Allocation lassen sich ebenso für Marktanalysen anwenden. So können sich verändernde Stimmungen und Präferenzen bei Zielgruppen identifizieren, ebenso wie sich verändernde thematische Trends.

Beispiel: Startups bewerten

Klassische Bewertungen von Startups/ Unternehmen  basieren überwiegend auf Finanzkennzahlen, wie zum Beispiel die Discounted-Cash-Flow-Methode (DCF). Hierbei sind aber aber Cash-Flow Informationen der mindestens vier letzten Jahre notwendig, oder zumindest empfehlenswert. Nach vier Jahren operativer Tätigkeit ist ein Startup auf dem Markt bereits bekannt. Was aber, wenn beispielsweise große Unternehmen frühzeitig Startups als potentielle strategische Partner identifizieren möchten, noch bevor der Markt/ der Wettbewerb auf diese Startups aufmerksam wird?

Dieser Frage bin ich nachgegangen und habe eine Weak Signal Analyse zur Bewertung und Visualisierung der Entwicklung von Startups entwickelt. Ich habe basierend auf einem neuronalen Netz ein Modell entwickelt das Textinformationen („Signale“) im Internet zu Startups aus dem Gesundheitsbereich thematisch einordnet und inhaltlich nach Erfolg und Misserfolg bewertet. Auf diese Weise kann im zeitlichen Trendverlauf identifiziert werden, welche Startups sich zu welchen Themen wie erfolgreich entwickeln.

Ich sammle also Daten, trainiere mit diesen Daten ein Modell und kann dieses Modell auf neue Daten übertragen um Vorhersagen über die Entwicklung von Startups zu treffen.

Daten sammeln, reinigen und labeln

Daten müssen gesammelt, bereinigt und gelabelt werden
  • Daten sammeln: Ohne Daten kann kein Modell trainiert werden. Aus diesem Grund ist es wichtig genügend Daten zu sammeln. Ich habe daher Textinformationen zu Startups aus den unterschiedlichsten Branchen mit Hilfe von APIs und legalen Webcrawls gesammelt (u.a. Pharma, Telemedizin, MedTech).

  • Daten säubern: Daten säubern beinhaltet u.a. Whitespaces und Sonderzeichen zu entfernen, oder auch leere Felder, die durch das Crawling durchaus entstehen können.

  • Daten labeln: Jede einzelne Textinformation wird gelabelt. Finanzbezogene Inhalte, also beispielsweise solche bei denen es um InvestitionenFinanzierungsrundenUmsatz-, Verlust-, oder Gewinnmeldungen geht, wurden der Kategorie Finance zugeordnet. Alle Inhalte zu den Startups, die einen Bezug zum Thema Partnerschaften haben, werden der Kategorie Partnership zugeordnet. Dazu zählen beispielsweise Meldungen zu strategischen Partnerschaften mit Universität oder anderen Unternehmen. Alle Textinformationen bei denen es inhaltlich beispielsweise um personelle Zugänge und Abgänge geht, oder um Stellengesuche, werden der Kategorie Vacancy zugeordnet. Alle Inhalte, die weder Finance, Partnership noch Miscellaneous zugeordnet werden können, werden der Kategorie Miscellaneous zugeordnet.

    Neben diesem „thematischem Labeling“ wird jede einzelne Textinformation noch hinsichtlich des inhaltlichen Erfolges (+1) oder Misserfolges (-1) gelabelt.

Modell für Weak Signal Analyse erstellen (mit Keras)

Mit Hilfe eines neuronalen Netzes eine Weak Signal Analyse erstellen

Nachdem genügend Daten gesammelt, aufbereitet und gelabelt sind, wurde das eigentliche Modell trainiert auf dem die Weak Signal Analyse basiert. Bzw. wurde für jede einzelne Aufgabe ein eigenes Modell trainiert (jeweils ein Modell für jede der vier Kategorien um die Textinformation einordnen zu können, also handelt es sich beispielsweise um einen Inhalt mit Finance Bezug, oder nicht? Und jeweils ein Modell für jede Kategorie zur Einordnung der inhaltlichen Bewertung. Handelt es sich also um einen Erfolg, um eine neutrale Information, oder handelt es sich eher um einen Misserfolg bei der jeweiligen Textinformation?).

Das Modell wurde mit Keras erstellt, einer Deep Learning API für Python. Das Modell lernt also Textinformationen über Startups aus dem digitalen Gesundheitsbereich thematisch in die Kategorien Finance, Partnership, Vacancy und Miscellaneous einzuordnen, und diese nach Erfolg (positiv, neutral, negativ) zu bewerten.

Visualisierung der Weak Signal Analyse

Dashboard zur Visualisierung der Weak Signal Analyse

Die Visualisierung der Weak Signal Analyse basiert auf Dash, einem Python Framework das seine Stärke in der Visualisierung von Daten in Form von interaktiven Dashboards hat. Die Entwicklung der vier Bereiche sind ein starker Indikator für die Entwicklung eines Startups.