Login

KI und die Ära des automatisierten Marketings

Neue Wege, um Konsumentenpräferenzen aus Social Media Daten herauszulesen

Bradley Taylor

Keywords

Textanalyse, KI, Präferenzmessung

Artikel als pdf downloaden

Was man in großen Mengen von Produktbewertungen „zwischen den Zeilen“" lesen kann
Wenn Menschen im digitalen Raum konsumieren, klicken und kaufen sie nicht nur, sondern schreiben auch oft über Produkte, Marken und Dienstleistungen in Social Media, auf Plattformen oder auf den Seiten von Online-Shops. Die enormen Mengen an textbasierten und von Konsumenten online produzierten Daten stellen einen Schatz dar, der noch nicht vollständig gehoben ist. Glücklicherweise nehmen nicht nur die Datenvolumen laufend zu, sondern es werden auch neue Algorithmen zur Verarbeitung und Analyse solcher unstrukturierten Daten entwickelt. Vor allem Fortschritte im Bereich der künstlichen Intelligenz (KI) können das Heben dieses Datenschatzes erleichtern und dazu beitragen, die Entscheidungsfindung der Konsumenten besser zu verstehen.

In einem GfK-Forschungsprojekt haben wir getestet, wie wir aus öffentlich zugänglichen Social Media Daten, die wir mit Verkaufsdaten verknüpft haben, Konsumentenpräferenzen herauslesen und Kaufentscheidungen prognostizieren können. Das dabei eingesetzte, gängige KI-Tool “Word Embeddings“ hat sich als ein leistungsfähiges Werkzeug zur Analyse der verwendeten Begriffe erwiesen. Wir konnten damit die bevorzugten Marken, die wichtigsten Eigenschaften und primären Produktvorteile aus Konsumentensicht darstellen. Bei der Analyse werden sprachliche Tendenzen aufgedeckt, die auf bestimmte Präferenzen hinweisen und sich ziemlich gut mit den tatsächlichen Verkaufszahlen der Marken in verschiedenen Kategorien decken. Dieses gänzlich passive Verfahren lieferte insbesondere bei großen Datenmengen sehr genaue Ergebnisse (siehe Box 1). Passiv heißt, dass wir kostenlose, weit verbreitete Online-Daten nutzten, ohne die Befragten zu beeinträchtigen oder direkt zu Aspekten zu befragen, die sie sich sonst gar nicht überlegt hätten. Die angewendete Analyse ist schnell und ohne aufwändige Rechnerkapazitäten durchführbar.

Erkennen der beliebtesten Marken einer Kategorie
Um zu testen, ob sich Markenpräferenzen aus Online-Reviews ableiten lassen, haben wir zunächst eine KI-basierte Textanalyse für eine einzige Kategorie (TV-Geräte) mit unterschiedlich großen Datenmengen durchgeführt und das Ergebnis mit den tatsächlichen Verkaufsdaten verglichen. Konkret haben wir 3 Experimente durchgeführt: Mit Daten eines einzigen Online-Händlers im Umfang von insgesamt 3.000 Produktbewertungen, mit Daten mehrerer Einzelhändler im Umfang von 4.500 Produktbewertungen (einer Zufallsstichprobe der gesamten verfügbaren Daten) und unter Verwendung des gesamten Datensatzes im Umfang von 53.000 Produktbewertungen.

Die Ergebnisse sind in Abbildung 1 dargestellt. Die erste Spalte zeigt die tatsächlichen Verkaufsränge von fünf Marken der Kategorie. Es ist wichtig zu beachten, dass der Umsatzunterschied zwischen den Marken C, D und E recht gering war und wir daher eine gewisse Unschärfe erwartet hatten. Die zweite Spalte zeigt die Ergebnisse aus 3.000 Bewertungen bei einem einzigen Online-Händler. Bei dieser begrenzten Datenmenge ist der berechnete Rang eindeutig falsch. Die meistverkauften Marken A und B landen auf den Rängen 3 und 4 statt auf 1 und 2. Die dritte Spalte stellt die berechneten Ränge aus einer zufälligen Teilstichprobe von 4.500 Bewertungen bei mehreren Händlern dar. Hier ist Marke A in der richtigen Position 1, aber wir sehen Verschiebungen bei Marke B und den weiteren Marken. Die vierte Spalte mit dem kompletten Datensatz von 53.000 Bewertungen zeigt das richtige Ranking für die Marken A und B - die wichtigsten Volumentreiber in der Kategorie - und nur mehr Verschiebungen der Marken C, D, E.

 

Box 1: SO FUNKTIONIERT DIE KI-BASIERTE SPRACHANALYSE
Um unsere Daten aus Produktbewertungen zu analysieren, nutzten wir die KI-basierte Methode „Word Embeddings“ aus dem Bereich der Sprachanalyse. Die Daten stammen von Online-Shops, die Kundenbewertungen der verkauften Produkte auf ihren Seiten hatten. Zusätzlich haben wir einen Twitter-Datensatz verwendet, der Tweets und Kommentare mit Schlüsselbegriffen rund um die betreffende Kategorie enthielt.
Word Embeddings ermöglicht es uns, die Beziehungen von Wörtern zueinander zu analysieren. Dies wird erreicht, indem Wörter eines bestimmten Kontexts in numerische Vektoren umgewandelt werden. Die dabei verwendete Bibliothek heißt WordVectors. In unserem Fall diente der Name der Kategorie als Kontext und wir suchten nach Wörtern, die semantisch am ähnlichsten waren. So wurden beispielsweise „TV-Gerät“ oder „Kühlschrank“ als in einen Vektor umgewandelter Kontext verwendet, um nach Ähnlichkeiten zu suchen. In der Folge nutzten wir eine Ähnlichkeitsfunktion, die Ähnlichkeitswerte für die Wörter im entsprechenden Kontext errechnete, und gemäß den Ähnlichkeitsscores eine Liste erstellte.  Bei dieser Art von Analyse werden alle Sonderzeichen, Satzzeichen, Zahlen und Leerzeichen entfernt und alle Wörter in Kleinbuchstaben umgewandelt. Die Reihenfolge der Wörter ist bei dieser Vorgehensweise nicht von Relevanz.
Im nächsten Schritt haben wir aus dem Grad der Ähnlichkeit der Wörter mit dem Kontext eine Rangfolge der Marken der jeweiligen Kategorie errechnet, um diese mit dem Ranking gemäß den tatsächlichen Verkaufszahlen der vergangenen 12 Monate zu vergleichen. Die herangezogenen POS-Daten stammen aus unseren GfK-Handelspanels, die mehrere Händler pro Kategorie umfassen. Sämtliche Daten stammen vom britischen Markt.

Erkennen von Markenpräferenzen in mehreren Kategorien
Als nächstes führten wir Experimente in 10 Kategorien durch, wobei wir wiederum die Verkaufsdaten als Vergleichswert für das Ranking verwendeten. Wie im ersten Experiment führten auch hier mehr Daten zu genaueren Ergebnissen. Zu den getesteten Kategorien zählten Tablets, Handstaubsauger, Bodenstaubsauger, Smartphones, Haartrockner, Kühlschränke, Laptops, Fernseher, Rasierer, Geschirrspüler und Waschmaschinen. Man sieht, dass für die korrekte Prognose der Spitzenpositionen in den Kategorien in mindestens 80% der Fälle eine Stichprobe von mehr als 5.000 Bewertungen benötigt wird, und dass die Genauigkeit mit größeren Datenmengen signifikant verbessert werden kann (Abbildung 2). In der Kategorie der Smartphones (hier nutzten wir auch Twitter-Daten) haben wir die interessante Beobachtung gemacht, dass die Reihenfolge für alle Marken außer Alcatel richtig identifiziert werden konnte. Bei dieser Marke waren die Daten durch eine überproportionale Menge an Spam gekennzeichnet, was der Grund für die falsche Reihung von Alcatel sein könnte.

 

Ermitteln von präferierten Produkteigenschaften
Als Erweiterung der zuvor beschriebenen Methode haben wir zusätzlich getestet, ob die semantischen Netzwerke von Word Embeddings uns nicht nur beim Verstehen von Markenpräferenzen helfen können, sondern auch beim Erkennen von Vorlieben bezüglich einzelner Produktmerkmale. Ein solcher Versuch geht über eine reine Inhalts- oder Sentimentanalyse hinaus. Das Ergebnis einer solchen Marken-plus-Merkmal-Analyse ist eher mit Mind-Mapping und mit klassischen Umfragen zu Attributpräferenzen vergleichbar.

Unsere Stichprobe bestand aus den Daten der 36.000 Beurteilungen von Fernsehgeräten. Die Bildqualität erwies sich als wichtigstes, die Tonqualität als zweitwichtigstes Merkmal. Dass eine hohe Tonqualität so wichtig ist, sollte nicht weiter überraschen, denn das Fernseherlebnis setzt sich ja tatsächlich aus der Kombination von Bild und Ton zusammen, auch wenn Fernseher als visuelle Geräte kategorisiert sind.  Als drittbegehrtestes Feature erwies sich die Benutzerfreundlichkeit, gefolgt von der Möglichkeit, sich mit Diensten wie YouTube oder Netflix zu verbinden. Eine weitere Erkenntnis war, dass der Prozess für den Anschluss des Fernsehers an den WLAN-Router und das Internet einfach sein muss, da die Konsumenten andernfalls Streaming-Angebote über den Fernseher nicht nutzen. Nicht nur die Herstellung einer Verbindung muss selbsterklärend sein, sondern auch die Einbindung der Apps von Drittanbietern auf der Plattform des Fernsehers muss einfach funktionieren. Hier scheint es in doppelter Hinsicht eine Adoptionshürde zu geben.
Auf Platz fünf der wichtigsten Eigenschaften kamen das Aussehen bzw. Design des Fernsehgeräts. Wenn man bedenkt, dass aktuelle Werbeanzeigen für Fernsehgeräte ganze andere Merkmale betonen, erkennt man den Wert des Inputs KI-basierter Konsumentenanalysen für die Marketing- und sogar Innovationsstrategie der Hersteller von Fernsehgeräten.

Produktvorteile verstehen
Unsere ausführliche Analyse hat uns nicht nur ermöglicht, die wichtigsten Merkmale zu erkennen, sondern auch Kaufmotive und erwartete Nutzen zu verstehen. Abbildung 3 zeigt die Hauptthemen aus der Analyse und welche Rolle sie spielen. An erster Stelle steht die Familie. Bei Fernsehern geht es also nicht nur um Unterhaltung oder ums Filmschauen, sondern um ein Gerät, das von der ganzen Familie genutzt und geschätzt wird. Obwohl die Top-Merkmale die Bild- und Tonqualität sind, gehen die Kaufmotive für TV-Geräte über diese Features hinaus und betreffen die positiven Auswirkungen, die das Gerät auf das familiäre Zusammenleben hat. Für die Kommunikation kann man daraus ableiten, dass Fernseher einen starken Bezug zu sozialen Konstrukten wie der Familie haben. Solche sozialen Aspekte sollten viel stärker in die Kommunikation einfließen. Einfach nur das beste Bild, die ansprechendsten Filme und die anregendsten Spielerlebnisse anzupreisen, spricht Kaufmotive nicht ausreichend an.

 

Erfolgsfaktoren für zukünftige Anwendungen der KI-basierten Textanalyse
Wir haben gezeigt, dass die dargestellte Art der Analyse sehr nützliche Erkenntnisse liefern kann. Es gibt jedoch noch viel zu lernen und einige kritische Aspekte zu berücksichtigen.

  • Die Menge der verfügbaren Daten ist der Schlüssel zur Qualität der Erkenntnisse
    Unsere Ergebnisse zeigen, dass der Stichprobenumfang wichtig ist, um zuverlässige Ergebnisse zu erhalten. Gemäß den in den Abbildungen 1 und 2 dargestellten Ergebnissen empfehlen wir derzeit eine Stichprobengröße von mehr als 10.000 Bewertungen oder anderen Texten. Bei Samples in der Größenordnung von +/- 10.000 sollte man nur die dem Kontext am nächsten verwandten Begriffe betrachten. Wenn man sich weiter entfernt, wird die prognostizierte Reihung fehleranfälliger und die Erkenntnisse bezüglich der tatsächlichen Präferenzen der Konsumenten sind wenig abgesichert.
     
  • Fügen Sie Bewertungen aus verschiedenen Quellen hinzu
    Neben der Datenmenge hat auch die Vielfalt der Quellen einen positiven Einfluss auf die Qualität der Ergebnisse. Abbildung 1 zeigt, dass eine kleine Stichprobe mit den Bewertungsdaten eines einzigen Händlers zu Verzerrungen und einer schlechteren Leistung der Methode führen. Da einige Händler mit den Markenherstellern Exklusivangebote vertreiben, können repräsentativere Ergebnisse erzielt werden, wenn so viele Händler wie möglich einbezogen werden. Dies ist vor allem bei Markenrankings wichtig und weniger bei Merkmals- oder Nutzenrankings, solange die Marken im Datensatz das Merkmals- und Nutzenspektrum der gesamten Kategorie repräsentieren.
     
  • Achten Sie auf mehrdeutige Wörter
    Die Ergebnisse müssen mit Sorgfalt interpretiert werden, insbesondere wenn Schlüsselbegriffe mehrdeutig sind. Ein Beispiel, auf das wir gestoßen sind, war „Hoover“. Im Englischen bezeichnet dieser Begriff sowohl die gesamte Kategorie der Staubsauger, als auch die Aktivität des Staubsaugens als auch eine einzelne Marke. Damit sich aus den Daten keine übersteigerte Position für die Marke „Hoover“ ergibt, müssen die Daten bereinigt werden, indem Verwendungen des Begriffs für die Kategorie und die Aktivität nicht gezählt werden.

Es ist offensichtlich, dass wir immer besser in der Lage sind, Menschen in elektronischer Form darzustellen. KI hilft uns, Verbraucher zu verstehen, mathematische Modelle zu entwickeln und komplexe Präferenzen und Konsumentenentscheidungen darzustellen.  Wir können erkennen, was für Konsumenten wichtig ist und bekommen Einblicke in ihre Entscheidungsprozesse. KI erweitert die Leistungsfähigkeit und Kompetenz von Experten und Mitarbeitern, schließt Wissenslücken und reduziert den kognitiven Aufwand, den die Mengen an verfügbaren, vielfältigen und nie versiegenden Datenquellen mit sich bringen. Mit der Zeit könnten KI dazu führen, dass teure Umfragen und aktive Befragungen überflüssig werden, weil man die gewünschten Erkenntnisse aus vorhandenen Daten gewinnen kann. 

 

Autor/en

Bradley Taylor, Black Swan Data, Executive Data Science Director