Heute schreibt ein echter Profi! Dr. Hendrik Hüning ist Wissenschaftler an der Universität Hamburg. Seine aktuelle Forschung bezieht sich insbesondere auf Textmining und -modeling. In seinen Projekten – die er untern anderem für die Europäische Union vorantreibt – bewegt er sich an der technologischen Grenze. Heute erklärt Dr. Hüning, was es mit Argument Mining auf sich hat.
In unserer heutigen digitalisierten Welt können Kunden jederzeit und überall mit Produkten und Marken interagieren. Sei es durch Produktbewertungen bei Onlinehändlern wie Amazon oder durch Hotelbewertungen auf Vergleichsportalen oder Hotelbuchungsseiten wie beispielsweise booking.com oder Airbnb. Diese Interaktionen stellen eine reichhaltige Informationsquelle für das Marketing dar, enthalten sie doch Meinungen und Ansichten der Kunden über Produkte und Marken. Die Auswertung dieser textlichen Daten ist auch deshalb von zentraler Bedeutung, weil Kaufentscheidungen von Kunden heute auch maßgeblich durch Produktbewertungen anderer beeinflusst werden. Erfahren Sie hier über eine neue und vielversprechende Methode des Text Mining, die die Beweggründe für die Meinungen der Kunden in Rezensionen identifiziert.
Vom Sentiment zum Argument Mining
Die Anwendung von Text-Mining Methoden wird seit einigen Jahren genutzt, um beispielsweise die Kundenzufriedenheit mit Produkten einzuschätzen. Hierfür werden Kundenrezensionen anhand von vorab definierten Signalwörtern wie „gut“ oder „schlecht“ durchleuchtet. Dieser als Sentiment-Analyse bekannte Ansatz kratzt allerdings nur an der Oberfläche des zum Teil reichhaltigen Inhalts von Textdaten. Ein weiterer Ansatz identifiziert angesprochene Themen (topic modeling). Auf diese Weise kann beispielsweise erfasst werden, mit welchen Eigenschaften eines Produkts der Kunde (un)zufrieden ist. Auch wenn diese Ansätze bereits erste gute Indikatoren für die Interaktion des Kunden mit dem Produkt darstellen, einen Eindruck vermitteln wie gut das Produkt beim Kunden ankommt und an welchen Stellen eventuell nachgebessert werden muss, bleibt die Frage des „Warum ist ein Kunde (un)zufrieden mit dem Produkt?“ unbeantwortet. Hierzu muss ein Text-Mining-Algorithmus die Begründung, also die Argumentation im Text erkennen. Ein Satzbeispiel soll dies verdeutlichen:
Eine Kundin schreibt in ihrer Produktrezension:
„Das Tablet ist schlecht, weil die Verarbeitung minderwertig ist und das Tablet daher schnell kaputt geht. Außerdem gefällt mir das Design überhaupt nicht.“
Wendet man topic modeling auf diese und viele andere Rezensionen an, mag es erkennen, dass es im obigen Fall um die äußere Beschaffenheit des Produkts geht. Die Sentiment-Analyse erkennt, dass der Kunde unzufrieden ist, da es das Wort „schlecht“ identifiziert und damit die Rezension negatives Sentiment enthält. Zudem kann die Meinung zum Design erfasst werden („gefällt nicht“). Welche faktischen Beweggründe zu dieser negativen Rezension geführt haben, bleibt allerdings unbeantwortet. Argument Mining, also die Suche nach argumentativen Satzstrukturen, ist hier in der Lage das verknüpfende Element zu bilden und damit einen erheblichen Beitrag zum Verständnis der Interaktion des Kunden mit dem Produkt zu leisten.
Noch in den Kinderschuhen und dennoch Sprinten?
Das noch sehr junge Forschungsfeld des Argument Mining, einem Teilgebiet des Text Mining, macht zurzeit vielversprechende Fortschritte. Argument Mining ist zu einem zentralen Forschungsgegenstand innerhalb der Artificial Intelligence Forschung geworden, da es kognitive Modelle mit rechnergestützten Modellen der automatisierten Argumentation verknüpft (Siehe Lippi und Torroni, 2016), hier findet sich auch eine gute Übersicht über die bisherige Literatur). Argument Mining versucht automatisiert Sätze oder Satzteile zu erkennen, in denen Argumente oder Teile eines Arguments vorhanden sind.
Während eine computergestützte Debattierhilfe, welche dem Menschen Argumentvorschläge in einer Diskussion geben kann, sicherlich noch Zukunftsmusik ist (vergleiche hierzu das Debater-Projekt von IBM), hat das Argument Mining aber schon heute direkte Anwendungsmöglichkeiten wie beispielsweise im Marketing.
Vorgehen
Kommen wir noch einmal zu unserem Satzbeispiel von oben zurück. Dieses veranschaulicht eine gängige Vorgehensweise menschlicher Argumentation. Es ist ein gutes Beispiel für das sogenannten claim/premise-model (Walton, 2009).
Hiernach besteht ein Argument zum einen aus einer Behauptung („Das Produkt ist schlecht …“). Dies wird auch häufig als Schlussfolgerung (conclusion) des Arguments bezeichnet. Zum anderen besteht es aus häufig mehreren mit der Behauptung verknüpften Voraussetzungen, auch evidence genannt.
In diesem Fall: „…die Verarbeitung minderwertig ist und daher schnell kaputt geht“. Die Voraussetzungen stützen die Behauptung. Dieses Modell wird häufig als Grundlage für die computergestützte Entwicklung eines Algorithmus genutzt, der Sätze danach klassifiziert, ob sie Argumente enthalten oder nicht.
Die Vorgehensweise bei der Modellierung und Schätzung ist dabei ist nicht viel anders als bei anderen Klassifizierungsaufgaben. Ein Algorithmus lernt anhand bereits als argumentativ klassifizierter Sätze oder Satzteile und wendet das Gelernte auf neue, ungesehene Texte an. Dabei unterscheiden lassen sich in der Argument Mining Forschung grundsätzlich zwei Ansätze. Zu einen werden kontext-spezifische Modelle gebaut und trainiert, das heißt dem Algorithmus werden klassifizierte Sätze aus einen spezifischen Themengebiet (zum Beispiel eben Produktbewertungen) zum Trainieren gegeben und auch nur auf neue Produktbewertungen angewendet. Bei komplexen, kontext-unabhängigen Modellen werden eine Vielzahl an möglichen Argumentationsstrukturen anhand verschiedener Themen trainiert und auf ein völlig neues Thema angewendet.
Marketing ist kompliziert!
Für das Marketing empfiehlt sich ein kontext-spezifisches Modell, da auf diese Weise das „übliche Jargon“ von z.B. Produktrezensionen mit aufgenommen werden kann und die Performance der Klassifizierung erhöht werden kann. Es ist anzunehmen, dass die Arguments-struktur von Kunden in Produktbewertungen eine andere ist also dies zum Beispiel in politischen Diskussionen im Bundestag der Fall ist.
Betrachtet man die bisherigen Forschungsanstrengungen des Agrument Mining, so fällt auf, dass die Wahl der richtigen Prädiktoren (features) wichtiger ist als die Wahl des statistischen Klassifizierungsmodells (classifier) (Lippi und Torroni 2016).
Übliche Prädiktoren sind die durchschnittliche Satz- und Wortlänge, Signalwörter (weil, deshalb etc.) oder mehrere Wörter die zusammenstehen, sogenannte n-grams (zum Beispiel: „aus diesem Grund“). Hinter dem ersten Prädiktor steckt die Annahme, dass argumentative Sätze komplexere Wort- und Satzstrukturen erfordern als Sätze, die keine Argumente enthalten. Auch die Wortarten, die in Argumenten genutzt werden, unterscheidet sich zum Teil von Sätzen ohne Argumente, weshalb Prädiktoren auf Basis von Part-of-speech-Tagging (POS-Tagging) genutzt werden. Es fließen also die Häufigkeit von Nomen, Verben, Adjektiven etc. in die Schätzung mit ein.
Herausforderungen
Im Vergleich zu anderen Klassifizierungsaufgaben sind in der Argument Mining Forschung bereits als argumentativ klassifizierte Texte bzw. Satzteile ein Problem. In den meisten Fällen wird dies ressourcenintensiv manuell per Hand gemacht um dann den Algorithmus damit zu trainieren. Bestrebungen dies zu automatisieren sind erfolgversprechend (Vergleiche Levy et al. 2017).
Das beschriebene claim-premise-model ist stark in seiner Einfachheit, soll natürlich nicht darüber hinwegtäuschen, dass unsere alltägliche Argumentation häufig wesentlich subtiler und in komplexerer und unstrukturierterer Art und Weise abläuft. So offensichtlich wie im obigen Satzbeispiel und damit verhältnismäßig einfach durch einen Algorithmus zu erkennen ist es oft nicht. Gerade Kundenrezensionen, die nicht selten unvollständige Sätze enthalten oder weniger klare Argumentationsstrukturen aufweisen als z.B. wissenschaftlichen Abhandlungen, sind hier eine Herausforderung.
Aus den bisherigen Beschreibungen wird deutlich, dass Argument Mining auch Überschneidungen mit dem Opinion Mining hat, also der Klassifizierung von Sätzen und Satzteilen, die eine Meinung ausdrücken (Wieder das Satzbeispiel von oben: „Außerdem gefällt mir das Design überhaupt nicht.“). Eine Behauptung selbst ist häufig eine subjektive Meinung. Gerade in Produkt- und Hotelbewertungen finden sich solche Meinungen häufig („opinionated text“, siehe Rajendran et al 2018). Ein Algorithmus, der es auf Argumentationsstrukturen abgesehen hat, muss dies berücksichtigen.
Fazit
Die Nutzung von Argument Mining Methoden hat spannende Anwendungsmöglichkeiten innerhalb des Marketings. Beispielsweise die Nützlichkeit von (Amazon) Reviews vorherzusagen, um sich als Unterhemen auf diese beschränken zu können bzw. Kunden diese zuerst anzuzeigen (Vergleiche Liu et al. 2017 und Passon et al. 2018). Darüber hinaus kann untersucht werden, ob Kunden eher sachlich mit einem Produkt umgehen oder emotional mit diesem interagieren. Dies ist insbesondere für die Markenstrategie und -entwicklung interessant. Aber auch außerhalb des Marketings ergeben sich vielfältige Anwendungsmöglichkeiten des Argument Mining. Hierzu zählen das Aufspüren von Argumenten in Rechtstexten (Vergleiche Mochales-Palau und Moens, 2009), in Kommentarspalten von Onlinemedien wie Spiegel Online oder Videodiensten wie Youtube sowie Blogeinträge wie dieser.
Argument Mining kann das Opinion Mining und die Sentiment-Analyse im Marketing auf das nächste Level heben, da es nicht nur darauf abzielt Meinungen der Kunden über ein Produkt zu erfassen, sondern eben auch warum Kunden diese Meinungen vertreten.