Journalismus und PR haben schon immer eine Sache gemeinsam: In beiden Disziplinen geht es am Ende darum, gute Geschichten zu erzählen. Natürlich sind die Ziele und das Personal der Geschichten unterschiedlich: Mal dreht es sich um Unternehmen, Produkte und Technologien, mal um Politiker, Nationalstaaten und politische Entscheidungen. Aber wenn die Geschichten nicht überzeugen können, bleibt die PR wirkungslos oder die Zeitung wird nicht mehr gekauft.
Insbesondere seit den 1960er-Jahren gilt der investigative Journalismus als einer der Höhepunkte der Berichterstattung. Das Modell dahinter ist schnell skizziert: Der Journalist geht auf die Suche nach spannenden Themen, folgt wie eine Privatdetektivin verschiedenen Hinweisen und recherchiert auf diese Weise eine Story, die bei Veröffentlichung die Welt verändert – „Watergate“, „Flick-Affäre“ und „Wikileaks“ gehören mit zu den spannendsten Beispielen.
Meine These ist: Genau dieses Modell befindet sich im Umbruch. Waren es früher die genialen Recherchejournalisten, die das Material für ihre Geschichten in aufwendiger (z. T. Undercover-) Arbeit zusammenstellten, kommen in den 2010er-Jahren die Geschichten immer stärker aus Daten. Man könnte fast sagen: Statistische Algorithmen sind die neuen Enthüllungsjournalisten.
Aber nicht nur der Journalismus ist von diesem Wandel betroffen, sondern die disruptive Wirkung von Big Data ist auch in der Unternehmenswelt deutlich zu spüren. Datengetriebene Geschäftsmodelle sind derzeit überall im Aufwind. 2011 sprach der frühere Netscape-Gründer und jetzt Venture Capitalist Marc Andreessen davon, dass Software die (Wirtschafts-)Welt auffrisst. Heute sind die meisten Unternehmen (egal ob Software oder Hardware) zugleich auch Datenunternehmen. Daten aus internen und externen Quellen werden verwendet, um Märkte und Zielgruppen besser zu verstehen und zu erreichen, um Trends zu erkennen, Innovationen zu planen, interne Abläufe zu optimieren und um den Erfolg von Marketing und Vertrieb zu messen und zu kontrollieren.
Neben dieser impliziten Bedeutung von Daten gibt es aber auch immer mehr Geschäftsmodelle, die sich direkt auf die Daten beziehen:
Zum einen werden eigene oder fremde Daten veredelt und verkauft. So können beispielsweise Handelsunternehmen Erkenntnisse über das Kaufverhalten ihrer eigenen Kunden in Gestalt anonymisierter und verallgemeinerter Zielgruppenmodelle an Data-Management-Plattformen oder Targetingunternehmen verkaufen, die dann mit diesen Daten das zukünftige Kaufverhalten von Besuchern eines Webshops vorhersagen können. Manchmal werden sogar die Rohdaten zu einer wichtigen Einkommensquelle – so erzielt Twitter einen großen Teil seines Umsatzes aus dem Verkauf des gesamten Twitterstreams an autorisierte Reseller. Oder aber Unternehmen verwandeln ihre eigenen Forschungsdaten und Studien in Datenprodukte und verkaufen sie dann an interessierte Kunden.
Daneben gibt es aber noch ein weiteres Anwendungsszenario für Daten: Big Data heißt nicht nur Zusammenhänge entdecken, Vorhersagen treffen und Entscheidungen begründen, sondern kann auch bedeuten: Geschichten erzählen. Manchmal können Big Data so spannend wie ein Roman sein. So lässt sich beispielsweise anhand der Google Books-Daten – beziehungsweise den knapp 2 Mrd. Wortkombinationen (sog. „Bigramme“) aus den eingescannten deutschsprachigen Büchern – die Veränderung der deutschen Sprache von Jahrzehnt zu Jahrzehnt nachzeichnen und erforschen, welche Themen zu welcher Zeit im Mittelpunkt des öffentlichen Interesses standen und wie schnell dieses Interesse dann wieder nachgelassen hat.
Die Fähigkeiten und Kenntnisse, die ein Data Scientist benötigt, um Informationen aus großen Datenquellen dieser Art zu gewinnen, definiert DJ Patil wie folgt („Building Data Science Teams“, O’Reilly 2011): Erstens benötigt ein Data Scientist technische Fähigkeiten und Methodenwissen, zum Beispiel aus der Statistik, zweitens ein hohes Maß an Neugierde, also einer klassischen journalistischen Tugend, die notwendig ist, um dicke Bretter zu bohren und einer Fährte lange zu folgen. Drittens kommt das „Storytelling“ dazu, also die Begabung, Informationen auch wirkungsvoll zu kommunizieren; und viertens ist Schlauheit unentbehrlich, um Probleme aus unterschiedlichen Perspektiven betrachten und innovative Lösungen finden zu können.
Der Ablauf eines solchen Data-Driven Storytelling-Vorhabens sieht immer ähnlich aus:
1. Zuerst müssen die Daten abgerufen werden (z. B. über die API einer Social-Media-Site), anschließend dann gespeichert (z. B. in einer textorientierten NoSQL-Datenbank wie MongoDB oder CouchDB) und womöglich Fragmente aus unterschiedlichen Quellen integriert werden. Sehr häufig liegen die Daten in unterschiedlichen Formaten vor, sodass auch die Übersetzung und das Erkennen und Bereinigen von Fehlern eine wichtige Rolle spielt. Diesen ersten Schritt, der in vielen Projekten der zeitintensivste und nervenraubendste ist, bezeichnen Data Scientists häufig mit dem sehr sprechenden Begriff „Data Munging“.
2. Anschließend geht es darum, in den häufig sehr großen oder unstrukturierten Datenmengen die wirklich interessanten Informationen – also die sprichwörtliche Nadel im Heuhaufen – zu finden. Dabei wird der Data Scientist durch Algorithmen aus Data Mining und Pattern Recognition unterstützt, mit denen zum Beispiel Ausreißer oder Trends erkannt werden und große Textmengen automatisiert auf die wichtigsten Aussagen reduziert werden können.
3. Im dritten Schritt werden diese Informationen dann so verdichtet und visualisiert, dass die wichtigsten Zusammenhänge und Erkenntnisse auch für Nicht-Statistiker deutlich herausstechen. Das Ergebnis dieses Schrittes ist dann z. B. eine Tabelle, ein Informationsdashboard oder eine Datenlandkarte.
4. Anschließend gilt es, mit diesen Charts, Animationen und Zahlen Geschichten zu erzählen. Sehr viel hängt hier davon ab, wie die einzelnen Bestandteile der Visualisierung eingefärbt, hervorgehoben oder mit Annotationen versehen werden. Hier lassen sich viele Entsprechungen zwischen den klassischen Nachrichtenelementen und dem Data-Driven Storytelling entdecken:
- Wo: Mapping-Toolkits wie z. B. Leaflet ermöglichen ein einfaches Einbinden von geographischen Informationen aus OpenStreetMap, Twitter, Foursquare, …
- Wann: Statistische Methoden wie die Zeitreihenanalyse bieten sich an für Analysen aus regelmäßig erhobenen oder veröffentlichten Daten.
- Wer: Netzwerkanalytiker können sehr intuitiv die Zusammenhänge zwischen Akteuren darstellen.
- Warum: Statistische Verfahren wie das Modelling ermöglichen die Analyse von Ursachen und Korrelationen zwischen unterschiedlichen Ereignissen oder Einflussfaktoren.
5. Der letzte Schritt ist dann in einigen Fällen das Datengeschäftsmodell, das dann funktioniert, wenn die visualisierten Informationen für die Leser oder Nutzer auch einen (monetären) Wert darstellen, sodass sie dafür zwischen einigen Cent und einigen Euro bezahlen würden (z. B. über Micropaymentsysteme wie Flattr oder LaterPay).
Data-Driven Storytelling ist zwar anspruchsvoll, aber keine Raketenwissenschaft. Sehr viele Tools und Datenquellen sind als Open Source-Software kostenlos verfügbar, und die Grundprinzipien lassen sich in wenigen Stunden lernen. Weitere spannende Insights gibt es in einem Seminar der Data Days Conference am 1. und 2. Oktober in Berlin. Auf der Konferenz werden die neuesten Trends im Bereich Data sowie die Auswirkungen auf unsere Gesellschaft ganzheitlich und kontrovers beleuchtet.
Gewinnen Sie ein Ticket für die DATA DAYS 2014 in Berlin!
ADZINE verlost 2 Tickets im Wert von je 620,00 € (2 Konferenztage inkl. Übernachtung im nhow Hotel). Machen Sie mit und beantworten Sie folgende Frage:
Dr. Benedikt Köhler benennt Beispiele an investigativen Veröffentlichungen, die die Welt verändert haben. Welche Skandal-Enthüllung spricht er an?
a) „Ganz oben ganz unten“ von Christian Wulff
b) „Das Leben ist kein Spiel“ von Boris Becker
c) Wikileaks
Senden Sie Ihre Antwort per E-Mail an redaktion@adzine.de, Betreff: Data-Driven Storytelling @Data Days 2014. Teilnahmeschluss ist Freitag der 19.09.2014.
Der Rechtsweg ist ausgeschlossen. Regulärer Ticketverkauf auf www.data-days.com
EVENT-TIPP ADZINE Live - Industry Preview – Media & Tech Agenda 2025 am 22. Januar 2025, 11:00 Uhr - 12:30 Uhr
Welche Themen sollten Advertiser und ihre Agenturen, aber auch die Medien, ganz oben auf der Agenda haben für 2025? Welche Technologien werden bei den großen Herausforderungen, wie z.B. Datenschutz, Addressability, Qualitätssicherung, Messbarkeit und Einkaufseffizienz im digitalen Mediabusiness 2025 eine wichtige Rolle spielen? Jetzt anmelden!