Big Data Datenrausch mit Nebenwirkung
Seit Mitte Oktober ziehen die Kicker vom TSG 1899 Hoffenheim noch konzentrierter ihr Leiberl über. Zwischen den Schulterblättern klebt ein Chip, in den Stutzen auch einer und der Fussball ist verchipt wie das Tor.

Beobachter sähen ein normales Fußballspiel, stünde am Spielfeldrand nicht ein Baucontainer. Dort sitzen Spezialisten von SAP, die die Szenerie protokollieren. Unmittelbar nach dem Spiel wird analysiert. Für jeden Spieler werden 3D-Analysen auf die Bildschirme gebracht, die Ballkontaktzeit, Sprints und Vitaldaten auswerfen.
Was der deutsche Weltkonzern SAP hier macht, ist zwar eine der ungewöhnlicheren Fallstudien für seine Hochleistungsanalyse-Datenbank, aber es ein klarer Fall von Big Data.
Bis zum Sommer war dieser Begriff außerhalb der IT-Wirtschaft kein Begriff für die breite Öffentlichkeit. Das hat sich mit den NSA-Enthüllungen geändert. Seit damals haben auch Verbraucher eine Vorstellung davon, was es heißt, eine Unmenge von Daten in kurzer Zeit zusammenzuführen und zu analysieren. Die zum Einsatz kommenden Technologien sind aber nicht bloß die Werkzeuge der Geheimdienste - Big Data erobert die Wirtschaft.
Betrieben werden diese Datenanalysen schon länger. Verbraucher hinterlassen mit ihrem digitalen Lebensstil eine Vielzahl von Spuren, die - ganz legal - ausgewertet werden. Mobilfunker analysieren das Telefonieverhalten ihrer Kunden. Nicht das Individuelle, sondern das Kollektive - anonymisiert in Millionen von Datensätzen. Aus diesem Verhalten können sie Tarifmodelle errechnen, und auch ziemlich gut vorhersagen, ob die Tarife auch angenommen werden. In der gezielten Datenauswertung lassen sich nicht nur Muster für den legalen Gebrauch eines Produkts herauslesen, sondern auch Muster definieren für den Missbrauch. Banken und Finanzdienstleister monitoren Auffälligkeiten in ihren Systemen und diese schlagen Alarm, wenn Transaktionen aus der Reihe fallen und betrügerische Absichten naheliegen. Die Loyalitätsprogramme im Handel sind eines der ergiebigsten Datensammelbecken: Wer das Verbrauchsverhalten seiner Kunden kennt, kann den Einkauf und die Belieferung von Filialen besser planen. Und wer um die Vorlieben seiner Kunden weiß, und die noch genauer adressiert, schraubt seine Umsätze hoch. Wer dann noch elektronische Preisschilder hat - wie es in zahlreichen US-Handelsketten bereits der Fall ist - kann die Preise in Echtzeit ausschildern und "nach Bedarf steuern. In diese Berechnungen fließen dann auch Daten (z.B. das Wetter) ein, die nicht aus den firmeneigenen Datenbanken kommen.
Noch ausgefeilter sind die Big-Data-Analysen im elektronischen Versandhandel, weil hier der Weg zwischen Kundenwunsch und Einkauf aus wenigen Klicks statt Schritten besteht. Bei keinem E-Commerce-Unternehmen ist das Empfehlungssystem höher entwickelt als bei Amazon. Big-Data ist hier Marktforschung und Vertrieb in Echtzeit.
Mehr Quellen
Die ganz hohe Kunst des Big Data ist es, die eigenen Daten noch um die passenden aus externen offenen Quellen anzureichern, wie sie etwa die sozialen Netzwerk darstellen. 80 Prozent der Daten, die heute zur Auswertung herangezogen werden, sind nicht strukturiert erfasst - und das reicht von Texten Videos bis hin zu Postings in irgendwelchen Foren. Für moderne Datenbank- und Analysesysteme stellt das kein Problem dar, denn sie können semantisch Zusammenhänge herstellen wo vorher keine waren. IBM etwa hat seine Supercomputer "Watson, der bei Schachturnieren und Quizshows brillierte, schon so für den medizinischen Einsatz "umprogrammiert, dass er allein durch die Eingabe von bestimmten Symptomen die wahrscheinlichsten Prognosen errechnen kann. Wie das geht? Hinter Watson steht eine gigantische Datenbank, eine Art "selbstlernendes System, das medizinische Diagnosen auf Basis von historischen Befunden ziemlich treffsicher ermittelt.
Eines der Lieblingsbeispiele von Oxford-Professor Viktor Mayer-Schönberger zum Thema ist ebenfalls im Medizinbereich angesiedelt: Mit der gezielten Auswertungen der Vitalfunktionen von Frühgeborenen lassen sich drohende Infektionen exakter prognostizieren, als es selbst erfahrene Neonatologen vorhersagen konnten. In einem widerspricht der Professor den IT-Konzernen allerdings vehement: "Geschwindigkeit ist an sich noch keine Qualität von Big Data. Oft können Algorithmen bei kleinen Datenmengen gut sein, bei größeren aber komplett versagen.
Die Firma, die für Mayer-Schönberger, die Datenwirtschaft am forciertesten betreibt, ist: "Google, Google und noch einmal Google. Beginnend bei den Grippe-Prognosen und vorläufig endend bei Produkten wie dem Übersetzungsprogramm Google Translate, hinter dem eine riesige Sprachdatenbank steht, die täglich gefüttert wird. Den Suchmaschinen kommt bei Big Data eine Schlüsselrolle zu, weiß auch der Suchspezialist Daniel Fallmann: "Das Suchfeld ist die Eingangstür. Wir zapfen im Hintergrund die unterschiedlichsten Quellen an, ohne dass der Nutzer etwas von der Komplexität merkt.
Big Business
Die Big-Data-Wirtschaft ist ein prosperierender Zweig der IT-Industrie, von dem sich die Hersteller der Analysewerkzeuge und Datenbanken viel versprechen. Für Analysten ist es der Wachstumsmarkt schlechthin, er soll 2014 sogar sechsmal stärker wachsen als der gesamte IT-Markt. Die im Silicon Valley am höchsten bewerteten Start-ups sind jedenfalls genau die, die ihre Geschäftsmodelle auf diese Datenanalysen aufbauen. In der Regel brauchen die nicht einmal eine eigene Infrastruktur aufzubauen, eine zündende Idee reicht und die Rechenleistung kaufen sie sich bei Amazon oder Microsoft und zapfen die öffentlichen Datenbanken im Internet an.
Programmiert sind bei diesem Thema aber auch Kollisionen mit dem Datenschutz. Die Angst der Verbraucher, vor den Augen von Behörden und Unternehmen zu transparent zu werden, ist gestiegen. Die Balance zu halten zwischen Persönlichkeitsrechten und durchaus erwünschten Segnungendurch die Datenwirtschaft, wird eine große Herausforderung werden. Das weiß auch Big-Data-Visionär und SAP-Mitgründer Hasso Plattner: "Der Schutz der persönlichen Daten muss gewährleistet sein. Aber nicht um den Preis, dass Projekte verhindert werden, die großen Nutzen bringen.