Die Meinung am Freitag, 24.08.2018, von Heidi Tilliger

Ich meine, dass "Daten für alle" gefährlicher Quatsch ist.

23.08.18 –

Ich meine, dass "Daten für alle" gefährlicher Quatsch ist.

Dank Andrea Nahles haben wir mal wieder eine Diskussion, die in die falsche Richtung führt. Da propagieren Lobbyisten, Deutschland würde in der Digitalisierung abgehängt, weil wir nicht auch so schamlos und grenzenlos Daten sammeln können wie Google und co. Weil KI (Künstliche Intelligenz) ja nur mit gigantischen Datenbergen möglich sei. Beide Klischees sind falsch.

Mit nur 200 Datensätzen wurde ein System angelernt, dass Herzinfarkte erkennt. In Deutschland.
https://www.heise.de/newsticker/meldung/Neuronales-Netz-erkennt-Herzinfarkte-so-gut-wie-erfahrene-Kardiologen-4107042.html

Und eine deutsche Übersetzungs-Software liefert bessere Übersetzungen als Google:
https://www.heise.de/newsticker/meldung/DeepL-Pro-Neuer-Aboservice-fuer-Profi-Uebersetzer-Firmen-und-Entwickler-3998601.html

Natürlich hatte die KI durch Mustererkennung einen immensen Schub dadurch, dass Google riesige Datenberge hatte und sich gefragt hat, wie man daraus Geld machen kann. Und dann dank KI daraus auch einen Haufen Geld gemacht hat. Aber zum einen hat Google die Methoden, die sie daraus entwickelt haben, mit der Welt geteilt. Das kann heute also jeder nachmachen. Zum anderen gilt nicht der Schluss, dass KI aus Datenbergen folgt oder Datenberge für KI erforderlich sind.

Wir haben erlebt, was passiert, wenn man genau das versucht, also eine Mustererkennung quasi sich selbst überlässt und auf Datenberge loslässt. Ich nenne das "KI für Faule". Microsofts Chatbot mutierte zum Nazi und Googles Bilderkennung klassifizierte schwarze Männer als Gorillas.

In der Tat ist Google heute ein Musterschüler in Sachen autonomes Fahren. Das liegt aber nicht daran, dass sie wissen, dass wir gerade nach Hamörrhoidensalbe gegoogelt haben, sondern daran, dass sie sehr viel Wert auf Programmierqualität legen, daran nicht sparen und dafür nur die Besten der Besten einstellen. Und dass sie genug Geld unterm Kopfkissen hatten, sehr früh in das Thema einsteigen zu können, ohne Aussicht auf Rendite.

Könnten wir Krebs heilen, wenn wir nur alles über jeden wüssten? Schlafgewohnheiten, Essgewohnheiten, Stress, Kontakt mit Giftstoffen uvm. Würden wir heute eine KI mit allen Details über jeden Menschen auf der Welt füttern, würde die KI vermutlich sehr viele Gemeinsamkeiten bei Krebserkrankten erkennen. Gesetz der großen Zahlen. Aber wir wären sehr schlecht darin zu erkennen, was davon Zufall ist (das Allermeiste) und was nicht. Vielleicht würde es uns sogar gar nicht gelingen, die echten Kausalitäten nachzuweisen. Und wir müssten sehr viel Zeit und Energie aufwenden, diesen Heuhaufen aufzubauen und falschen Theorien nachzujagen, die dann an anderen Stellen fehlt.
KI ist nur dann nützlich, wenn sie klug und gezielt aufgebaut wird.

Darüber zu diskutieren, ob und wenn ja warum wir an welchen Stellen in Deutschland in der Digitalisierung wirklich abgehängt sind, würde diese Meinung am Freitag deutlich sprengen. Natürlich bin ich der Meinung, dass die Dominanz der GAFA (Google, Amazon, Facebook, Apple) ein Problem ist. Das Problem ist ja so groß, dass man es gar nicht nicht sehen kann. Aber es sind nicht die gesammelten Daten, die diese Dominanz festigen. Es liegt mittlerweile m.E. alleine in der Quasi-Monopolstellung und der schieren Größe dieser Unternehmen, mit der sie jeden Konkurrenten aus dem Markt nehmen können. Apple alleine hat Bargeldreserven von 270 Milliarden US Dollar.

Diese widerliche Datenbasis von Google, die intimste Details über fast jeden von uns enthält, in die Welt hinauszublasen, wird an den Marktverhältnissen überhaupt nichts ändern. Niemand wird plötzlich Google Paroli bieten können, nur weil er die Datenbasis von Google bekommt. Und es wird unsere Lebensqualität nicht verbessern, sondern verschlechtern.

Big Data ist der Atommüll von morgen, wir sollten uns viel eher endlich differenziert damit auseinandersetzen, wer welche Daten zu welchem Zweck sammeln dürfen sollte und wer nicht. Seinen Finger kann man nicht austauschen, wenn der Fingerabdruck erst einmal kompromittiert ist. Das ist bereits heute ein reales Problem, wie kürzlich in der Story im Ersten auch großartig berichtet wurde: https://www.tagesschau.de/wirtschaft/biometrische-daten-105.html

Und auch Informationen über sexuelle Orientierung, religiöse Ansichten, Krankheiten kann man nicht mehr ungeschehen machen, wenn sie erst einmal in die Welt hinaus posaunt wurden. In manchen Ländern ist die Kompromittierung dieser Informationen lebensgefährlich.

Absolut jeder Server ist angreifbar und Anonymisierung in der Regel überwindbar. Bei sehr großen Datenmengen zu unserer Person ist eine Anonymisierung gar nicht mehr möglich, weil jeder schlichtweg durch die Menge der Informationen ganz eindeutig identifizierbar ist.

Ich bin nicht digitalisierungsfeindlich, ich liebe meinen Job als Informatikerin. Ich bin stupidity-feindlich. Ich will kluge maßgeschneiderte Lösungen, keine hilflos pauschal-populistischen. Die Mär vom "Daten sind das neue Gold" führt dazu, das viele Firmen auf Verdacht viele Daten sammeln, die sie gar nicht benötigen, schon mal prophylaktisch. Da wird nicht nachgedacht. Es wird auch nicht nachgedacht, welche dieser Daten man denn wirklich ans Internet hängen muss. Und wenn man bedenkt, dass Google, Facebook und Amazon unsere intimsten Details nur deshalb anhorten, weil sie daraus personalisierte Werbung generieren wollen, die sie verkaufen, mag ich vor Verzweiflung in die Tischkante beißen. Personalisierte Werbung ist das peinlichste Unnütz-Vermächtnis unserer Generation.

Was meines Erachtens ein wirklich guter Anfang für eine Lösung wäre, ist eine Verpflichtung zur Interoperabilität (Ich habe das erste Mal bei Jan Philipp Albrecht davon gehört). Wenn ich, die ich Signal benutze, mit Dir bei Whatsapp chatten könnte, wäre die Monopol-Macht entkräftet, die heute nur daraus entsteht, dass man dahin gehen muss, wo alle sind. Das Gleiche gilt für Facebook oder Twitter. Auch die App-Stores gehören geöffnet.

Jeder von Euch kann gleich jetzt relativ einfach auch im Kleinen dazu beitragen, das Monopol-Monster Google weniger zu füttern, in dem Ihr nicht die Google-Mail-Adresse benutzt, nur weil sie eh da ist. Zumindest bis zur Einführung der DSGVO hat Google alle Eure Mails "gelesen" und ausgewertet und ihre Inhalte Drittfirmen überlassen, natürlich für Werbezwecke. Und es nicht sicher, ob Google das wirklich abgestellt hat. Alle deutschen Anbieter sind eine bessere Alternative, wirklich empfehlenswert ist posteo.de

Möge Eure Privatsphäre mit Euch sein

PS: There is no cloud - just other people's computers