Alles ist überall: Vergisst das Internet wirklich nichts?

Die häufig zu lesende These „Das Internet vergisst nichts“ gilt nur eingeschränkt. Sie mag für eine Betrachtungsdauer von wenigen Jahren und bei den "Big Playern" richtig sein, langfristig verschwinden jedoch mehr und mehr Inhalte aus dem Netz.

Ich hatte wohl Ende 1993 erstmals mit dem Internet Berührung. Über die These „Das Internet vergisst nichts“ habe ich erst vor einem Salon der Initiative I-15 unter dem Motto „Erinnern und Vergessen in Zeiten des Internet“ nachgedacht. Mehr und mehr fiel mir auf, dass die These nicht ganz richtig ist. Ob sie als politisch motivierte Äußerung oder als Warnhinweis geeignet und sinnvoll ist, soll hier nicht Gegenstand sein.

Es verschwinden Internetangebote aller Gattungen, denn auch das Internetarchiv „WayBackMachine“ speichert nur Auszüge. Mit ihnen verschwinden die Nutzerbeiträge in diesen Angeboten. Und es verschwinden Nutzerbeiträge aus anderen Gründen. In den letzten Jahren gibt es allerdings Tendenzen, die zu einem „Alles-ist-überall“-Effekt führen und so dem Verschwinden möglicherweise entgegenwirken.

Verschwindende Angebote und Inhalte

  • Es verschwinden ganze Verlagsangebote immer dann, wenn Titel eingestellt werden: Allein die Zahl der jährlich eingestellten Fachzeitschriften geht an die hundert. Da viele dieser Angebote einen Online-Ableger haben, wird dieser zumeist mit aus dem Netz genommen.
  • Nicht anders ist die Situation bei Startups, die ihren Betrieb einstellen, hier eine jüngere Liste: 13 Start-ups, die 2010 schon von uns gegangen sind
  • Auch werden Websites vieler Unternehmen abgeschaltet; wer es genau wissen will, suche doch mal nach Corporate Websites der alten Agenturen Bitlab, WWL, Concept, Kabel New Media, Popnet – es ist nichts mehr da und auch bei archive.org sind nur Fragmente. Auf diese Weise sind übrigens auch Mitarbeiterkurzprofile dieser Unternehmen verschwunden.
  • Dies gilt auch für berühmte Web-Projekte. Ein hübsches Beispiel ist der Wildpark, ein Kreativprojekt der Agentur Pixelpark. Er taucht auf der Suchmaschinenergebnisseite von Google erst auf Seite 2 auf. Und dort findet man unter Umständen eine sog. „Konserve“, die Website ist aber über die Homepage nicht mehr zugänglich, da die Browserweiche eine Positivliste ist und bei neueren Browsern versagt. Zudem hat das neue Management im Jahr 2009 einen Relaunch des Projektes durchgeführt. Ergebnis: das „berühmte alte Wildpark“ ist nur noch ein Puzzle für kenntnisreiche Archäologen. Für die Öffentlichkeit wird er durch ein neues, andersartiges Angebot ersetzt.
  • Pressemitteilungen vieler Unternehmen sind nicht mehr auffindbar. In der dynamischen Internetbranche sieht man es besonders gut: Während mein papiernes Archiv seit 1991 Pressemitteilungen aufweist, reichen Online-Archive vieler Unternehmen meistens keine zehn Jahre zurück, obwohl das Unternehmen viel länger existiert. Als Beispiel sei hier noch einmal Pixelpark angeführt: die älteste zugängliche Pressemeldung ist von 2002, das Unternehmen wurde aber schon 1991 gegründet und hat ab 1994 Pressemeldungen im Web veröffentlicht.
  • Bei Unternehmen fallen auch andere Informationen weg. So nennt Pixelpark selbst nur noch als Gründer Paulus Neef. Welche Rolle Eku Wand spielte, der heute Professor für Design ist, ergibt sich aus nur noch aus Presseartikeln der NewEconomy-Zeit und dessen Biografie auf seiner eigenen Website. Über die Gründe kann man spekulieren. Möglich ist, dass hier eine Organisation einen Gründer vergessen hat, weil die dort agierenden Menschen die Geschichte allenfalls noch vom Hörensagen kannten. Die Dokumentation von Geschichte im Internet allein hindert also das Vergessen nicht. Es bedarf Zweifel an der Richtigkeit aktueller Fundstellen und es bedarf eines bewussten daten-archäologischen Ausgrabungsprozesses.
  • Blogs, die jahrelang nicht mehr gepflegt werden, werden vom Betreiber zumeist irgendwann abgeschaltet, zum Beispiel, weil sie die Kosten der Domain nicht mehr tragen möchten.

Verschwindende Nutzerbeiträge

  • Mit allen oben genannten Angeboten verschwinden auch deren Nutzerbeiträge, insbesondere bei Blogs und Verlagsangeboten.
  • Dasselbe gilt auch für Beiträge in großen Communities, die privat betrieben und irgendwann eingestellt wurden. Ein gutes Beispiel ist wohl dotcomtod, das 2004 eingestellt wurde; zuvor gingen fast alle Beiträge verloren, aufgrund von Streitigkeiten im Kreis der Gründer. Aber auch Dutzende großer und hunderte kleiner kommerzieller Communities wurden geschlossen, etwa die GMX-Community sowie Giga, ebay, Nintendo und Bym. Aktuell wird gerade die Community nextstop vom Netz genommen, weil sie von Facebook gekauft wurde.
  • Auch Leserkommentare bei Verlagsangeboten können verschwinden: Ich habe an einem Relaunch mitgewirkt, bei dem das Projektteam beschlossen hat, sämtliche alten Leserkommentare nicht auf die neue technische Plattform zu migrieren. So verschwanden zigtausende von Leserbeiträgen aus dem Netz. Gestört hat sich übrigens niemand daran.
  • Auch Kundenbewertungen „verschwinden“ langfristig. Im eCommerce gilt das immer, soweit das Produktsortiment aktualisiert oder getauscht wird. Wer es nicht glaubt, suche bei Amazon die Kundenbewertungen zu alten Elektronikartikeln. Bei Bewertungsportalen (Qype, Yelp etc.) verschwinden Beiträge, wenn das Bezugsobjekt in der Realität „stirbt“: Wenn Luigis Ristorante schliesst, wird auch der alte Eintrag irgendwann aus dem Netz genommen, denn ungültige Einträge haben für Nutzer und Betreiber keinen Sinn mehr. Dasselbe gilt natürlich für Communities, die als selbständige Produkte eingestellt wurden, ein jüngeres Beispiel ist Triphunter, das von brands4friends übernommen wurde.
  • In dieselbe Kategorie fallen Links von URL-Shortenern, deren Dienste eingestellt wurden. Die Kürzel werden dann nicht mehr aufgelöst, der Link ist „kaputt“ und die Bedeutung des ganzen Nutzerbeitrages steht in Frage. Eines der berühmteren Beispiele ist tr.im aus dem August 2009. Es sollte nicht wundern, wenn von fast 200 URL-Shortenern weltweit  der größere Anteil in Kürze seine Dienste einstellt und somit auch deren alte Links nicht mehr aufgelöst werden.

Zwischenergebnis: Ein Leben und Sterben von Teilsystemen

Das Internet ist zwar einerseits ein großes Ganzes, andererseits ist es aber auch ein Netz von Teilsystemen, deren Inhalte aus verschiedenen Gründen entweder komplett aus dem Netz genommen werden oder welche die Datenlöschung oder -nichtveröffentlichung autonom entscheiden.

Die Gründe dafür sind bei kommerziellen Angeboten häufiger Veränderungen auf der Unternehmensebene (Übernahme des Unternehmens, Insolvenz), auf der strategischen Ebene (ein Geschäftsfeld wird eingestellt) oder auf der Produktebene (ein Produkt ist wirtschaftlich nicht erfolgreich und wird eingestellt, beschränkt fortgeführt oder geht in einem anderen auf). Auch wenn ein Online-Produkt zunächst als „Konserve“ mit geringsten Mitteln aufrechterhalten wird, stellt sich irgendwann die Frage der Betriebskosten. Auch können es Gründe der Unternehmenskommunikation sein, warum ein Produkt am Ende vom Netz genommen wird (veraltetes Corporate Design, Vergessenwollen des Fehlschlages). Bei privaten Angeboten kann es Desinteresse an der Fortführung oder schlicht die Unwilligkeit sein, die Betriebskosten weiterhin zu tragen.

Das Web ist also so vielfältig wie das Leben, das aus Geburt und Sterben besteht. In der sachlichen Sprache des Geschäftslebens formuliert: Auch Online-Produkte werden verändert, ausgetauscht oder erreichen ihr End of Live. Und, wie wir am Beispiel des unerwähnten Agenturgründers gesehen haben: Manchmal vergissen Menschen etwas, gewollt oder ungewollt, und überlagern so alte Information mit neuer, bis die alte Information technisch kaum noch zugänglich ist. Die technischen Zugangshürden könnten dabei sogar noch zunehmen, da die Komplexität der Frontendentprogrammierung in den letzten Jahren deutlich gegenüber dem „plain HTML der 90er“ zugenommen hat.

Ausblick: Alles überall

In den letzten Jahren hat sich die Situation allerdings wesentlich verändert: Mit Webservices tauschen Systeme Daten aus und replizieren diese Daten außerhalb des Herrschaftsbereiches des Urhebers in Drittsysteme. Was in einem Teilsystem nicht mehr existiert, lebt gewissermaßen an anderer Stelle weiter. So würden Tweets aus Twitter im Google-Index auch dann noch verfügbar sein, wenn Twitter sein Produkt eines Tages einstellen würde. Entsprechendes gilt für Tweets, die an Facebook übergeben werden, und im Grunde für alle Social-Media-Plattformen, beispielsweise Digg und flickr, die über APIs kommunizieren. Zusätzlich zu den produktspezifischen APIs wie bei Twitter erlauben Standards den Datenaustausch für beliebige Inhaltsobjekte, z.B. Newsfeeds oder Kommentare. Damit entsteht ein „Alles ist überall“-Effekt.

Dieser „Alles ist überall“-Effekt gilt allerdings nur so weit, wie Lizenzbestimmungen mit Endkunden die Datenweitergabe erlauben und wie die Bestimmungen zwischen den Plattform-Anbietern nicht zum Löschen von Inhalten verpflichten; so verbietet Facebook beispielsweise den Drittanbietern ausdrücklich, bei Facebook gelöschte Inhalte in den Drittsystemen weiterhin zu speichern. Ob es hierbei bleibt, ist allerdings unklar. Einerseits werden sich Anbieter immer bemühen, die Kontrolle über ihre Nutzerinhalte zu behalten, andererseits geht die Technik wie immer einen Schritt voraus und kann eine Eigendynamik entwickeln.

Derzeit gilt: Für Nutzerbeiträge auf Plattformen der Big Player und Marktführer (Microsoft, Apple, Google, Amazon, Yelp, Foursquare usw.) ist jedenfalls nicht absehbar, ob und in welcher Dekade die Inhalte aus dem Web verschwinden und wer mit wem Daten austauscht. Entsprechendes – und das wird gerne übersehen – gilt für Geheimdienste und Überwachungsbehörden wie den CIA.

Richtiger wäre also „Die großen Internet-Plattformen und staatliche Überwachungsbehörden vergessen nichts“.

Dies ist eine überarbeitete Version des Entwurfs, den Christoph Kappes in seinem „posterous“ veröffentlicht hat.