Die Tage bat mich ein Bekannter einmal das Verhalten der offiziellen Safari Browser Erweiterung vom Internet ArchiveWayback Machine 1.4 – anzuschauen. Im Besonderen interessierte ihn, wie die Extension im Toolbar Badge die Zahl der Speicherungen (Snapshots) anzeigen konnte.

Seine Frage war einfach: Wird hier wirklich jede URL, die besucht wird ans Internet Archiv gesendet?

Die klare Antwort ist: ja, genau das geschieht!

Hier seht Ihr einen Screenshot aus Charles Web Proxy. Beim Aufruf jeder Webseite ruft die Erweiterung eine URL auf, die eine Sparkline zurückgibt. In der Sparklein sieht man für jeden Monat in jedem Jahr, wie viele Snapshots es gibt und kann so die gezeigte Gesamtzahl berechnen.

Jetzt mag ich den Entwicklern beim Internet Archive auf gar keinen Fall etwas Böses unterstellen, aber ich konnte leider keine Einstellung finden, mit der man dieses Verhalten deaktivieren könnte.

Das Verhalten selbst sorgt jedoch dafür, dass ein vollständige Chronik Eures Browser-Verlaufs auf den Servern von Internet Archive landet. Ob und wie diese dort ausgewertet werden mag ich nicht zu beurteilen.

  • Im besten Fall wird die Sparkline zurückgegeben und die Anfrage nicht weiter geloggt
  • Ein mittelguter Fall wäre, dass das Internet Archive diese Informationen hernimmt, um weitere Ziele für die Archivierung zu ermitteln (z.B. häufige Webseiten, die bisher unbekannt waren)
  • Im schlechtesten Fall landen diese Daten auf Dauer in einer Logfile und es entsteht ein ziemlich gutes Bild, was Du in einer Session betrachtet hast

Das Internet Archive genießt mit Recht ein sehr hohes Ansehen. Aus diesem Grund gehe ich davon aus, dass hier mit Deinen Daten kein Schindluder getrieben wird.

Full Disclosure:

Ich selbst habe auch eine Browser-Erweiterung, die die APIs verwenden, um ganz ähnliche Funktionalitäten zu ermöglichen.

Meine Safari App Extension – Wayback – nutzt dabei einen ganz anderen Ansatz. Anstatt schon im Hintergrund Informationen zu laden, die nützlich sein könnten, wird die Erweiterung nur dann aktiv, wenn das Toolbar Icon geklickt wird. Somit dauert der Aufruf der Infos zwar gefühlt ein paar Sekunde länger (die Server vom Internet Archiv sind nicht schnell), aber Du kannst Dir sicher sein, dass meine Browser-Erweiterung nichts verrät, was Du nicht verraten willst. Obendrein bekomme ich selbst überhaupt keine Daten!

Die offizielle Erweiterung zwingt Dich auch ein Konto beim Internet Archive zu haben, damit Du eine Seite archivieren kannst. Wayback hingegen nutzt die offenen Web-Schnittstellen, und ermöglicht Dir einen Snapshot anzustossen, ohne, dass Du eingeloggt sein musst.

Während ich den Ansatz meiner Extension ganz klar bevorzuge – sonst hätte ich diese ja nicht geschrieben – mag ich auch ganz offen mit Euch sein, die Verbindung zu archive.org ist verschlüsselt und somit ist der Query-String zu mindestens nicht im Klartext sichtbar, dennoch fände ich zu mindestens eine Option wertvoll, diese Funktion zu deaktivieren!


Claus Wolf

Seit 1994 im Netz unterwegs und seit 2004 eingefleischter Mac-Nutzer.

0 Kommentare

Schreibe einen Kommentar

Avatar-Platzhalter

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.