IP Adressen in Apache Logs an­o­ny­mi­sie­ren

Im Rahmen der Datenschutz-Grundverordnung (DSGVO) macht man sich so machen Gedanken und heute habe ich mir darüber Gedanken gemacht, ob die Apache Logs vielleicht zu viele Informationen enthalten könnten. In diesem kurzen Artikel zeige ich auf, wie man das ein wenig „Anonymer“ gestalten kann.

In den üblichen Logs wird die IP Adresse geloggt, das sieht dann ungefähr so aus:
[crayon-5b798dcaeb5b0985458013/]
Im obigen Beispiel hab ich die letzten zwei Teile der IP manuell durch ein Sternchen ersetzt. Braucht man die IP eigentlich überhaupt? Ich eigentlich nicht, aber andere möchten vielleicht doch gerne wissen, wer da dem Server einer Denial of Service Attacke aussetzt.

Schon 2014 hat die Swiss Privacy Foundation ein Tool zur Verfügung gestellt, mit dem man die IP Adressen an­o­ny­mi­sie­ren kann. Das Tool heißt Anonip und kann von der Webseite heruntergeladen werden. Im Ende ist es ein Python Script, das Du auch bei GitHub finden und einsehen kannst.

Also, wie installiert man das nun?

  1. Du legst das Script auf Deinem Server ab, der Pfad bleibt dabei Dir überlassen.
  2. Du passt die Virtual-Hosts-Konfiguration an
  3. Du startest Apache neu

Wo finde ich die Virtual-Hosts Konfiguration?

In Ubuntu 16.04 LTS findest Du die Konfigurationen unter
[crayon-5b798dcaeb5ba748991148/]
Welche Änderung sind nötig?

In der Virtual-Hosts-Konfiguration findest Du meist zwei Zeilen, die wie folgt aussehen:
[crayon-5b798dcaeb5bf456496100/]
Diese willst Du ersetzen, so dass das Log durch das anonip.py-Skript geschickt werden. Das kann zum Beispiel dann so aussehen:
[crayon-5b798dcaeb5c4086020513/]
Ab sofort werden die IPs nun an­o­ny­mi­sie­rt gespeichert. In dem obigen Beispiel, indem die letzten Stellen durch eine 0 ersetzt werden, also aus dem Logeintrag ganz oben wird dann:
[crayon-5b798dcaeb5c8385452813/]
Ab wann greift die Änderung?

Die Änderung greift ab dem Moment, indem der Server neu gestartet wurde. Den Apache2 Server Restart kannst Du mit folgendem Befehl erreichen:
[crayon-5b798dcaeb5cd567755140/]
Ist das wirklich nötig?

Das ist eine ausgezeichnete Frage – ich weiß es nicht. Die Datenschutz-Grundverordnung erwähnt IP Adressen explizit als persönliche Daten und ich habe mich entschlossen auf den von mir betreuten Server das Risiko einfach nicht mehr einzugehen. Durch das „entfernen“ der letzten 3 Stellen der IP kann man das nun wirklich niemanden mehr zuordnen.

Erwähnen möchte ich jedoch, dass ich noch nie irgendwie versucht habe, aus den Logs einen Rückschluss darauf zu ziehen, wer da was gemacht hat und es kann gut sein, dass ich in Zukunft einfach das access.log ganz abschalte.

Das ErrorLog hingegen ist eine andere Sache, da mag man schauen, wer für welchen Fehler verantwortlich ist. Beim ersten großen Problem das ich zu lösen versuche, werde ich dann erfahren, ob das Anonymisieren ne wirklich gute Idee war ;)

Claus Wolf

Seit 1994 im Netz unterwegs und seit 2004 eingefleischter Mac-Nutzer. 21.5" iMac - 2.9GHz Intel Core i5, 16GB RAM, 1TB Fusion Drive HDD / 128GB iPhone 7 / 128GB iPad 9,7" (2017) / 15" MacBook Pro (Mitte 2014) in der Firma...

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

This site uses Akismet to reduce spam. Learn how your comment data is processed.