Piwik (http://de.piwik.org) ist ein in PHP programmiertes Open-Source Web-Analyse-Tool. Es ist eine Alternative zu Google Analytics und soweit ich das Beurteilen kann bietet es sogar eine ganze Ecke mehr Funktionalitäten und Möglichkeiten als der Analytics Dienst von “Big G”.
Ein weiterer sehr großer Vorteil von Piwik für den deutschen Markt ist, dass es laut dem ULD (Unabhängigen Landeszentrum für Datenschutz Schleswig-Holstein) in Deutschland sogar Datenschutzkonform betrieben werden kann.
Aber Vorsicht, “out of the box” genügt es nicht den Anforderungen in Deutschland! Zu diesem Zweck hat das ULD in einem PDF eine entsprechende Anleitung zur Verfügung gestellt, auf deren Basis ich folgende Punkte identifiziert habe die notwendig sind nach der Installation. Die Anleitung basiert auf Version 1.6 von Piwik und erhebt keinen Anspruch auf Vollständigkeit. Es sollte natürlich vor dem eigenen produktiven Einsatz nochmals geprüft werden ob auch alles beachtet wurde.
- Nach der Installation auf dem eigenen Server(Wichtig, da ansonsten die Daten ja an Dritte weiter gegeben werden würden!) in Piwik einloggen und in die Einstellungen (oben rechts) wechseln.
- Auf den Reiter “Privatsphäre” wechseln.
- Unter dem ersten Punkt “Anonymisiere die IP-Adresse von Besuchern” den Wert “Ja” auswählen und die Option “2 byte(s)- z.B. 192.168.xxx.xxx” zum maskieren der IP wählen.
- Die Option “Alte Besucher-Logs aus der Datenbank entfernen” war anscheinend zum Zeitpunkt der Evaluierung von Piwik durch das ULD noch nicht vorhanden, daher gibt es hier keine genauen Vorgaben wie diese Option eingestellt werden sollte. Das ULD schreibt nur allgemein, dass man in regelmäßigen Abständen alte Daten löschen sollte. Die Standard Einstellung in Piwik ist 180 Tage. Ich habe dies in meinem Fall auf 90 Tage gestellt, da eine längere Aufbewahrung für mich nicht relevant ist. Es geht hier auch nicht um die Statistiken, sondern nur die “Rohdaten” auf deren Basis die Statistiken berechnet wurden! Zu den Rohdaten gehören aber auch die detaillierten Informationen zu einem einzelnen Besucher (welche Seiten, in welcher Reihenfolge, etc… aufgerufen wurden).
- Eine Anlassbezogene Löschung muss natürlich manuell vorgenommen werden wenn ein Anwender seine Personenbezogenen Daten gelöscht haben will! (Wenn hier alles beachtet wird, dann gibt es diese Daten ja auch gar nicht mehr!)
- Um Sicher zu stellen, dass bei automatischer Löschung der Rohdaten keine Statistiken verloren gehen, sollten mittels crontab die Generierung automatisch angestoßen werden. Dazu unter “Allgemeine Einstellungen” die mittels Browser ausgelöste Archivierung deaktivieren und anschließend die Anleitung bei Piwik zur Einrichtung der crontab(Englisch) durchführen!
- Die dritte Option auf der Datenschutz Seite “Piwik-Deaktivierung für Ihre Besucher” ist ebenfalls wichtig für den Datenschutzkonformen Betrieb einer Seite. Hier muss gut erreichbar durch den Benutzer die Möglichkeit geboten werden, die Erfassung der eigenen Daten durch Piwik zu verhindern. Das ULD hätte gerne eine dauerhafte Einbindung der Widerspruchsmöglichkeit in der Datenschutzerklärung der Seite, sowie zumindest beim ersten Besuch eine “prominente Hervorhebung”. Der Code, den wir auf unserer Seite einbetten müssen, wird uns hier angeboten. Wie genau Ihr diesen einbettet, kommt auf die Seite darauf an. Mindestens aber in der obligatorischen Datenschutzerklärung sollte der IFrame eingebettet werden.
- Danach auf den Reiter “Plugins” wechseln.
- Es ist zu prüfen, ob man den Ursprung der Webseiten Benutzer unbedingt für seine Zwecke benötigt. Gibt es keinen wichtigen Grund dafür, sollte man das Plugin mit dem Namen “Referers” deaktivieren. Laut ULD ist hier die Gefahr zu groß, dass unerlaubte Nutzerprofile erstellt werden mit Hilfe dieser Information. Es ist also nur zulässig diese Daten zu erheben: “… wenn die verantwortliche Stelle zweifelsfrei nachweist, dass die Erstellung der Profile für Werbung, Marktforschung oder die bedarfsgerechte Gestaltung des Dienstes tatsächlich erforderlich ist…” (Quelle: Hinweise und Empfehlungen zur Analyse von Internet-Angeboten mit “Piwik” [PDF], Seite 11, ULD, 15.03.2011). Im Zweifel also lieber abschalten wenn man Konform mit diesen Richtlinien sein möchte.
- Für die nächste Einstellung müssen wir die Datei “%%piwik_path%%/config/config.ini.php” bearbeiten. Im Abschnitt “[Tracker]” muss die Zeile “cookie_expire = 63072000” bearbeitet werden. Die Zeile gibt die Lebensdauer eines durch die Piwik-Installation Gesetzten Cookies an. Diese sollte laut ULD so kurz wie Möglich, maximal jedoch 1 Woche sein. Der Wert wird in Sekunden angegeben. Für 2 Stunden also zum Beispiel den Wert 7200 oder für 1 Woche den Wert 604800, eintragen (eine Stunde hat 3600 Sekunden, ein Tag 86400 Sekunden). Sollte die Zeile, oder sogar der komplette Abschnitt, fehlen, beides einfach hinzufügen.
- Abschließend gilt, dass man die von Piwik erhobenen Daten isoliert halten muss. Das bedeutet, das ein Zusammenführung mit Informationen aus anderen Datenbanken nicht zulässig ist. Sollte eine Trennung technisch nicht zweifelsfrei sichergestellt sein, dann muss eine entsprechende organisatorische Regelung geschaffen werden.
Wenn jemandem noch etwas auffällt, dann freue ich mich über einen Kommentar mit Verbesserungsvorschlägen oder Fehlerhinweisen! Ich kann, wie bereits gesagt, auch nicht dafür garantieren, dass ich alle Anforderungen aus dem PDF erfasst habe. Es ist sowieso keine schlechte Idee das PDF selber mal gelesen zu haben um auch die jeweiligen Begründungen, für die hier relativ kurz beschriebenen Einstellungen, zu verstehen. Außerdem könnte es sein, das in einer zukünftigen Bewertung durch einen Datenschutzbeauftragten weitere Anforderungen an eine Piwik-Installation kommen.