J’ajoute une petite précision pour le RGPD car goaccess affiche un tableau avec les adresses IP (“VISITOR HOSTNAMES AND IPS”). Du coup, si vous voulez être valide (ou simplement respecter la vie privée de vos visiteurs), voici quatre solutions différentes :
Recueillez le consentement des visiteurs,
N’affichez ces données que pour des rapports sur les visites de la veille (c’est une tolérance en mode “ce sont des informations techniques pour déboguer un problème d’exploitation”).
Anonymisez les données (ne gardez que les deux premiers nombres des IPv4, et les trois premiers groupes des IPv6, on avait fait un article là dessus avec des règles sed),
N’affichez pas ces informations, avec l’option --ignore-panel=HOSTS qui va enlever le panneau correspondant.
Recueillir le consentement ? Comment ? d’autant que sur mon serveur @home, je ne place aucun cookie ; là, je ne fais qu’analyser le trafic qui vient sur le serveur !
Des rapports que sur la veille : ça n’a aucun sens. Mais pourquoi pas !
Anonymiser les IP : en effet, je le dis en rapport avec l’option “–anonymize-ip”
Quant aux panels à ignorer, j’ai informé concernant le panel REMOTE_USER. HOSTS est celui qui affiche les noms d’hôtes et IP, c’est bien ça ?
Concernant ton article “anonymiser les adresses IP”, je l’ai lu aussi - et je fais partie de vos lecteurs réguliers - faut avouer que ça devient lourd, surtout quand c’est juste pour son propre petit site web. Dans les faits, c’est dommage que ce genre d’anonymisation ne soit pas directement gérable dans un formatage du log au niveau serveur web.
(mais je n’ai certainement pas du tout “étudier” cela à fond, correctement).
Quoiqu’il en soit, je retiens tes conseils avisés. Merci beaucoup.
(Va falloir s’y remettre… pfff)
Pour le consentement sur des logs d’apache/nginx… J’imagine un premier reverse proxy qui pose la question et qui, ensuite, permet l’accès aux autres vhosts… On peut imaginer placer ensuite un header ou autre et le filtrer dans les stats ensuite…). C’est super lourd, je suis complètement d’accord. Surtout que pour faire des stats, il suffit d’anonymiser pour en avoir le droit alors pourquoi s’embêter à garder les données réelles ?
J’avais du lire ton article trop vite car je n’avais pas vu tes mentions aux RGPD… (--anonymize-ip fera le job tout pareil que nos regexp), du coup, mon comentaire fait un peu hors sujet… Pour “HOSTS”, c’est bien le panneau avec les IP/nom d’hôtes. REMOTE_USER n’ajoute aucun panneau avec ma version donc je ne sais pas à quoi il sert !?
Je suis d’accord que le RGPD est lourd comparé aux enjeux de nos “petits” sites respectifs mais si ton serveur @home n’a qu’une utilisation personnelle (et pas professionnelle), tu peux t’en passer car le RGPD ne s’applique plus dans ton cas (article 2, paragraphe 2, alinéa c : “Le présent règlement ne s’applique pas [aux] personne physique dans le cadre d’une activité strictement personnelle ou domestique;”).
Merci pour les précisions, voire les retouches de ton premier commentaire.
Je vais me copier ton script d’anonymisation, et me le garder au chaud dans un coin. Mais c’est vrai, que si je me conforme au processus que tu décris, il faut copier le log une première fois, passer à la moulinette du script d’anonymisation et passer à la moulinette de goaccess (ou tout autre système de supervision).
Enfin, bon, bref, y’a plus qu’à espérer que comme c’est juste dans le contexte de homeserver, pour de la “promotion personnelle gratuite”, on ne soit pas plus inquiété que cela ! :p
Super article :-)
J’ajoute une petite précision pour le RGPD car goaccess affiche un tableau avec les adresses IP (“VISITOR HOSTNAMES AND IPS”). Du coup, si vous voulez être valide (ou simplement respecter la vie privée de vos visiteurs), voici quatre solutions différentes :
--ignore-panel=HOSTS
qui va enlever le panneau correspondant.@arsouyes: merci pour ton retour.
Recueillir le consentement ? Comment ? d’autant que sur mon serveur @home, je ne place aucun cookie ; là, je ne fais qu’analyser le trafic qui vient sur le serveur !
Des rapports que sur la veille : ça n’a aucun sens. Mais pourquoi pas !
Anonymiser les IP : en effet, je le dis en rapport avec l’option “–anonymize-ip”
Quant aux panels à ignorer, j’ai informé concernant le panel REMOTE_USER. HOSTS est celui qui affiche les noms d’hôtes et IP, c’est bien ça ?
Concernant ton article “anonymiser les adresses IP”, je l’ai lu aussi - et je fais partie de vos lecteurs réguliers - faut avouer que ça devient lourd, surtout quand c’est juste pour son propre petit site web. Dans les faits, c’est dommage que ce genre d’anonymisation ne soit pas directement gérable dans un formatage du log au niveau serveur web. (mais je n’ai certainement pas du tout “étudier” cela à fond, correctement).
Quoiqu’il en soit, je retiens tes conseils avisés. Merci beaucoup.
(Va falloir s’y remettre… pfff)
Salut @PengouinPdt,
Pour le consentement sur des logs d’apache/nginx… J’imagine un premier reverse proxy qui pose la question et qui, ensuite, permet l’accès aux autres vhosts… On peut imaginer placer ensuite un header ou autre et le filtrer dans les stats ensuite…). C’est super lourd, je suis complètement d’accord. Surtout que pour faire des stats, il suffit d’anonymiser pour en avoir le droit alors pourquoi s’embêter à garder les données réelles ?
J’avais du lire ton article trop vite car je n’avais pas vu tes mentions aux RGPD… (
--anonymize-ip
fera le job tout pareil que nos regexp), du coup, mon comentaire fait un peu hors sujet… Pour “HOSTS”, c’est bien le panneau avec les IP/nom d’hôtes. REMOTE_USER n’ajoute aucun panneau avec ma version donc je ne sais pas à quoi il sert !?Je suis d’accord que le RGPD est lourd comparé aux enjeux de nos “petits” sites respectifs mais si ton serveur @home n’a qu’une utilisation personnelle (et pas professionnelle), tu peux t’en passer car le RGPD ne s’applique plus dans ton cas (article 2, paragraphe 2, alinéa c : “Le présent règlement ne s’applique pas [aux] personne physique dans le cadre d’une activité strictement personnelle ou domestique;”).
Au plaisir de se recroiser :-)
Merci pour les précisions, voire les retouches de ton premier commentaire.
Je vais me copier ton script d’anonymisation, et me le garder au chaud dans un coin. Mais c’est vrai, que si je me conforme au processus que tu décris, il faut copier le log une première fois, passer à la moulinette du script d’anonymisation et passer à la moulinette de goaccess (ou tout autre système de supervision).
Enfin, bon, bref, y’a plus qu’à espérer que comme c’est juste dans le contexte de homeserver, pour de la “promotion personnelle gratuite”, on ne soit pas plus inquiété que cela ! :p
Au plaisir partagé :D