Siti web dei Comuni italiani...

search?q=&btnI=lucky


Qualche giorno fa, durante una lezione del nostro corso di Cittadinanza Digitale e Tecnocivismo (http://tecnocivismo.di.unimi.it/) ho mostrato alcuni siti web di Comuni italiani. Stavamo discorrendo della relativa standardizzazione di contenuti, aspetto e naming.

Ad un certo punto ci siamo domandati dove fossero ospitati tali siti… allora mi è venuto in mente di fare qualche analisi.

Ho ottenuto (con un po' di webscraping perché non c'è modo diretto di scaricare tutto in un colpo solo) una lista dei siti dal sito dell'ANCI e ho creato uno “scriptino” per geolocalizzare gli 8030 siti censiti.

Un primo risultato statistico è il seguente:

   7286 GeoIP Country Edition: IT, Italy
    212 GeoIP Country Edition: US, United States
    194 GeoIP Country Edition: DE, Germany
    126 GeoIP Country Edition: FR, France
     42 GeoIP Country Edition: IE, Ireland
     31 GeoIP Country Edition: GB, United Kingdom
     23 GeoIP Country Edition: IP Address not found
     19 GeoIP Country Edition: CH, Switzerland
     17 GeoIP Country Edition: NL, Netherlands
     13 GeoIP Country Edition: RO, Romania
      9 GeoIP Country Edition: CA, Canada
      5 GeoIP Country Edition: JP, Japan
      4 GeoIP Country Edition: EU, Europe
      3 GeoIP Country Edition: AT, Austria
      1 GeoIP Country Edition: SG, Singapore
      1 GeoIP Country Edition: PT, Portugal
      1 GeoIP Country Edition: DK, Denmark
      1 GeoIP Country Edition: CZ, Czech Republic

Cioè c'è una percentuale non nulla di siti ospitati, almeno secondo geoiplookup, al di fuori della UE.

A valle di alcune risposte ritornate c'è da dire che alcuni hosting usano varie cloud alcune delle quali usano CDN (Content Delivery Network) attestate fuori UE pur tenendo i dati in UE, ergo a me risultano fuori norma, ma sono falsi positivi.

Ora, dato che mi pare sia fuori norma (non sono riuscito a ritrovare l'articolo preciso, se lo conoscete segnalatemelo) per un Comune avere hosting fuori UE, ho pensato di fare un po' di mailing per segnalare la cosa ai Comuni stessi.

La ratio della norma è che dovendo trattare dati sensibili, si pensi ad esempio all'albo pretorio, è opportuno che tali dati risiedano all'interno della UE dove vigono garanzie su data retention, privacy, etc.

Ho così scritto mail a quasi 250 sindaco@… descrivendo il problema e suggerendo una “messa a norma”.

E' stato un po' deprimente vedermi tornare indietro circa metà dei messaggi con user unknown, così ho riprovato su questa metà usando info@… e stavolta gli errori sono stati veramente pochi.

Invece eclatante è il fatto che due messaggi sono tornati indietro con l'errore mailbox piena! Della serie: “non leggo la mail”…

Per fortuna devo anche dire che quasi subito ho ricevuto risposta da alcuni sindaci (elenco più sotto) con un ringraziamento per la segnalazione!

Stessa comunicazione (con lista allegata) inviata al Ministero P.A. (http://funzionepubblica.it) che mi ha risposto prendendo atto della segnalazione.

Risposte ricevute (in ordine di arrivo)

Il giorno stesso, domenica (!):

  1. Villa Lagarina
  2. Pescasseroli
  3. Binasco
  4. Malgrate
  5. Maniago

Il successivo, lunedì:

  1. Prato allo Stelvio
  2. Conca dei Marini
  3. Azzate
  4. Malnate
  5. Voghera
  6. Capranica
  7. Vadena
  8. Ronco Scrivia
  9. Filago

Da martedì in poi:

  1. Ponte San Pietro
  2. Sesto (BZ)
  3. Egna
  4. Sondrio
  5. Baveno
  6. Noceto
  7. Centola
  8. Poncarale
  9. Malles Venosta

WWW e non WWW...

Alcuni Comuni risolvono il nome del sito con “www” davanti ma non quello senza “www” (o viceversa) e molti risolvono indirizzi IP diversi con e senza “www”.

Ho pensato di fare una statistica anche su questo “problema”. Ho creato un altro “scriptino” che, per ogni Comune, compara gli IP con e senza e scarica (wget) le homepage con e senza “www” e poi ne calcola le differenze…

Qualche primo risultato, alcuni siti che risolvono diversamente lasciano il nome senza “www” con una homepage di default, ad esempio:

Uno di questi mi ha colpito particolarmente, il comune di Binasco. L'URL http://www.comune.binasco.mi.it/ risolve e indirizza sul sito web del Comune, ma l'URL senza http://comune.binasco.mi.it/ risolve e indirizza sul sito di una AZIENDA PRIVATA (immagino quella che ha realizzato il sito… no, un'altra!).


Discussion

christoph pixner, 2015/11/30 09:46
ho controllato il sito del mio comune san genesio atesino che ha lo stesso fornitore per il sito internet di prato allo stelvio e ho verficato con diversi strumenti la sua ipotesi: a me risultano residenti in irlanda...
saluti
christoph
Andrea Trentini, 2015/11/30 09:55, 2015/11/30 09:57
Infatti, può essere che geoiplookup non dia una informazione perfetta se l'indirizzo IP è stato rivenduto.
Comunque ho appena ricontrollato ( https://www.shodan.io/host/137.135.164.150 ) e a me risulta USA.
christoph pixner, 2015/11/30 10:43
salve
se prova p.e. con
https://www.iplocation.net/
https://www.ip2location.com/demo
http://www.ipinfodb.com/ip_locator.php
http://www.ipaddressguide.com/ip2location

vede che i dati stanno in irlanda. gli usa arrivano fuori con il suo tool e con altri, perché probabilmente il fornitore avrá la sede centrale negli usa - però questo non vuol dire, che i dati stanno lí.

secondo me é indispensabile utilizzare tool diversi e interpretare i risultati.

grazie
Andrea Trentini, 2015/11/30 10:51
Grazie, ho provato col primo sito e infatti fornisce un misto USA/Irlanda.
Concordo che vanno interpretati i risultati, come ho già detto la locazione non è mai perfetta, starà al responsabile IT del singolo Comune verificare la mia segnalazione :)

Cmq non mi preoccupano i falsi positivi, sono i falsi negativi quelli su cui dovremmo tentare di lavorare: quanti siti mi risultano in UE e invece non lo sono? Col mio strumento non ho modo di capirlo e, ovviamente, non ho mandato comunicazioni in merito...