Ad ogni Presidente il suo robots

Sorprendente come il robots.txt di Whitehouse.gov sia cambiato appena un minuto dopo il giuramento di Obama.
Durante l’era Bush il file robots.txt della Casa Bianca, ovvero l’indicazione tecnica da dare ai motori di ricerca, per evitare di indicizzare particolari file e cartelle di un sito web, era un file molto complesso che includeva per esempio le seguenti directory:
Disallow: /911/response/text
Disallow: /climatechangefactsheet/text
Disallow: /firstlady/photos/text
Disallow: /g8/print/text
Disallow: /g8/text
Disallow: /government/card/text
Disallow: /government/fbci/FBCI-summit/text
Disallow: /government/fbci/guidance/text
Disallow: /government/fbci/text
Disallow: /government/handbook/text
Disallow: /government/images/text
Disallow: /government/photoessay/intern/text
Disallow: /government/print/text
Disallow: /government/test/text
Disallow: /government/text
Disallow: /september11/text
Disallow: /september11/video/text
In contemporanea alla cerimonia di insediamento di Obama ha fatto la sua comparsa sul sito Web un robots.txt molto semplificato che escludeva dal crawling dei motori una sola cartella tecnica di gestione:
User-agent: *
Disallow: /includes/

Una metafora delle differenti politiche di immagine fra ex e nuovo presidente Usa. Ed una conferma di come l’establishment politico dia sempre più importanza al funzionamento dei motori di ricerca.

[Fonte: Scacco al Web]

Chiudi il menu