Tempo di Lettura: 2 minuti
La Sitemap è una semplice mappa xml che elenca gerarchicamente tutte le pagine di un sito Web con lo scopo di semplificare notevolmente l’attività di scansione e indicizzazione da parte dei crawler dei motori di ricerca.
Introdotta da Google con il servizio Google Sitemaps, e poi utilizzata anche da Ask.com, Microsoft Live Search e Yahoo!, permette ai webmaster di menzionare all’interno di un file XML, e non solo, tutti gli URL delle pagine di un determinato sito Web che si desidera sottoporre al motore di ricerca. In questo modo anche i siti dinamici possono fornire URL corretti permettendo una indicizzazione più intelligente. Il protocollo è regolamentato dalla Attribution-ShareAlike Creative Commons License che ne ha reso possibile l’uso anche ad altri motori di ricerca. Per maggiori dettagli potete consultare la traduzione italiana delle specifiche del formato Sitemaps 0.90.
Per chi usa WordPress, esiste un comodo plugin, Google Sitemap Generator for WordPress, che permette di creare in maniera del tutto automatica il proprio file Sitemap XML, senza doversi preoccupare di aggiornarlo manualmente (cosa comunque ingestibile per un blog).
Uno dei piccoli problemi ancora rimasti, era però che fino a poco tempo fa occorreva sempre segnalare manualmente, ai singoli motori di ricerca, il percorso del file Sitemap.xml del proprio sito.
Ebbene da ieri, Ask.com, Google, Microsoft Live Search e Yahoo! hanno comunicato, nei loro rispettivi blog, il supporto per l’autodiscovery delle Sitemaps, ovvero la possibilità, da parte dei webmaster di specificare il percorso per la Sitemap del sito all’interno del file robots.txt.
Quindi, per segnalare a tutti e quattro i motori la presenza della sitemap, sarà sufficente inserire questa riga nel proprio file robots.txt:
Sitemap: http://www.miosito.com/sitemap.xml
Sul sito sitemaps.org è specificato anche un’altro metodo alternativo per la segnalazione, ovvero attraverso una richiesta HTTP del tipo (l’estensione .gz può essere sostituita anche da xml):
/ping?sitemap=http://www.miosito.com/sitemap.gz
che può essere lanciata sia attraverso un browser (classico link) ma anche usando wget o curl.
Per esempio, nel caso di Ask.com (che è stata l’ultima a rendere disponibile la segnalazione HTTP), basta usare la seguente URL:
http://submissions.ask.com/ping?sitemap=http://www.miosito.com/sitemap.xml
Ovviamente per tutti i motori rimane attiva la possibilità di segnalare manualmente il percorso del Sitemap, ma perché precludersi questa comoda possibilità? Quindi, cosa aspettate: aggiornate subito i vostri file robots.txt!
Attribution Image CC: ‘Is this an icon for workflow?‘
Grazie del link! 🙂